PDF(4338 KB)
从人类偏好到自主对齐: 大语言模型对齐方法综述
窦士涵, 张明, 黄萱菁, 柳世纯, 沈钰炯, 张家政, 黄宸颢, 陈佳逸, 郑惠元, 周玮康, 桂韬, 张奇
PDF(4338 KB)
PDF(4338 KB)
从人类偏好到自主对齐: 大语言模型对齐方法综述
From Human Preference to Autonomous Alignment: A Survey of Large Language Model Alignment
| {{custom_ref.label}} |
{{custom_citation.content}}
{{custom_citation.annotation}}
|
/
| 〈 |
|
〉 |