AAAI'26 Oral：小样本对齐人类认知，LLM不再模仿答案

数据派THU 2026-02-04 17:00

文章摘要

本文介绍了一项名为GEM的研究，旨在解决大语言模型与人类偏好对齐时面临的数据效率低下问题，特别是在医疗等专业领域。传统方法依赖海量人工标注，而GEM框架从认知科学出发，利用人类偏好背后隐含的多维认知评估过程，通过熵引导的认知过滤模块提取高质量推理链，再经SEGA模块将熵评分转化为隐式奖励，形成闭环优化。实验表明，GEM在仅使用约十分之一数据的情况下，在通用和医学偏好基准上均超越传统方法，并能提升下游任务的推理质量、减少幻觉。该框架为低资源条件下的AI对齐提供了新思路，有潜力广泛应用于各类依赖少量标注的深度学习任务。

阅读全文

本站注明稿件来源为其他媒体的文/图等稿件均为转载稿，本站转载出于非商业性的教育和科研之目的，并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题，请作者速来电或来函联系。

最新文章

Nature重磅：图灵预言的AGI早已实现，人类却不敢承认！

来源：新智元本文约3500字，建议阅读10分钟Nature重磅评论文章！UCSD研究团队宣称：AGI早已到来，大语言模型如GPT已展现广域人类级智能。人类是否已经实现了通用人工智能（AGI），却浑然不

12小时前

中国通信学会开源技术专委会2025年度全体委员工作会在京召开

2026年2月1日，中国通信学会开源技术专业委员会（以下简称“专委会”）2025年度全体委员工作会议在清华大学成功召开。中国通信学会副理事长兼秘书长张延川出席会议并致辞，专委会主任委员、清华大学软件学

12小时前

跳出窗口内卷 Sakana AI 给大模型长文本找了新解法

本文约3000字，建议阅读5分钟本文介绍了 Sakana AI 三项研究重构大模型长序列处理，突破长文本理解瓶颈。后 Transformer 时代，从“丢掉位置编码”到“外挂大脑”，Sakana AI

2026-02-04

AAAI'26 Oral：小样本对齐人类认知，LLM不再模仿答案

来源：新智元本文约3000字，建议阅读5分钟GEM框架利用认知科学原理，从少量人类偏好中提取多维认知评估，让AI在极少标注下精准理解人类思维，提高了数据效率，在医疗等专业领域表现优异，为AI与人类偏好

2026-02-04