必须得让AI明白,有些不该碰的东西别碰(doge)
数据派THU
2026-01-04 17:00
文章摘要
背景:近期,以DeepEyes、Thymes为代表的类o3模型通过调用视觉工具,在视觉推理任务中取得优异表现,但研究发现模型存在“盲目用工具”问题,即任务不需要时也条件反射式调用工具,导致推理路径变长、算力消耗增加,准确率却未提升甚至下降。研究目的:针对模型未学会判断“何时值得用工具”的核心问题,研究团队提出AdaTooler-V模型,旨在让模型具备自适应工具使用能力,学会判断“该不该用工具”。结论:AdaTooler-V在12个主流图像和视频推理基准上展现显著优势,例如在高分辨率视觉推理任务V上准确率达89.8%;通过引入Tool Benefit Score指标和AT-GRPO强化学习算法,模型能自主学习有利且泛化能力强的推理策略,在提升性能的同时降低推理成本。
本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者速来电或来函联系。