首页 > 计算机科学

AAAI 2026 | 告别Attention!北大清华首创波动方程建模,视觉速度精度双超越

PaperWeekly 2026-01-27 14:02
文章摘要
本文背景是视觉模型中全局交互(如注意力机制)计算复杂度高,且现有方法(如基于热方程)易导致高频细节丢失。研究目的是提出一种基于波动方程的新建模范式WaveFormer,旨在实现高效的全局交互并同时保留高频细节。结论表明,WaveFormer在ImageNet分类、COCO检测/分割和ADE20K语义分割等任务上,在精度与效率上均优于现有方法,证明了物理启发的波动方程建模的有效性。
AAAI 2026 | 告别Attention!北大清华首创波动方程建模,视觉速度精度双超越
本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者速来电或来函联系。
最新文章
告别CLIP!DeepSeek-OCR-2开源:首创视觉因果流,用LLM重构视觉编码
告别CLIP!DeepSeek-OCR-2开源:首创视觉因果流,用LLM重构视觉编码
仅用几百 Token 读懂复杂文档?DeepSeek-OCR-2 发布:让视觉编码像人眼一样。在多模态大模型的竞赛中,文档解析始终是一个关键瓶颈。无论是早期的 CNN+RNN,还是目前主流的 ViT-
11小时前
AAAI 2026 | 告别Attention!北大清华首创波动方程建模,视觉速度精度双超越
AAAI 2026 | 告别Attention!北大清华首创波动方程建模,视觉速度精度双超越
“全局交互”几乎等同于 self-attention:每个 token 都能和所有 token 对话,效果强,但代价也直观 —— 复杂度随 token 数平方增长,分辨率一高就吃不消。现有方法大多从
11小时前
GitHub热榜Top 3!UltraRAG 3.0开源:拒绝盲盒,让推理逻辑像素级可视
GitHub热榜Top 3!UltraRAG 3.0开源:拒绝盲盒,让推理逻辑像素级可视
“验证算法原型只需一周,构建可用系统却耗时数月。” 这句看似调侃的“吐槽”,却是每一位算法工程师不得不面对的真实困境。近期,清华大学 THUNLP 实验室、东北大学 NEUIR 实验室、OpenBMB
2026-01-26
AAAI 2026 | 把时间序列画成图?VLM4TS用视觉语言模型破解时序检测难题
AAAI 2026 | 把时间序列画成图?VLM4TS用视觉语言模型破解时序检测难题
通过快速视觉筛查与选择性多模态推理,实现高精度定位、低计算开销、零样本时间序列异常检测。\u00A9PaperWeekly 原创 · 作者 | 何泽林单位 | 宾夕法尼亚州立大学研究方向 | 多模态大模型论文标
2026-01-26
Book学术官方微信
Book学术文献互助
Book学术文献互助群
群 号:604180095
Book学术
文献互助 智能选刊 最新文献 互助须知 联系我们:info@booksci.cn
Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。
Copyright © 2023 Book学术 All rights reserved.
ghs 京公网安备 11010802042870号 京ICP备2023020795号-1