CVPR 2025 | Mamba与局部注意力首次碰撞,SegMAN刷新语义分割SOTA
PaperWeekly
2026-01-07 14:04
文章摘要
背景:语义分割是计算机视觉的核心任务,在自动驾驶、医学影像分析等领域有广泛应用,但面临全局上下文建模、局部细节编码和多尺度特征提取三大挑战。研究目的:香港大学研究团队提出SegMAN框架,旨在通过融合动态状态空间模型(Mamba)与局部自注意力机制,解决现有方法在全局建模与局部细节平衡上的不足。方法包括创新的编码器(SegMAN Encoder)融合Mamba与局部注意力,以及解码器(SegMAN Decoder)基于Mamba的多尺度信息增强模块。结论:SegMAN在ImageNet-1K图像分类和ADE20K、Cityscapes、COCO-Stuff-164k等语义分割基准测试中表现出卓越性能,实现了更高的准确率和计算效率,为实时高精度语义分割提供了新路径。
本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者速来电或来函联系。