Nat Biomed Eng | 当大语言模型“看懂”超声,香港浸会大学研究团队首次实现视觉语言模型提供实时、精准的胎儿超声解读辅助
iNature
2026-01-16 16:08
文章摘要
背景:徒手胎儿超声检查高度依赖操作者技能,新老操作者之间存在显著技能差距,且培养一名熟练的超声医师耗时较长。研究目的:为缩小这一差距,香港浸会大学研究团队开发了名为Sonomate的视觉接地语言模型,旨在作为实时数字助理,在扫描过程中提供解剖检测、问题回答和即时反馈等交互式指导。结论:Sonomate是首个集成视频-文本对齐的医学成像语言模型,通过粗粒度与细粒度联合对准策略,能有效理解胎儿超声视频,在解剖结构检测和视觉问答中表现良好,为人工智能辅助超声训练和诊断提供了新路径。
本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者速来电或来函联系。