LLM和ML算法在灾害相关社交媒体内容中的利用 | MDPI GeoHazards
MDPI环境与地球科学
2026-05-04 10:00
文章摘要
本文旨在探讨如何利用大语言模型和机器学习算法自动化处理与标注灾害相关的社交媒体内容。研究背景是气候变化导致自然灾害频发,社交媒体成为灾害管理的重要信息来源,但其海量非结构化数据给应急响应带来挑战。研究目的为通过LLM和聚类技术自动构建和标注灾害相关社交媒体内容,以提高分析效率。研究团队收集了2012年1月至2022年12月数百万条推文,使用GPT-4o-mini模型进行六维度分类,包括灾害类型、严重程度、信息性、影响类型、地理位置和情感。实验结果发现,LLM在情感和地理位置分类上表现优异,准确率分别达0.8561和0.8360,但在复杂分类任务上准确率较低。对288,926条样本的分析显示,疫情相关推文占主导地位(45.74%)。研究结论证实LLM能有效提取结构化信息,提升灾害管理的态势感知和资源分配能力,未来方向包括微调模型、探索多模态数据处理等。
本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者速来电或来函联系。