城市环境研究所在公众环保投诉大数据挖掘方面取得研究进展
发布时间:2021-07-16来源:数字中心
随着我国城市化水平不断提高,居民对生活品质诉求日益增强,公众环境意识显著提升,环境保护投诉的数量也随之增加,2019年全国“12369环保举报联网管理平台”共接到公众举报53万余件。区别于自上而下的传统环境监测网络,环保投诉直接来自于公众,具备快速直接反应城市环境问题、包含丰富的环境信息等特点。目前对于网络投诉这类非结构化的文本数据多是人工处理,效率较低,缺乏快速和自动化的分析流程,且未能对文本内容进行深入挖掘。本研究采用文本挖掘方法建立了环保投诉中文文本分析框架,并以广州市2年的环保投诉数据为例,提取了6类环保投诉的关键词、情感特征和环保投诉的语义网络。
研究发现:(1)关键词能够有效揭示不同类型环保投诉的主题,为环保管理部门开展环保投诉管理提供了准确的切入点。(2)投诉情感中光污染投诉(中位数-0.19)和电磁辐射投诉(中位数-0.10)较其他投诉类型最为消极;而电磁辐射投诉情感差异最大(标准差0.30),这可能与公众的认知有关。(3)语义网络分析(图1)表明,污染源和污染受体的关系最受公众关注,同时污染受体和污染行为、污染受体和感官特征等关系也引起了公众的重视;此外,公众对环境问题的利益相关者了解有限,在污染源、利益相关者和投诉个体三者中,利益相关者的占比最低。因此,政府在解决环保投诉问题不能仅仅关注污染源本身,污染行为和污染的感官特征也应引起重视,同时应加强对公众相关污染知识的科普和投诉的引导,促进投诉问题的高效解决。
该研究不仅为中文环保投诉文本的分析提供了一种技术方法,也为公众投诉大数据分析系统的建立提供了参考。相关研究成果以Can Urban Environmental Problems Be Accurately Identified? A Complaint Text Mining Method.为题发表于APPLIED SCIENCES, 焦亚冉硕士生为第一作者,李春明副研究员为通讯作者,研究得到中国科学院战略性先导科技专项(A类)(XDA23030401)和中国科学院青年创新促进会项目(2017351)的资助。
图1 环保投诉语义网络
附件下载: