大数据环境下清华大学新媒体舆情分析模型的探索与实践

学校简介

清华大学(Tsinghua University),简称“清华”,是中华人民共和国教育部直属的全国重点大学,[1] 位列国家“双一流”A类、“985工程”、“211工程”,入选“2011计划”、“珠峰计划”、“强基计划”、“111计划”,为九校联盟(C9)、松联盟、中国大学校长联谊会、亚洲大学联盟、环太平洋大学联盟、清华—剑桥—MIT低碳大学联盟成员、中国高层次人才培养和科学技术研究的基地,被誉为“红色工程师的摇篮”。[1-3] 学校前身清华学堂始建于1911年,校名“清华”源于校址“清华园”地名,是清政府设立的留美预备学校,其建校的资金源于1908年美国退还的部分庚子赔款。1912年更名为清华学校。1928年更名为国立清华大学。1937年抗日战争全面爆发后南迁长沙,与国立北京大学、私立南开大学组建国立长沙临时大学,1938年迁至昆明改名为国立西南联合大学。1946年迁回清华园。1949年中华人民共和国成立,清华大学进入新的发展阶段。1952年全国高等学校院系调整后成为多科性工业大学。1978年以来逐步恢复和发展为综合性的研究型大学。[4] 截至2020年8月,清华大学校园面积442.12公顷,建筑面积281.70万平方米;设有21个学院、59教学系,开设有82个本科专业;有博士后科研流动站50个,一级学科国家重点学科22个,一级学科博士、硕士学位授权点60个;有教职工15190人,在校生53302人。[5]


高校舆情必要性

大学生在网络上发表不当言论归根结底是大学生思想政治教育问题,学生正处于价值观培养的关键时期,道德应该是学生具备的最基础的素质。尊重他人是道德里的核心观念之一。针对大学生进行思想政治教育时要以问题为导向,要坚持立德树人,把培育和践行社会主义核心价值观融入教书育人全过程。


问题及建议

1.信息收集不全面。在大数据产业内,大部分研究者利用网络爬虫获取信息,但也由此衍生了因私人信息泄露引发的网络安全恐慌。为尊重其他官方平台的劳动成果和保证学生个人信息的安全性,本系统目前仅掌握共青团系统的网络数据。因此,为提高数据采集过程的便利化和数据收集的全面性,本研究计划联合学校学生大数据中心开展工作,从学校层面加强与各部门、各学院的沟通合作,尽可能多地获取校、院两级官方平台管理部门和自媒体人的官方授权,合法取用后方数据。

2.数据分析不精准。现有的算法不可能完全识别文本含义,尤其面对词汇的变形使用,如在敏感词语中间加入空格或使用拼音代替文字等方法来逃避捕捉,导致关键词提取的精准率降低。因此,研究须不断改进大数据技术,并使用多种类别的关键词提取算法,如基于分离模型的中文关键词提取算法和基于高维聚类技术的中文关键词提取算法等,提高文本分析精准率。此外,由于网络语言更新速度快,研究还应及时更新关键词库,输入网络流行新用语,把握网络表达新形式,提高语义分析精准率。

3.反馈机制不健全。现有的舆情处理方式往往存在主动性不足、协调力不够、责任落实不到位等问题。因此,应建立科学、高效的预警反馈机制,做好舆情决策。要设立舆情监管员,主要负责日常推送,稳定开展网络宣传,并对高校舆情进行实时监控,即时掌握网络舆情动态。当网络舆情热点事件出现时,舆情管理员需要结合分析报告,掌握舆论热点,研判舆情类别和等级,及时上报相关信息辅助决策,把责任落实到人。再由责任部门、舆情专家结合实际提出处置意见,启动应急工作预案,第一时间发表权威消息和官方报道,还原事件真相,赢取学生信任,掌握网络话语权,完成决策。



高校网络舆情监测方案

乐思网络舆情监测系统除舆情预警外,还可以进行舆情分析,舆情分析能够辅助提升新媒体宣传效力。通过统计官方话题的网络媒体报道量、学生转发量、评论量、关注量、传播情况、用户形态特征等数据,计算热度评估指数,形成对官方推送热度与受欢迎程度的科学评价,有助于宣传工作者更好地把握大学生行为特征和兴趣方向,为找准工作切入点提供可靠的数据支持。