大数据环境下上海交通大学新媒体舆情分析模型的探索与实践

学校简介

上海交通大学(Shanghai Jiao Tong University)简称“上海交大” [1] ,是教育部直属并与上海市共建、中央直管全国重点大学,位列“世界一流大学建设高校(A类)”、“985工程”、“211工程”,为九校联盟、中国大学校长联谊会、Universitas 21、环太平洋大学联盟、21世纪学术联盟、国际应用科技开发协作网、新工科教育国际联盟成员,入选“珠峰计划”、“强基计划”、“111计划”、“2011计划”、卓越医生教育培养计划、卓越法律人才教育培养计划、卓越工程师教育培养计划、卓越农林人才教育培养计划、国家建设高水平大学公派研究生项目、中国政府奖学金来华留学生接收院校、学位授权自主审核单位。 [2-6] 学校创建于1896年,原名南洋公学,1911年更名为南洋大学堂,1929年更名为国立交通大学,1949年更名为交通大学;1957年经历西迁与分设,分为交通大学上海部分和西安部分;1959年,交通大学上海部分启用“上海交通大学”校名;1999年,原上海农学院并入;2005年,与原上海第二医科大学合并。 [3] [7-9] 至2019年12月,学校共有31个学院/直属系,31个研究院,13家附属医院,2个附属医学研究所,20个直属单位,5个直属企业。全日制本科生(国内)16351人、全日制硕士研究生14326人、全日制博士研究生8496人,学位留学生2837人,其中研究生学位留学生1698人;有专任教师3236名;至2020年9月,有博士后流动站35个,一级学科博士点45个,专业学位博士点3个,一级学科硕士点57个,专业学位硕士点23个,本科专业67个。 [3] [10]


高校舆情必要性

大学生在网络上发表不当言论归根结底是大学生思想政治教育问题,学生正处于价值观培养的关键时期,道德应该是学生具备的最基础的素质。尊重他人是道德里的核心观念之一。针对大学生进行思想政治教育时要以问题为导向,要坚持立德树人,把培育和践行社会主义核心价值观融入教书育人全过程。


问题及建议

1.信息收集不全面。在大数据产业内,大部分研究者利用网络爬虫获取信息,但也由此衍生了因私人信息泄露引发的网络安全恐慌。为尊重其他官方平台的劳动成果和保证学生个人信息的安全性,本系统目前仅掌握共青团系统的网络数据。因此,为提高数据采集过程的便利化和数据收集的全面性,本研究计划联合学校学生大数据中心开展工作,从学校层面加强与各部门、各学院的沟通合作,尽可能多地获取校、院两级官方平台管理部门和自媒体人的官方授权,合法取用后方数据。

2.数据分析不精准。现有的算法不可能完全识别文本含义,尤其面对词汇的变形使用,如在敏感词语中间加入空格或使用拼音代替文字等方法来逃避捕捉,导致关键词提取的精准率降低。因此,研究须不断改进大数据技术,并使用多种类别的关键词提取算法,如基于分离模型的中文关键词提取算法和基于高维聚类技术的中文关键词提取算法等,提高文本分析精准率。此外,由于网络语言更新速度快,研究还应及时更新关键词库,输入网络流行新用语,把握网络表达新形式,提高语义分析精准率。

3.反馈机制不健全。现有的舆情处理方式往往存在主动性不足、协调力不够、责任落实不到位等问题。因此,应建立科学、高效的预警反馈机制,做好舆情决策。要设立舆情监管员,主要负责日常推送,稳定开展网络宣传,并对高校舆情进行实时监控,即时掌握网络舆情动态。当网络舆情热点事件出现时,舆情管理员需要结合分析报告,掌握舆论热点,研判舆情类别和等级,及时上报相关信息辅助决策,把责任落实到人。再由责任部门、舆情专家结合实际提出处置意见,启动应急工作预案,第一时间发表权威消息和官方报道,还原事件真相,赢取学生信任,掌握网络话语权,完成决策。



高校网络舆情监测方案

乐思网络舆情监测系统除舆情预警外,还可以进行舆情分析,舆情分析能够辅助提升新媒体宣传效力。通过统计官方话题的网络媒体报道量、学生转发量、评论量、关注量、传播情况、用户形态特征等数据,计算热度评估指数,形成对官方推送热度与受欢迎程度的科学评价,有助于宣传工作者更好地把握大学生行为特征和兴趣方向,为找准工作切入点提供可靠的数据支持。