互联网舆情采集分析系统

随着互联网快速的发展,互联网日益成为舆情产生、传播的重要媒介。越来越多的人,通过互联网表达政治诉求,从互联网这一自由开放的媒体中了解民意,开展互联网舆情信息的监控与分析,已经成为目前各级政府部门面临的重要课题。互联网舆情信息采集与分析系统就是应对这一发展势头,为互联网舆情分析提供基础性的数据和工具集合,帮助舆情分析领域的社会科学专家分析互联网舆情指数,捕捉敏感事件,分析民意走向。

互联网舆情采集分析系统项目,主要是通过一套软件系统,及时、准确、全面搜索网上涉粤的敏感信息、涉粤领导人的相关信息、涉粤相关组织工作热点信息、涉粤重大突发事件的信息、涉粤重大负面新闻的相关信息、重大突发性群体性事件以及能够查看境外对涉粤重大事件(政策)的相关评论和报道等。该系统必须具备一定的信息采集能力、信息检索能力、信息加工能力、智能分析能力、信息提取能力。该系统必须具备对境外网站和论坛、博客播客等新兴网络媒体的敏感信息的搜索能力,为网络管理提供信息支持,比如ICP备案信息等,同时具备开放性,随时添加信息搜索需要;具备相关的安全性,对权限设置严谨、保密。

“互联网舆情采集分析系统”的特点:

1. 数据采集:自主的数据采集技术,分布式部署,统一管理,采集节点覆盖面广,异步抓取保持稳定;

2. 流式数据平台:无边界海量数据高速入库,统一的数据处理流程,保障数据高效地采集、分析、展现;

3. 文本挖掘:页面内容解析,垃圾信息过滤,智能分词、上下文语义分析、文本智能摘要,信息自动聚类、分类,个性化聚类、分类;

4. 智能分析:舆情趋势、渠道传播、热点事件、网民观点、情感、其他业务数据交叉分析;

5. 深度学习:智能推送引擎,用户行为学习。