乐思网络情报中心系统
乐思网络情报信息中心系统是针对大公司大集团的信息化战略基础设施,它的目的在于加快公司内外部信息流通,打造公司的数字神经系统。
一、 系统概述
随着中国经济发展不断向前推进,大公司大集团面对的市场环境越发复杂,各种影响市场走向的新问题、新情况层出不穷,市场信息量呈指数增长。同时,定量分析方法正在迅速应用到行业研究当中,这对信息搜集的效率和精度提出了很高的要求。仅靠有限的人力进行信息搜集的工作模式,已很难适应市场和技术发展的要求。为了更全面、准确、迅速地掌握市场变化,为了适应新技术发展要求,也为了把人员从繁重的信息搜集工作中解放出来,集中精力进行深层次的分析和研究,迫切需要一套现代化的信息中心系统。
乐思网络情报中心系统的功能是为大公司大集团的市场部门与公关部门提供一个收集外部信息的平台,包括与本公司相关的信息,与竞争对手相关的信息,行业信息,价格信息,与合作伙伴相关的信息,用户网上反馈的各种信息,科研技术信息等,可以做到多人在一个平台上可以快速浏览当日或过去的所有相关信息,避免的人工查询多个网站的费时费力的情况,并具有预警功能,可以在某方面的信息一旦出现时迅速通知相关人员。
其业务流程如下图所示:
图1: 乐思网络信息中心系统的业务流程
相比目前的人工信息搜集,其优势明显:
比较指标 |
人工搜集 |
采用乐思网络信息中心系统 |
目标网站 |
几十个 |
几百个到几千个几万个-采3453舆情4533集- |
人力成本 |
需分别登录各个网站,手工查阅,还要手工复制粘贴,疲于奔命 |
网络信息的获取工作完全由软件自动进行,监测人员只需在内网集中进行内容的浏览与分析 |
负面信息识别 |
需要逐条人工查看确认 |
在自动判别的基础上再人工确认 |
信息保存 |
零碎,不可避免会出错 -采3453舆情4533集- |
精确,全面,便于事后追踪 |
数据存储 |
Word文件,分散,很难管理 |
统一存放在大型关系数据库中,集中管理 |
监测报告 |
基于手工统计加估计,数据支持不充分 |
基于自动化的统计分析, |
监测效果 |
覆盖片面,不及时 |
覆盖全面,实时, |
二、 实施后的利益
加快外部情报感知:公司报道,用户反馈,竞品动态,行业动态,宏观动态,政策法规等公司外部信息实时汇聚到桌面上,方便公司上下对于市场竞争情报的感知与反应。
加快定量定性分析:在占有大量数据的基础上,分析人员可以从繁重的信息搜集工作解脱出来,投入到最有价值的定量定性分析中去。 owlesys思
三、 系统组成
乐思网络信息中心系统由三个子系统组成:自动采集子系统(采集层)、内容分析子系统(分析层)、以及界面呈现子系统(呈现层)。其关系如下图所示:
图2:乐思网络信息中心系统架构
乐思网络信息中心系统的网络拓扑结构如下图所示,依据需要也可以分开在隔离的外网与内网中实施。
图3:网络拓扑结构
四、 自动采集子系统功能描述
自动采集子系统可以对任意目标网站进行自动采集。
采集的信息既可以是文本型信息(如文章,微博),也可以是数字型信息(如价格,统计数据),还可以是文件型信息(如Word, Excel, PDF文件)。用户可以通过Web界面自行配置对文本型信息的采集,也可以通过软件向导界面配制对于数字型信息的采集。由于采用了全球领先的乐思网络信息采集系统,可以对任意网站上数据进行采集与整合。数据源的发现管理工作由用户完成。
自动采集子系统的全方位监测功能如下图所示:
图4:自动采集子系统全方位监测
自动采集子系统具有以下几个显著特点:
1. 全球领先的自动采集功能
乐思软件的网络信息采集技术全球领先,支持对任意网页内任意数据的精确采集。乐思软件每天都为国内外用户针对各种各样的网站提供采集服务,没有高效稳定的采集平台是无法做到的。
2. 支持各种监测对象
可以实时监测微信公众号、新闻,论坛,博客,公共聊天室,搜索引擎,留言板,应用程序,报刊网站电子版等。
3. 无需配置直接监测几千个新闻网站
系统内置对全球范围内网站的监测配置,只需输入关键词,自动采集出文章标题与正文。
4. 强大的多语言统一处理功能26禁止9盗用0
可自动处理并保存中文,英文,法文,德文,日语,韩语,维文,阿拉伯语等多种语言。
5. 智能文章提取
对于文章类型网页,可以无需配置,直接自动提取文章正文与标题,以及作者发布日期等,自动去除广告,栏目,版权等无关的垃圾内容
6. 完美支持各种网页情况
支持当前流行的Web 2.0 AJAX动态网站
支持用户名与密码自动登录
支持表单查询
支持下一页自动浏览功能
支持多页面文章内容自动抽取与合并
可以自动下载正文内图片以及各类附件
可以选择保存原文快照以备查
支持多种互联网协议: HTTP、HTTPS、以及FTP
支持多种网络文件格式:HTML/XML/CSV/TEXT/RSS/ATOM
…
您知道吗?--我们的系统所提供的各种特性组合起来可以处理成千上万种网页或数据的不同情况
7. 自动去重功能
每次采集时,对于同一个URL,仅采集最新的没有采集过的文章内容或回复,对于已经采集过的内容,自动忽略。对于转载文章,可以选择自动去重。
8. 内置各种后期数据处理功能
数据从网页上获取后,可进一步精加工为各种更细粒度的字段数据或者合并整合,替换统计等. 例如关键词抽取,街道地址抽取,省市名称抽取,邮编抽取,电话号码抽取,传真号码抽取,电子邮件地址抽取,QQ/MSN/Skype抽取,URL抽取等。26禁止9盗用0
9. 可无人值守全天候自动采集
可定时运行,也可7×24小时运行,可设置采集时间间隔最短为1分钟。
10. 用户可以自行添加目标网站
利用系统提供的采集平台,用户可以很容易地对目标网站进行可视化分析,填入配置参数,加入调度过程,从而可以任意修改,增加,移除目标网站。
五、 内容分析子系统功能描述
内容分析子系统抽取出内容的元信息,基于用户的关键词设置,对内容进行实时地自动分类自动聚类。
乐思研发的超高速关键词提取技术,在3万字的文章中查找1万个关键词的出现次数, 不超过6.9毫秒。
六、 界面呈现子系统功能描述
采集后的信息,对于文本型信息通过列表形式查看,对于数字型信息通过用户自定义的格式查看。
界面呈现子系统让各个数据来源的最新信息分门别类实时呈现在用户的桌面浏览器中。其功能架构如下。
图5: 界面呈现子系统功能架构
界面呈现子系统具有以下显著特点:
1. 多人协同工作
不同用户浏览不同内容,执行不同操作,完成不同职责
2. 文章要素显示, 疑似负面信息自动提示
对于新闻文章与博客文章,可采集标题,正文,作者,发布时间,来源
对于关键词用高亮背景彩色显示
3. 帖子要素显示, 疑似负面信息自动提示
对于论坛帖子,可采集标题,正文,作者,发贴时间,查看次数,回复贴数
对于关键词用高亮背景彩色显示
4. 分类与编辑
对于采集后的信息内容,可以进行过滤,分类,备注,与编辑,便于后期管理与分析
5. 强大的搜索功能
既可以精确搜索也可以模糊搜索,既可以按分类搜索,也可按来源搜索
6. 支持人工采集
对于某些紧急或异常情况,可以人工输入采集到的信息
7. 反网站限制功能
可采集被国内屏蔽的国外网站,可采集限制了来源IP与访问频率的网站,可自动获取代理IP,无需设置
8. 短信通知功能
可以设定关键词,凡是采集内容出现了一个或多个关键词,就可以将该条记录发送给相关短信接收人员,便于无人值守实时监测。
9. 报表
各类别趋势图表
用户自定义报表
10. 发布
对于有价值的信息,可以打勾或分类后由系统自动发布到指定的内网平台或外网平台。
也可将数据导出为各种格式(CSV, XML, Excel, Access),进行转移。
七、 系统实施
系统主要应用于大公司大集团的市场部门与公关部门。
针对客户需求,我们提供如下系统实施服务:
编号 |
名称 |
内容 |
1 |
交钥匙工程 |
提供乐思网络信息中心系统的整套软件与文档, |
2 |
培训 |
提供远程培训或上门培训服务 |
3 |
后续服务 |
定期提供目标网站更新后的配置参数文件 |
4 |
技术支持 |
通过电话、Email、QQ/MSN/Skype 回答用户的问题 |
现在就提交需求,或发送邮件至web2db@knowlesys.com,或拨打电话400-603-8000联系我们吧。