乐思软件

提交需求|联系我们|请电400-603-8000

化工信息化案例--中国化工网

  2、化工搜索平台

  在信息检索方面,化工行业具有其行业的特殊性,如化工产品它包含分子式、结构式、分子量、CAS、化学名称、别名、英文名称、化学反应式、化学特性、包装、用途,以及和这些产品相关的供应商信息、行业新闻等信息,是化工行业的特有的“有效信息”,而目前综合的搜索引擎无法有效的提供这些信息。

  集化工产品、目录、网页为一体的专业化工搜索服务平台,将有效地解决现有搜索引擎出现的搜索瓶颈和缺陷,使化工搜索更精确、更专业、更快捷、更丰富,同时大大提高化工行业信息获取的效率,促进化工行业信息化建设的进程。

  化工搜索服务平台是采用公司自主开发的先进超链技术、信息抓取技术、超链提取技术、数据检索技术、分布式数据库管理技术、智能分词技术等,具有精确、专业、快速等特点。

  3、化工专家栏目

  随着全球经济的日益一体化和中国WTO的正式加入,壁垒的逐步消除和新技术的广泛应用,使化工行业充满了更多的机遇和更艰巨的挑战。为更好的服务众多化工企业,中国化工网推出"化工专家"栏目。中国化工网在与企业、高校、科研机构等企事业单位的化工专家进行广泛沟通的基础上,汇集了国内化工行业各领域500多位专家信息,包括每位专家的简历、研究方向、最新成果等,为专家与专家、专家与相关单位之间提供了一良好的在线交流通道。专家可以填加、修改自己的个人信息资料,可以公布自己的主要成果与最新科研项目,可以在专家论坛发表自己的见解等,并可优先享受中国化工网的相关服务。

  四、项目实施过程中的主要问题及解决办法:

  1. 海量数据搜索的响应时间问题

  对于使用者来说,一般期望在按下按钮后一秒钟之内能看到结果,因此,搜索速度是本项目成败的关键之一。

  由于网页搜索所面对的数据量巨大,一般要在数千万页至数十亿页的量,因此,要在设定的时间内完成巨量数据的搜索,需要在多方面解决这个问题。

  解决这个问题的关键之一是建立索引,通过对搜索对象的预处理,使得在用户进行关键词搜索时,只需对已作预处理的索引关键词及相关的数据进行处理,极大地减轻了数据处理的工作量。解决这个问题的第二个关键是采用了分布式的软硬件体系结构。我们注意到:搜索的过程是可以并行的,即对一部分网页搜索的结果不影响对另一部分网页的搜索。不可并行的部分是对结果的排序。对于绝大多数用户而言,感兴趣的仅是搜索结果集中排序最前的部分结果。有鉴于此,我们将搜索对象均衡地分布在多台服务器上,每台服务器负责部分搜索对象的搜索和排序。前端服务器负责工作的分配和结果的收集及后处理。这样,通过多台服务器的协同运行,使得平均的响应时间从秒级响应降到亚秒级响应。

  采用分布式的体系结构也使本系统达到一定程度的可扩展性,并改善搜索服务的抗故障能力。

  2、网页采集中遇到的链路不稳定问题。

  网页搜索的要素是要在巨大量的网页可供搜索。在采集网页的过程中,由于链路的不稳定,常造成不能完整的采集到某些网站的网页。这种现象在跨运营商的网络时较为明显,尤其是在到国外网站的链路上,更为明显。

  目前我们没有从根本上解决这个问题的手段。采用的方式是在预计采集的该网站网页上不能成功时,放弃采集。有部分放弃是可预计的,但当放弃时量较多时,将对整体的采集质量产生影响。

  五、项目主要成果

  1. 建成的数据库、提供的新服务

  (1)国内最大的信息及服务平台:化工资讯栏目每天上千条的行业资讯;产品供求栏目每天2000多条的动态供求;全国范围内的实时市场行情、行业展会信息、技术交流及人才交流等;化工专家汇集了国内化工行业各领域500多位专家信息。

  (2)国内最大的专业化工搜索服务平台:国内最大的专业化工搜索引擎,集化工产品搜索、目录搜索、网页搜索为一体,拥有100万个化工产品、10万个化工站点、1000万个化工网页的化工数据库。

集成系统网络情报信息数据库

CIO频道人物视窗
CIO频道方案案例库
大数据建设方案案例库
电子政务建设方案案例库
互联集成系统构建方案案例库
商务智能建设方案案例库
系统集成类软件信息研发企业名录