文本分析是大数据的下一个前沿吗?
发布时间:2015-07-20

 

大数据

 

无论技术进步有多快,也无论企业体验到之后的好处有多迅速,人们往往展望并期待着下一个大事情的发生。大数据也是一样。一旦组织开始编制旨在简化运营、提高收益的大量数据,他们知道他们已经发现了一个非常具有价值并且极具深远影响的战略。如今,大数据已经被快速使用,并已在各种各样的行业极大地提升着公司的运营能力。但接下来将会发生什么呢?对于很多企业来说,大数据到目前为止的影响是没有什么能与它所提供的尚未开发方式的可能性相提并论。首先在名单上是几乎没有触及文本分析领域,这也被称为文本挖掘。很多人认为文本分析作为承载企业最多希望的领域,在真正探索到大数据的可能性方面,这些企业是寄予厚望的。

 

如果要说已经有所作为的话,连续多年来企业也仅仅利用了大数据的一个方面——结构化数据。简单来说,结构化数据包括了可严格测量的数字,这些数字是“冷酷”且“坚硬”的。这可能是指有多少人访问一个网站,一个特定的产品销售了多少条目,一个公司生产了多少产品等诸多方面。结构化数据在规模上可以非常广阔,但其衡量的质量使得它的操作程序更为简便,并且更易分析。多年以来,平台和程序已经利用了这一事实。然而,更为复杂的是,这也显现出了大数据的另外一面——非结构化数据。这是数据仅通过数字本身来予以衡量更为困难的。这种挑战使得它更难获得进入众多企业的入口的钥匙,但是企业依旧希望在未来能获得更多更大的成功,而这将需要解锁并不断挖掘发现非结构化数据的潜力,这一切将从文本分析开始起步。

 

文本分析的目的在于从根本上把所有的非结构化数据整合从而化为结构化数据。但由于考虑到大约80%的数据都是非结构化的数据,因此这是一个非常艰难的任务,但它也从中显示了一个公司可以从这过程中得到多少。非结构化数据可以采取多种多样的形式,比如Facebook的发布,也可以以微博,语音录音,在线评论,甚至是视频的形式。而将解释所有这些信息归结为一点,还是需要拥有正确的技术才能做到这样。因为文本分析,公司可以从通常难以量化的信息中提取大量有价值且有意义的数据,比如社交媒体帖子。这样的信息可以通过手工劳动进行记录,但是文本分析是更加具有效率的,并且可以考虑到产品的整体形象或是网络上提及品牌的全部效益。

 

文本分析基本上是可以决定一些具有重要性的问题的,比如谁在做评论,在哪里正在做评论,正在说着什么,甚至是非结构化数据的背景以及来龙去脉等诸多问题,文本分析都可以决定。所有这些研究的结果可以被制作成更为可靠且更值得相信的商业情报,从而给企业提供对未来方向、发展规模、企业模式、甚至是未来趋势的新的见解,正因这样,企业就可以发挥自己的作用并加以准备以更好地提升效益,从而不断进步与发展。

 

利用文本分析来衡量非结构化数据真正价值的途径备受追捧。文本分析基本上允许公司利用技术听取网上和其他地方发生的各种对话,给予他们关于客户情绪体验的一个更大规模的采样。文本分析和临时分析一起应用还可以帮助企业更好地确定客户喜爱的东西和偏好,帮助他们找出是什么在激励着他们,而这反过来又有助于提高收入。从文本分析中获得的反馈也并未经过过滤,但可以给企业更为准确的描述,这个描述是关于消费者如何能真正从多个不同来源的途径获得感觉。所有这些新的信息还可以帮助企业想出极具创新思维和发散思路的新产品,因此这也可以让企业的销售业绩得以提升,让企业得以发展与进步。

 

不得不说,这是一个不断发展并快速前进的行业,这是一个被预测为其整体价值在2020年将远远超过60亿的行业。只要企业开始使用数据中的一小部分,并且确切地知道他们想找出什么类型和什么方向的信息,他们就会将自己置于一个有利的地位和位置,并为了公司的成长和发展使用该数据。事实上,只要商家愿意探索非结构化数据,文本分析就一定可以被看作是大数据的下一个前沿。(译文|原文作者:Jonathan Buckley  来源:CDA数据分析师)