当前位置:首页 > 思想汇报 > 多模情报数据智能融合【智能计算:变数据为情报】
 

多模情报数据智能融合【智能计算:变数据为情报】

发布时间:2019-03-12 04:10:33 影响了:

  在急速增加的互联网信息中,快速、准确地寻找信息,并将其提升为有价值的情报需要智能计算。   在互联网时代,用户对信息的需求已经发生了很大变化,人们大多借助百度和Google这样的搜索引擎来搜寻自己所需要的信息。但随着互联网信息量爆炸式的增长和个性化需求的增强,人们强烈需要在互联网中筛选出符合自己需求的精确信息,尤其是政府和企业等用户,更希望在搜索引擎的基础上进行深入的需求发掘,能够将信息升级为情报。
  “智能计算在自然语言方面的处理就是帮助解决这一问题的。”海量信息技术有限公司副总裁兼首席科学家周富秋博士介绍说,在互联网信息挖掘中,智能计算是计算机利用存储与统计等特长模拟出人类智能效果的技术,通过一系列针对互联网数据的采集、分析、筛选、萃取等智能化技术手段,运用语义分析、数据挖掘、模式识别等一系列技术,从非结构化数据到结构化数据、从字符到语义,再进行海量计算后,将原始无序的数据转化成容易理解、价值较高的信息,进而再提炼出有价值的情报,供做决策依据。
  对于信息情报方面的智能计算技术,周富秋做了进一步的解释,互联网拥有大量的数据和信息,目前主要采用了浅度智能自然语言处理技术(NPL Shallow),通过这种方式提取出来的内容是数据和信息,Google和百度等提供的搜索引擎就是这样实现的。
  要想在数据和信息的基础上进行精加工,进而生产出精华――情报,需要采用一种叫做深度智能自然语言处理的技术(NPL Deep)。该技术建立在自然语言处理(Nature Language Process,NPL)的基础上,建立语料库,进行分类,然后建立规则表和词表。通过人工筛选出庞大语料库,按照事先设计的算法,对海量数据进行识别,从中找到对用户有用的信息和情报。
  在搜索的过程中,比如输入“城管”这个词作为关键词,传统搜索结果会出现大量与“城管”相关的资料或新闻;如果输入“城管”和“评价”两个关键词,传统搜索结果会出现大量与“城管”及“评价”相关的信息,但远不能满足用户的需求。新的智能搜索用“城管”和“评价”做关键词,搜索结果将会根据对城管评价的内容和结果进行分类显示,例如会显示:城管评价超级不满意共10万条信息,城管评价不满意共5万条信息。当你点击这些信息时,将会把下面的详细信息列出。通过这种搜索,你不仅可以知道对城管评价的相关详细信息,而且能够进行分类和统计,起到了将信息升级为初级情报的效果。
  实现上述功能的关键是应用了自动分词技术。中文分词技术的滞后是当前中文信息自动化处理技术发展的瓶颈,词是能独立活动的有意义的最小语言单位,分词是中文信息处理从字符处理水平发展到语义处理水平的关键,是中文智能计算技术的基础。周富秋认为,他们研究的智能分词技术及基于其上的搜索引擎技术、信息检索与过滤、自动分类和聚类等智能计算技术,目前已在中文智能分词方面取得突破性进展,分词准确率达到99.6%以上,智能计算将信息升级为情报是未来应用的主要方向。(邓健)

猜你想看
相关文章

Copyright © 2008 - 2022 版权所有 职场范文网

工业和信息化部 备案号:沪ICP备18009755号-3