当前位置:首页 > 申请书大全 > 信息检索与数据挖掘感想【数据挖掘及其在网络信息检索中的类型及应用】
 

信息检索与数据挖掘感想【数据挖掘及其在网络信息检索中的类型及应用】

发布时间:2019-02-21 04:43:05 影响了:

  摘要:随着当代计算机技术的快速发展,网络已成为人们互相传递信息的一个快速渠道。然而网络信息资源是非常庞大的,这个人们寻找所需要的信息资源带来了很多的不便。网络信息检索经过近几年的快速发展,在解决这一问题上起到了一定的作用,在一定程度上满足了用户检索信息的需要,但在检测的标准率上还是不尽如人意。本文通过对数据挖掘的概念方法出发,探讨了数据挖掘在当代网络信息检索中的应用。分析了数据挖掘与信息过滤和可视化技术的结合,进而提高网络信息的检索效率,弥补现有检索工具的不足。
  关键词:网络信息挖掘 数据挖掘 网络信息检索
  中图分类号:TP391.3 文献标识码:A 文章编号:1007-9416(2012)01-0144-01
  
  1、网络信息资源及其特点
  所谓网络信息资源就是指网络上能够满足用户信息需求的资源的集合。可想而知,网络信息资源相当的丰富,各方面的都有,其内容涉及到世界上的每一方面,例如:农业、文学、航天、地理、医疗、计算机、法律、娱乐界等几乎所有专业领域,网络资源是知识和信息的集合,是一批非常宝贵的财富。而目前的网络信息资源与传统的不同,以成为一种新型的数字化资源。网络信息资源的特点主要体现在以下几个方面:
  (1)信息数量庞大、种类繁多以及传播范围比较广。网络信息类型呈现多样化,主要有文本、数据、图文、图像、音频、视频等信息;其内容也不是单一的既有健康的信息,也少不了有害和虚假的信息,从个人到政府都有一定量的信息。
  (2)目前网络信息资源管理机制多样,没有统一的机制,以至于网络信息安全缺乏一定的保障。于是就出现了普遍存在的黑客、计算机病毒和色情信息。国家花费了大量的社会资源来防止有害信息的传播。
  (3)由于科学技术的不断发展造成了网络信息资源更新数的极快,在网络信息管理方面就比较困难。网络信息属于自由发布,因此信息来源广泛,内容呈现出多种多样,质量也就没有了保障。
  (4)网络资源最大的优点是它给用户提供了多层次的信息交流模式,反应了当今社会生活的各个方面,形成了网络的百科全书和具有快速的传播功能。
  2、网络信息挖掘的类型
  2.1 网络信息的内容挖掘
  网络信息的内容挖掘就是从网络中存在的内容、数据中发现出对自己有用的信息。网络信息资源类型繁多,其中大量的网络信息资源可以通过在网络中的索引和检索服务直接获取,但是还有一些网络信息是通过一些工具或方法获取,如用户通过提问而动态生成的结果就属于此类信息。还有一些私人网络数据,它们不能够通过就不能通过索引收索出来。另外,网络信息内容是由文本、图像、音频、视频和数据等形式的数据组成的,由此可见网络内容挖掘是一种多媒体数据挖掘形式。
  2.2 网络信息结构挖掘
  网络结构挖掘是从Web文档结构、WWW的组织结构和链接关系中推导的。网络信息结构挖掘的目的是寻找Web和页面的结构及其蕴含在这些结构中的有用模式,然后对其链接进行合理的分类,通过不同网页的关联有助于用户找到所需信息的相关资源,并且可以通过浏览特定的网页从中获取最新的动态信息。还可以发现Web文档本身固有的结构,此种结构既可以拥有用户的浏览,也可以对网页进行比较。
  2.3 网络信息用法挖掘
  通过网络信息用法挖掘,可以充分的了解用户的网络数据实际意义。网络信息内容挖掘和网络信息结构挖掘主要是针对原始数据的,而网络信息用法挖掘主要是针对用户和网络交互的过程中产生的数据。这些数据类型包括很多:用户对网络服务器的访问记录、浏览器日志记录、用户的个人信息、用户额交易信息等等。运用网络信息用法挖掘技术能够有效的从服务器以及浏览器端的日志记录中发现隐藏在网络数据中的一些无法通过索引获取的模式信息,还可以了解用户对网络系统的访问模式以及在网络上所进行的行为模式,从而对其作出预测性分析。
  3、网络新挖掘在信息检索中的应用
  网络信息挖掘的作用除了体现在具有很大权威的网页的生成上外,还可以通过Web的组织结构和链接关系中发现一些其他类型的知识。网络信息挖掘可以通过挖掘web的结构信息揭示蕴含在web内容之外的许多隐含的有用信息,例如web页面上的U不仅可以反映页面的类型,还可以在一定程度上反映页面间信息的存储位置和不同信息内容的层次关系以及通过分析网页的URL来分析这种层次关系。根据上述原理已有很多人提出了与web页面URL有关的启发式规则,并将其应用于寻找个人主页上。因此,利用网络信息挖掘可以很快的寻找个人主页和与其相似的网页。除此之外,web的信息挖掘还可以对web页进行合理的分类,预测用户的链接使用及链接属性的可视化,对各个企业搜索引擎索引的web页数量进行统计分析等。它也可以揭示文档结构信息中的有用模式,有助于从多个维度和层面提供检索途径。
  4、结语
  因为信息时代的发展,促使网络信息挖掘成为网络信息处理领域中的一项新技术,它可以使用户通过大量网络信息中,得到数据对象间的内在特性,并根据数据间的关联在网络资源中进行有目的获取相应的信息。目前网络信息挖掘是数据挖掘技术在网络时代网络信息处理中的一项非常重要的应用,同时也是今后网络领域中的一项崭新的研究课题。随着网络的快速发展和不断的普及,网络信息资源不但来源途径更加广泛而且内容也越来越丰富,但如何分析和利用这些无以计数的网络数据是当前比较突出的一个问题。网络信息挖掘在实际工作中具有重要的实践意义和非常广阔的应用前景。
  参考文献
  [1]李村合.网络信息挖掘技术及其应用研究[J].情报科学,2008.
  [2]叶云,万明明.网络信息挖掘技术探讨[J].广西大学学报,2007.
  [3]黄晓斌.网络信息挖掘[M].北京:电子工业出版社,2005.1.
  [4]董慧.网络信息资源开发及利用[M].武汉:武汉大学出版社,2006.
  作者简介
  张敬(1982-),女(汉族),河南驻马店人,研究生,主要研究方向:数据挖掘。

猜你想看
相关文章

Copyright © 2008 - 2022 版权所有 职场范文网

工业和信息化部 备案号:沪ICP备18009755号-3