当前位置:首页 > 发言稿 > 浅谈数据挖掘技术在网络管理中的应用_社交网络 数据挖掘技术
 

浅谈数据挖掘技术在网络管理中的应用_社交网络 数据挖掘技术

发布时间:2019-02-26 03:55:05 影响了:

  摘 要随着科技术的发展,在各个领域产生大量的数据,这些数据的利用必须经过海量的数据抽取出隐含的、具有潜在价值的信息服务于决策,论述数据挖掘技术在网络管理中的具体应用。
  关键词数据挖掘;网络管理
  中图分类号TP3文献标识码A文章编号1673-9671-(2010)042-0027-01
  
  1数据挖掘的含义
  数据挖掘的历史虽然较短,但从20世纪90年代以来,它的发展速度很快,加之它是多学科综合产物,目前还没有一个完整的定义,归纳来看,数据挖掘应该是从海量数据中找出有助于决策分析、有利于企业盈利、或者能为科学研究寻求突破口等有着这些隐藏的或潜力的信息的技术。
  数据挖掘(DM,Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的原始数据中,提取隐含在其中的、事先未知的、但又潜在有用的信息的过程。数据挖掘技术是面向应用的,它不仅面向特定数据库的简单检索查询调用,而且要对这些数据进行深入的统计、分析和推理,发掘数据问的相互关系,完成从业务数据到决策信息的转换。
  2数据挖掘的功能
  2.1聚类
  就是将数据库中的记录划分为一系列有意义的子集,包括传统的模式识别方法和分类学。聚类是概念描述和偏差分析的先决条件,它增强了人们对客观现实的认识。
  2.2概念描述
  就是找到描述数据的可理解模式,并对这类数据的有关特征和内涵进行概括和描述。概念描述分为特征性描述和区别性描述,前者偏重描述数据问的共同特征,后者则是描述数据之间的区别。
  2.3关联分析
  关联就是数据库中两个或多个数据之间存在的某种规律性,它是一类隐含的、具有重要价值、并可发现的知识,关联可分为简单关联、时序关联、因果关联。
  2.4趋势预测
  数据挖掘自动在数据库中寻找预测性信息运用相关算法和技术,分析和认识事物演变的规律性,从已知信息推出未知信息,从现有信息导出未来信息,从而对事物的未来发展作出科学、合理的预测。
  3数据挖掘流程
  数据挖掘是指一个完整的过程,该过程从大型数据库中挖掘先前未知的、有效的、可实用的信息,并使用这些信息做出决策或丰富知识。数据挖掘的基本过程和主要步骤如下:
  3.1确定业务对象
  清晰地定义出业务问题。认清数据挖掘的目的是数据挖掘的重要一步,挖掘的最后结构不可预测,但要探索的问题应该是有预见的,为了数据挖掘而挖掘则带有盲目性,是不会成功的。
  3.2数据准备
  1)数据选择。搜索所有与业务对象有关的内部和外部数据信息,并从中选择出适用于数据挖掘实用的数据。2)数据预处理。研究数据的质量,进行数据的集成变换、归约、压缩等,为进一步的分析作准备,并确定将要进行的挖掘操作的类型。3)数据转换。将数据转换成一个分析模型,这个分析模型是针对挖掘算法建立的,这是数据挖掘成功的关键。
  3.3数据挖掘
  对所得到的经过转换的数据进行挖掘。除了完善和选择合适的挖掘算法外,其余一切工作都能自动地完成。
  3.4结果分析
  解释并评估结果。其使用的分析方法一般应视挖掘操作而定,通常会用到可视化技术。
  3.5知识同化
  将分析所得到的知识集成到业务信息系统的组织结构中去。
  4基于WEB和数据挖掘的网络管理系统的体系结构
  数据挖掘技术从一开始就是面向应用的。目前,在很多领域,数据挖掘(data mining)都是一个很时髦的词,尤其是在银行、电信、保险、交通、零售(如超级市场)等商业领域。在网络管理方面,由芬兰Helsink大学与一家远程通信设备制造厂合作TASA系统,网络管理的告警数据库中蕴涵有大量的故障特征模式,这为数据挖掘提供了数据基础。所以,研究网络管理中的数据挖掘是很有意义的。
  基于WEB的数据仓库系统是一种三层逻辑架构,由表示层、应用层和数据层组成以上客户端只需安装WEB浏览器即可,如IE/NS等,因此可基于任何支持Browser的操作平台,对机器本身要求低。WEB服务器用于管理客户机与应用服务器间的信息流,可以用各种流行服务器,如IIS,APACHE等,WEB服务器接受客户端Http请求,以静态HTML页面或调用应用服务器生成动态HTML响应请求,进行合法性等验证后,根据WEB页面的内容向应用服务器发出请求,WEB服务器上可装有jsp、asp等应用程序,这样可与应用服务器交换信息。应用服务器响应WEB服务器发出的请求,激活相应的查询任务,利用接口技术对数据仓库的访问,如ODBC、JDB方式等。数据层即后台数据仓库接受来自应用层的SQL查询语句以及数据集成等。WEB服务器是此系统的功能中枢,起到连接客户端与应用服务器之间的桥梁的作用,并且可在此进行数据合法性检查、身份验证等。整个系统工作流程如下:在表示层,WE浏览器用户发出一定的操作指令通过HTML文件提出的HTYP请求传递给WEB服务器;在应用层,WEB服务器用相应的asp、jsp等应用程序响应表示层的请求,并进行翻译成应用服务器所能接受的请求,或直接翻译成SQL请求,应用服务器完成相应的SQL语句并与后台数据仓库连接,发出SQL查询等,最后应用层接受数据层的结果,送到客户端。
  在应用层的OLAP服务器对要分析的数据信息进一步按多维分析模型集成到多维数据库中,进一步为OLAP和数据挖掘工具提供服务。OLAP工具以多维数据库中的数据为基础,针对用户的问题进行相关数据分析综合,数据挖掘工具在此基础上,按照一定算法自动地发现潜在模式和新知识。以故障管理模块为例,此时会以一定的模式对网络运营状态进行评估和预测。一方面,数据挖掘出的新知识可以补充到知识库当中;另一方面,知识库响应系统的请求,不仅可将结果提交给数据挖掘模块,用来更好地挖掘新知识,而且还可以使综合管理模块利用知识库中的新知识进行更好的实时处理。基于WEB和数据挖掘技术的网管系统以WEB和数据挖掘技术为平台,以模型库和方法库为指导,利用知识库中的知识对网络数据进行全方位的分析和挖掘,发现潜在的新知识,补充到知识库中,知识库中的知识又能更好地为系统服务,从而使得系统在一定程度上具有智能化,较好地协调数据、模型、方法、知识之间的关系,最大限度地使网络管理者获得最大效益。
  5结语语
  基于WEB和数据挖掘技术的网管系统不仅可以解决多个专业网管形成的“信息孤岛”、资源不能共享的问题,而且克服了大型网络中海量数据却信息缺乏的障碍,引入了数据挖掘技术在一定程度上智能化的生成业务规则,从全局出发为最优控制网络提供指导,帮助领导和决策者预防风险,提高服务和管理水平,为克服当前各专业网管所带来的不足提供了有效解决途径,对当前网管现状的改善具有现实意义。
  
  参考文献
  [1]闫建红.数据库系统概论的教学改革与探索.
  [2]沈阳变压器研究所.电机工程设计手册[S].北京:机械工业出版社,1982.
  [3]GB6451.1-86.三相油浸式电力变压器技术参数和要求.

猜你想看
相关文章

Copyright © 2008 - 2022 版权所有 职场范文网

工业和信息化部 备案号:沪ICP备18009755号-3