当前位置:首页 > 发言稿 > [基于OLAP的商业智能分析方法] 大数据分析师工资待遇
 

[基于OLAP的商业智能分析方法] 大数据分析师工资待遇

发布时间:2019-06-28 04:05:11 影响了:

  摘要:联机分析处理(OLAP),是商业智能的一种分析工具之一。而该文所述的智能分析方法是一种基于OLAP的分析方法,这种分析方法的特征在于采用了MDX(Multi Dimensional Expressions,多维表达语言)语言;使用MDX来处理多维数据的分析;利用MDX快速处理OLAP数据库的能力来实现基于属性度量值的自动报表分析,从而找出对报表总额贡献率最高的几个维度成员组合;通过使用循环遍历多个维度,使用递归技术实现单个维度的上下钻取分析及维度间的连接分析。
  关键词:OLAP;商业智能;智能分析方法
  中图分类号:TP311文献标识码:A文章编号:1009-3044(2012)17-4199-03
  商业智能通常被理解为将企业中现有的数据转化为知识,帮助企业做出明智的业务经营决策的工具。这些数据包括来自企业业务系统的订单、库存、交易账目、客户和供应商等来自企业所处行业和竞争对手的数据以及来自企业所处的其他外部环境中的各种数据。
  为了将数据转化为知识,需要利用数据仓库、联机分析处理(OLAP)工具和数据挖掘等技术。因此,从技术层面上讲,商业智能不是什么新技术,它只是数据仓库、OLAP和数据挖掘等技术的综合运用。
  目前的数据处理主要分成两大类:联机事务处理OLTP、联机分析处理OLAP。OLTP是传统的关系型数据库的主要应用,主要是基本的、日常的事务处理。OLAP是数据仓库系统的主要应用,支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。
  OLAP是使分析人员、管理人员或执行人员能够从多角度对信息进行快速、一致、交互地存取,从而获得对数据的更深入了解的一类软件技术。OLAP的目标是满足决策支持或者满足在多维环境下特定的查询和报表需求,它的技术核心是"维"这个概念。
  “维”是人们观察客观世界的角度,是一种高层次的类型划分,也叫“维度”。“维”一般包含着层次关系,这种层次关系有时会相当复杂。通过把一个实体的多项重要的属性定义为多个维,使用户能对不同维上的数据进行比较,所比较的数据叫做度量值。因此OLAP也可以说是多维数据分析工具的集合。
  OLAP的基本多维分析操作有钻取、切片和切块、以及旋转等。
  OLAP有多种实现方法,该文介绍的智能分析方法是其中之一。
  1现状
  随着信息技术的发展,每天都有海量的数据生成,各种数据之间的高度关联性使得数据分析人员倾向于在多维数据库OLAP里面对数据进行分析。由于已经对原始数据进行了压缩聚合等处理,使得多维数据库无论是在时间还是空间方面的数据存储处理分析能力都比关系数据库优秀。尽管如此,现阶段分析人员对多维数据库的操作只限于简单的查询分析,而且在分析的过程中往往要依赖于分析人员的主观判断,需要分析人员决定分析哪些属性的哪些成员。
  现实中的一个问题是假定已知报表总额的某个度量值有所变化,任务是找出对该度量值变化贡献率(贡献率:关于该度量值的一个维度的一个成员占这个维度的所有成员的比重乘以该维度下属成员的数目)最高的几个维度成员。前面已经提到,现阶段分析人员只能对多维数据库进行简单的查询分析且往往包含人为的主观分析。为了完成上述任务,他们的可能做法是手动处理数据立方体的所有输入维度,对每个维度进行查询分析并手动地选择结果并将起返回。这个过程是相当耗费人力和时间的。因此提出一种新的方法自动处理上述问题成为迫切。
  基于OLAP的智能分析方法是针对商业智能系统度量值变化贡献率判断问题,特提出的一种方法。
  2技术方案原理
  如图1,以数据立方体作为输入。对数据立方体的所有维度进行遍历,每次处理一个维度(假定有n个维度)。Di表示维度i,Vijk表示在第i个维度的第j个层次的第k个变量。在第i个维度上,先通过向下钻取提取维度下的第一层成员,然后选取贡献率满足条件(这里的条件是设定的某个阀值)的成员Vi1k并存储这些节点,然后以Vi1k这些成员为基础,向下钻取下一层成员Vi2k,再判断是否满足指定的阀值,假设满足条件的话,则存储Vi2k,并在Vi2k的基础上继续向下钻取。递归的终止条件是在某一层的所有成员的贡献率低于指定阀值。该维度处理完毕,得到的结果是贡献率满足一定阀值的各个维度各个层次各个成员的集合N1。然后存储N1。
  第二轮的执行过程为:将集合N1中某个维度i的所有层次的所有成员与其他维度j(Vj≠1)的所有层次所有成员进行链接得到集合N2,里面的成员为Vimn*Vjkl, Vj≠1,且其贡献率要大于给定的阀值。假设N2为空,则算法终止并返回N1的结果。假设N2不为空,先存储N2,再将N2里面的成员进行链接得到N3。N3的行程规则跟N2类似。依次类推,得到一个关于Ni的集合。
  
  图1
  本智能分析方法通过循环手段自动遍历数据立方体的各个维度,在每个维度递归上下钻取,以及维度之间的连接分析,从而可以得出对当前报表总额或者某个度量值贡献度最高的几个维度成员及其组合。整个流程不需要人为的分析,只需要将数据立方体作为输入即可完成。其输出是立方体中每个度量值以及对它们贡献度最高的N个维度成员的组合。
  处理过程如图2、图3:
  
  图2
  
  图3
  实现处理一个维度的一个层次的MDX伪代码如下:
  WITH MEMBER Contribution_Degree as
  ‘[[Measures].[某度量]/([Measures].[某度量],Ancestor([当前维度].CurrentMember,[当前维度].[上一层次]))]*[当前维度].[上一层次]. Count’
  --Contribution_Degree为某一维度某一成员的贡献率
  SELECT
  NON EMPTY{
  FILTER(
  [当前维度].MEMBERS,
  ([当前维度].CURRENTMEMBER>指定阀值))
  } on axis(0)
  FROM [数据立方体]
  WHERE [第i个维度]
  处理集合Ni的伪代码如下:
  Tackle_Ni(Ni)
  {
  For(i=1;i=指定阀值)
  Add Vi*Vj into Ni+1
  }}
  Return Ni+1
  }
  3该智能分析方法的应用
  这种基于OLAP的智能分析方法,经过研发团队在公司实验室的多次测试、改良、优化,现已推出了比较成熟的计算过程程序,减少了开发团队的人力资源投入,增加了软件产品的稳定度和成熟度。在广东电信下属多个分公司投入使用,因为为客户展现了数据质量较高的报表,满足了客户的以下需求:
  1)客户可通过对目标数据的完全访问在所有维度中任意钻取以进行深入调查;
  2)可通过设置好格式的一致数据将OLAP轻松应用于任何维度子集;
  3)可利用一致的基本数据对象最大限地减少冲突报告,确保交互性;
  4)利用多个维度的正确数据执行用户驱动的适时分析;
  5)提供更新的同步数据来处理事务级数据分析。
  4结束语
  科学技术是第一生产力,技术是产业发展进步的根本。这种分析方法的投入开发使用,通过自动计算得出结果,可以减少人工投入,节省了人力资源;同时减少人为判断的错误因素,增加数据的客观性;为企业领导的正确决策提供了科学依据,为企业带来了直接的经济效益。
  参考文献:
  [1]中国商业智能网.
  [2]俞丁明.新技术革命的意义. 2012-2-6.

猜你想看
相关文章

Copyright © 2008 - 2022 版权所有 职场范文网

工业和信息化部 备案号:沪ICP备18009755号-3