数据标准化常用公式【数据标准化方法】
--数据标准化的方法
撰稿人:路璐
[1**********]
1 数据标准化的概念
数据的标准化是将数据按比例缩放,使之落入到一个小的特定区间,将其转化为纯数值,便于不同单位或量级的指标能够进行比较和加权。
2 数据标准化的意义
在建设城市信用体系的多指标评级体系中,由于各评级指标的性质不同,通常具有不同的量纲和数量级。当各指标间的水平相差很大时,如果直接用原始指标值进行分析,就会突出数值较高的指标在综合分析中的作用,相对削弱数值水平较低指标的作用。因此,在使用大数据进入评级算法前,为了保证结果的可靠性,首先会对原始指标数据进行标准化处理,数据标准化的方法是建设城市信用体系评级的重要技术之一。
3 数据标准化的范围
由于数据采集涉及到多个来源不同标准的原始数据,数据标准化主要解决不同性质的数据对测评方案的作用力同趋化和数据可比性的问题,即各指标值都处于同一个数量级别上,可以进行综合测评分析,为进入下一步的评级算法打好基础。
1
4 数据标准化原理
针对城市信用体系的建设,设计了以下技术方案:
由于原始数据在不同水平、区域内的变化对综合分析结果的影响是不一样的,设定a为重影响最底数值,b为重影响最高数值,即在多指标综合评价时,若xi小于a,xi变化对综合水平影响较大,平价值也有较大的变化;而当xi大于b时,xi的变化对被评价对象综合水平的影响较小,则平价值的变化也较小。
当原始数据xi小于重影响最低数值a时,标准值为0; 当原始数据xi大于重影响最高数值b时,标准值为1; 当原始数据xi大于等于重影响最低数值a而小于重影响最高数值b时,标准值为
5 数据标准化函数
由数据标准化原理得出数学表达式,即:
0 xi
1 xi≥b
将处理后的标准值扩大10倍,与定性指标统一取值区间。
6 数据标准化函数的值域
标准值通常有一个允许值的集合,这个集合被称为值域。
2
x−ab−a 。
标准化函数的值域是 0,10 。
7 小结
在处理城市信用体系建设的数据标准化时,要保证算法一致性、原始数据整体性,这样得出的标准值才有可比性,才可以将其输入到权重和评级计算中。
3