当前位置:首页 > 工作计划 > 主成分分析与医学应用:主成分
 

主成分分析与医学应用:主成分

发布时间:2019-08-07 10:21:28 影响了:

主成分分析与医学应用

10级GIS 班 沈娅男 100154022

在社会经济各方面的问题的研究中,问题的解决常常牵涉到许多层面和变量因素,各因素间往往会存在一定的相关关系。变量因素太多,无疑会增加分析问题的难度和复杂性,因此,我们很容易联想到在相关关系分析的基础上,用尽可能少的新变量来拟合代替原来较多的变量,而尽可能多的保留原来变量所反映的信息,这就是主成分分析方法。

主成分分析方法反映了一种降维处理和分析的思维方法,在解决各种复杂问题时往往能起到意想不到的作用。在这里,我着重想要体现主成分分析在医学研究中的应用。一方面是因为医学与人类的健康密切相关,医学的发展关系到人类最根本的福祉;另一方面是因为医学具备巨大的实践价值,医学的研究成果可以发展生产力从而带动国民经济的发展。近年来,由于统计学的发展和各种技术的进步,对数据进行各种定量分析已被广泛应用于医学研究中。主成分分析方法也被广泛使用。

在这里我选择了一个案例来说明主成分分析在医学研究中的作用。分析的数据来自《中国主要年份儿童保健情况统计(1996~2007)》。

中国主要年份儿童保健情况统计(1996~2777)

本例中有9个变量,分别是年份、出生体重小于两千五百克比重、围产儿童死亡率、新生儿破伤风发病率、新生儿破伤风死亡率、五岁以下儿童中重度营养不良比重、新生儿访视率、三岁以下儿童系统管理率、七岁以下儿童保健管理率。然后按下列步骤计算(利用SPSS 软件):

(1)、计算相关系数矩阵:我利用SPSS 软件求得了除年份以外的另外八个变量之间的相关系数矩阵,结果如下表,从表中可以看出,各变量之间具有一定的相关关系而且有些相关系数还比较大,接近于1,所以本例很适合使用主成分分析。

(2)、计算各成分的特征值、方差贡献率和累积贡献率,结果如下:

由表可知,只有前两个变量因素的特征值大于1,因此选择前两个作为主成分,第一主成分的方差贡献率是76.052%,前两个主成分的方差占所有成分方差的95.810%,由此可见,前两个主成分已足够代替原来的变量,几乎涵盖原变量的全部信息。

(3)、计算主成分载荷,得到以下的成分矩阵:

成份矩阵

出生体重小于两千五百克比重 围产儿死亡率 新生儿破伤风发病率 新生儿破伤风死亡率

五岁以下儿童中重度营养不良比重 新生儿访视率

三岁以下儿童系统管理率 七岁以下儿童保健管理率 提取方法 :主成份。 a. 已提取了 2 个成份。

成份

F 1

F 2

a

从中可以得到两主成分的表达式,即:

F1 = -0.134*出生体重小于两千五百克比重+0.820*围产儿死亡率+0.992*新生儿破伤风发病率+0.991*新生儿破伤风死亡率+0.906*五岁以下儿童中重度营养不良比重-0.853*新生儿访视率-0.951*三岁以下儿童系统管理率-0.988*七岁以下儿童保健管理率

同理可得F2的表达式。

(4)、得出结论:在第一主成分中,除了出生体重小于两千五百克比重以外的变量的系数都比较大;在第二主成分中变量出生体重小于两千五百克比重的系数比较大,可以看做是反映变量出生体重小于两千五百克比重的指标。

这样,我们就用这两个主成分概括了所有的指标,描述了中国主要年份儿童的保健情况。

从该案例中可以看出主成分分析具有化繁为简,简明清晰的优点,用最少的成分概括了原来纷杂的变量之间的联系。该统计分析法不失为解决实际应用问题的一个有力工具。

猜你想看
相关文章

Copyright © 2008 - 2022 版权所有 职场范文网

工业和信息化部 备案号:沪ICP备18009755号-3