FP-growth关联规则挖掘算法在高校学生评教系统中的应用研究:fp growth算法
摘 要: 将FP-growth关联规则挖掘算法应用到学生评教系统中,对评教数据进行关联分析,得到对提高教学质量有用的信息,为教学管理和决策提供依据。 关键词: 关联规则;FP-growth;教学评价
0 引言
高校学生评教系统在加强教学研究和教学质量的评估与监控,督导评教工作中积累了大量的数据,但是这些数据还未能得到有效利用,管理人员只能通过简单的统计或排序等功能获得表面的信息。如何对这些信息进行重新利用,将现有的管理数据转化为可供使用的信息[1],以便于为学校管理者提供决策支持,提高教学水平和办学质量,是一个亟待解决的问题。
数据挖掘[2]技术能够从大量数据中发现有用的信息,通过公正客观的统计和分析,从大量数据中发现潜在规律,找出隐含的模式,准确把握未来的动态。将数据挖掘技术与教学评价系统相结合,从评价教学的海量数据中挖掘出隐藏的有用信息,发现数据之间的内存联系,是检查教学效果和提高教学水平的一个重要途径。
1 关联规则基本概念
设 是项目集合,其中 称为项目。事务数据库 是一系列有唯一标识符TID的事务组成,事务 对应 上的一个子集。
定义1:设 ,项目集 在数据集 上的支持度是包含
的事务在 中所占的百分比。
定义2:对项目集 和事务数据库 , 中满足用户指定的最小支持度的项目集,即大于或等于最小支持度的 的非空子集,称为频繁项目集。在频繁项目集中挑选出所有不被其他元素包含的频繁项目集称为最大频繁项目集。
定义3:可信度是指包含 和 的事务数与包含 的事务数之比,其中 。
定义4: 在 上满足最小支持度和最小可信度的关联规则称为强关联规则。一般所说的关联规则指的是强关联规则。
关联规则挖掘分为以下两步:首先发现频繁项目集,通过给定的最小支持度,找到所有频繁项目集。然后生成关联规则,通过给定的最小可信度,在频繁项目集中找到可信度大于或等于最小可信度的关联规则。
2 FP-growth算法
经典的Apriori算法在挖掘大规模事务数据过程中,必须经过反复扫描事务数据库来产生候选项目集,算法的效率很低。Han等人提出了一种FP-growth算法[3]。此算法只扫描两次数据库。它不使用候选集,而是直接压缩数据库成为一个频繁模式树,通过对这棵树生成关联规则,使挖掘效率得到了明显提升。
FP-growth算法构造频繁模式树的过程如下:
1)按Apriori算法,扫描数据库一次产生1-频繁项目集,并把它们按降序排列,放入L表中;
2)创建根结点,并标志为null,扫描数据库一次,当得到数据库的一个项目集时,就把其中的元素按表的次序排列,然后递归调用FP_growth来实现FP-tree增长。
挖掘FP-tree的算法如下:
算法1 FP-growth ,FP-growth模式增长算法
输入:FP-tree,事务数据集 ,最小支持度min_sup
输出:频繁模式集
if Tree 仅包含单一路径 then
for each 路径 中的节点组合(记作 ) in路径 do
产生模式 ,其支持度support= 中节点的最小支持度;
else for each in Tree的项目头表(倒序) do begin
产生一个模式 ,其支持度support=
构造 的条件模式库,接着构造 的条件FP-tree,记作
End
3 FP-growth算法在高校学生评教系统中的应用
教学评价是指依据一定的教学目标与教学规范标准,通过对学校教与学等教学情况的系统检测与考核,评定其教学效果与教学目标的实现程度,并做出相应的价值判断及其改进的过程。本文以学生评教为例,利用FP-growth算法,挖掘出对提高教学质量有用的信息,为教学管理和决策提供了依据。本校学生评教系统采用B/S结构,学生通过网上选择填报对教师进行评价。学生评教的原始数据片段如表1所示。
表1数据表中存放着部分学生评教的情况,其中TID为教师编号,SID为学生编号,PID为课程号,A-M为不同评教指标,N为总评,评教指标如下:
1)态度端正,爱护学生,言行文明,无迟到、早退、接听电话等现象。
2)对学生迟到、早退、喧哗、睡觉、接听电话等现象能够严格管理。
3)合理,仪表端正,情绪饱满,使人感到亲切、热诚,举止得体、形象好。
4)内容和方法经过精心准备,教案规范,板书清晰、正确、工整,板图形象逼真,易理解掌握。
5)普通话标准,教学语言准确、精炼、流畅、生动,有吸引力。
6)组织教学迅速有效,复习、讲解、练习时间分配合理,教学环节衔接自然。
7)教学紧扣教材,因材施教,深浅、进度适合学生掌握,作业布置适中,批阅及时。
8)教学内容讲解清楚、准确,认真授课,学生易于把握重点、难点,注意传授学习方法。
9)教师能脱稿讲授,不照本宣科,知识讲解非常熟练,动作示范标准。
10)结合学科发展,合理介绍本学科发展趋势及新问题,丰富教材内容,拓宽学生知识面。
11)讲课条理清晰,层次清楚,分析论证充分,逻辑性强。
12)教学富有启发性,注重与学生交流互动,善于调动学生参与教学活动,课堂气氛活跃,教与学和谐。
13)善于运用理论分析,解决实际问题,有助于学生创新、自学能力的培养,渗透人文和思想教育,有助于学生综合素质的提高。
