● 摘要
近年来,随着科技的进步以及大数据的来临,数据挖掘需求越来越来广泛,从社交网络,多媒体到生物医疗,交通数据,随之而来的是数据挖掘技术的突飞猛进的发展,新的数据挖掘算法被提出,已有的数据挖掘算法被不断的完善,但是数据挖掘在传统行业上的应用还有待提高。
随着社会对于知识以及教育逐步的重视,越来的越多的人选择进入学校提升自己,伴随而来的是教育数据的不断积累。教学数据包含大量的学生信息,例如:学生家庭信息,学生在校成绩,学生毕业走向等,如何在教学数据中挖掘出更多有效的知识成为了急待解决的一个问题。
本文致力于研究数据挖掘算法在教学数据中的应用,主要工作包括:
(1)提出关联模式概念,并提出一种关联模式挖掘算法,对课程关联模式进行挖掘。针对数据挖掘中的关联分析(association rules)挖掘的主要缺陷,即产生大量的、离散型细节规则,本文首次提出了关联模式的概念,提出一种有效的关联模式挖掘算法,算法通过对大量的离散型关联规则进行整合、挖掘,生成一系列富含有价值信息的关联模式。本文以教学课程数据(课程及学生成绩)为依据,通过对关联模式的挖掘,发现课程间一系列有价值的关联信息,并在此基础上提出了一个应用实例,即课程关联度计算方法。通过真实教学数据实验验证,本文提出的关联模式能有效为用户提供便于解读和分析的整合型信息,并且,关联度计算方法能较好的反映课程间的关联关系。
(2)挖掘学科主流研究方向,以及分析课程体系与主流研究方向的支撑关系。本文提出一种新的以主题模型为基础的挖掘算法,以学科开设的课程(选修课、必修课)以及学生的选课与成绩数据为依据,挖掘以学科的主流研究方向为核心的层次式课程支撑关系。众所周知,各大学的专业学科,都存在其独特的研究特色和优势研究方向。在本论文中,我们首次提出了以课程数据挖掘为依据的定量分析方法;通过对真实教学数据进行实验,我们发现,该方法能有效挖掘出学科的主流(优势)研究方向,并清晰展现学科课程体系与主流研究方向的支撑关系。