DOI:10.3969/j.issn.1007-1423.2019.17.006
基于用户协同过滤算法的E-Learning平台个性化推荐研究
耿晓利,邓添文,罗桦锋,许佳惠
(广州大学华软软件学院网络技术系,广州510990)
摘要:
在线学习(E-Learning)是一种深受欢迎的学习方式,但由于其资源众多,用户选择学习资源时无从下手,消耗掉较多的寻找时间。因此,根据用户的需要向其精准推荐课程是十分有必要的。通过挖掘E-Learning平台的用户数据特点,实现基于用户协同过滤的个性化课程推荐,实验结果显示,可以较好地帮助用户快速发现有价值的学习资源,减少选择资源的时间,有利于提高用户的学习效率,也可帮助用户快速良好地建立自身的知识体系。关键词:
E-Learning;协同过滤;个性化推荐基金项目:
2017年广东省重点平台及科研项目(No.2017GXJK257);2018年大学生创新创业训练计划项目(No.201812618036)
0引言
化推荐。Chu等人[1]基于Apriori算法设计出一个基于议。Aher等人[2]在K-means算法聚类的基础上,应用
2012年,一种基于网络、针对大众人群的大规模开放在线课程(MassiveOpenOnlineCourses,MOOC)出现并发展很快,在线学习(E-Learning)成为一种深受欢迎的学习方式。在线学习平台将教学者和学习者的行为完整记录,产生了大量连续的教学互动信息。而深入挖掘这些数据,研究学习者的学习行为和学习心理,可以反映出学习者的学习状况,有利于提高学习者学习效果和学习质量,同时有利于向学习者针对性推荐课程,满足个性化需求。
目前的E-Learning技术大多是均质化的,忽略了E-Learning平台用户之间的差异,无法满足用户对学习的个性化需求,致使大量的时间都花费在课程的查找中。而丰富的、多样化的学习资源也容易让E-Learning平台的用户产生认知超载和迷茫的现象。根据用户特点为其提供课程推荐服务,帮助用户快速地发现有价值的学习资源,能快速提高E-Learning效率,同时帮助用户快速构建专业知识体系。
Web的课程推荐系统,为面临选课的学习者提供建Apriori算法对各类学生的课程学习记录进行关联规则分析,得到各类学生偏好的课程学习顺序,从而向学生推荐合适的课程。
我国对网络学习中进行个性化推荐的研究起步较晚,学习者的体验程度不高。柴艳妹等人[3]对2008年到2016年中有关基于数据挖掘技术的E-Learning行为的文献进行综述,指出大多数研究者主要研究热点是学习者对E-Learning平台的接受程度,而把数据挖掘应用到E-Learning平台的研究较少。孙歆等人[4]引入用户行为权重问题解决了冷启动问题。王琳琳[5]利用Web日志挖掘和系统操作信息收集结合的方式,建立学习者兴趣模型,将用户聚类加入到推荐算法中,实现个性化资源的推荐。谢修娟等人[6]基于协同过滤技术设计并实现了一个个性化推荐系统。
Learning平台传统的课程学习、作业管理、成绩查询的
伴随着E-Learning平台资源的海量增加,E-
1E-Learning研究现状
国外研究者很早就开始重视网络学习领域的个性
功能己经不能满足学习者需求,个性化资源推荐可以帮助学习者更好地循序渐进学习、自我管理,提高个性
现代计算机2019.06中
研究与开发化资源推荐为核心的服务将越来越紧迫。
2
基于用户的协同过滤个性化课程推荐的实现
协同过滤推荐算法主要有三种:基于项目的推荐、
基于用户的推荐、项目和用户结合的推荐。基于用户的协同过滤算法能够共享其他用户的经验,避免推荐内容的片面化,也可以发现用户的潜在兴趣,并针对各个用户产生个性化的推荐结果。
结合所收集到的数据特点及学生用户在专业方向的相似性,本文拟将基于用户的推荐算法应用到帮助其更好地循序渐进学习课程,E-Learning平台中,为学习者实现个性化的课程推荐,
快速建立自己的知识体系。
2.1算法基本原理
针对选取的E-Learning平台的数据特点,本文采用基于用户的协同过滤推荐技术。通过用户的历史行为数据发现用户对课程或内容的喜欢,并对这些喜好进行度量和打分。根据不同用户对相同课程或内容的态度和偏好程度计算用户之间的关系。在有相同喜好的用户间进行课程推荐。算法的基本原理如图1所示。
图1基于用户的协同过滤基本原理
图1中,如果用户1和用户3用户同时选修了课程2和课程3两门课程,并且课程评分均为5分,则可以认为用户1和用户3属于同一类用户。可以将用户1学习过的课程本算法的流程图如图1和课程42也推荐给用户所示。
3。
图2算法流程图
2.2数据处理
本文实验所搜集的数据源为笔者所在学校的学生在E-Learning平台的学习数据,包括课程数据、选课数据、成绩数据及课程评论数据等。其中用户数据包括学号、姓名、出生日期、年级、专业方向、学历、兴趣特长、手机号、宿舍等信息;课程数据有课程名称、课程简介、相关视频及文档资料信息;用户学习课程数据包括考试成绩数据及用户对课程的评论数据。
本文对收集到的原始数据进行处理,将用户的学号、姓名、手机号等敏感信息脱敏处理,部分用户数据如表1所示。
表1用户数据
对课程的代码信息进行删除处理,对课程简介信息删减,展示主要内容,部分课程数据如表2所示。
表2课程概要表
现代计算机2019.06中
研究与开发用户学习课程后产生了成绩数据和评论数据。成绩数据能反映学生学习课程的效果,成绩的高低一定程度上能反映学生对课程的兴趣程度。学生对课程的评论数据里,有对课程的评论,也有对授课教师的评论,反映课程的兴趣度相对较为狭隘。本文认为,用户参与课程学习获取的测试成绩越高,说明对此课程的学习效果越好,用户对课程的兴趣程度越高,对课程的评分也越高。
本次实验主要对用户的成绩数据进行转换,最终生成评分表,如表3所示。
表3用户评分数据
2.3算法实现
本文实现的基本思路为:首先分析数据,建立用户-课程评分矩阵模型,接着通过计算用户对课程评分之间的相似性,寻找目标用户的最近邻居,最后根据最近邻居的评分向目标用户产生推荐课程。
(1)建立“用户-课程”评分矩阵
根据用户对课程学习后的测试成绩作为评分数据,建立用户-课程评分矩阵,如表4所示。用户-课程评分矩阵是一个mÍn矩阵,m表示用户数,n表示课程数,m[i]n[j]表示第i个用户对第j门课程的评分。
表4用户-课程评分矩阵
(2)计算相似度
设N(i)为用户i评分的课程集合,N(j)为用户j评
分的课程集合,那么i和j的相似度Wij所示。
值如公式(1)wij=
||NN((ii))|∩×N|N((j)j|)|(1)
本文采用修正的余弦相似性方法,通过减去用户对课程的平均评分来修正不同用户的评分尺度问题。
现代计算机2019.06中
设用户i和用户j共同评分的课程集合用Nij用户i和用户W∑---∑j之间的相似度值W表示,则--mϵN---ij(S-(S--ij如公式(2)所示。
i,m--------Si-S-----)(--Sj,m------Sj------)
ij=---(2)
i,mimϵNi
)2
∑(Sj,mmϵNj
--Sj)2其中,评分,-SS-i,m、Sj,m分别表示用户i、用户j对课程m的i、Sj分别表示用户i、用户j对课程评分的平均分。
(3)产生推荐列表
从矩阵中找到与目标用户最相似的K个用户,用集合S(u,K)表示,将S中用户感兴趣的课程提取出来,并去除u已经兴趣或已学过的课程,对每门候选课程i,用户对它的感兴趣的程度用以下公式计算:
p(u,i)=其中Rvi∑S(u,K)∩N(i)Wuv表示用户v*对课程Rvi
(3)
i的兴趣程度。3实验结果分析
本文使用准确率来验证推荐的质量。推荐的准确
率计算公式为:
Pre=
test∩topN
N(4)其中test表示测试数据集中的课程数量,topN表示系统推荐给用户的N个课程。
本文选取实验数据主要为学院理工科部分学生,共获取369个用户数据、549门课程数据及16721条评分数据。实验结果如图3所示。
图3算法的准确率
由图3可知,随着邻居数量K值的变化,准确率也在变化。在一定范围内,邻居数量K值越大,推荐的准确率越高。本实验中,邻居数量K值在50时,准确率趋于平稳。
研究与开发对于新来的用户,其没有选课记录,无法找到最近邻居。本文从用户的专业方向和兴趣爱好出发,把高年级学生兴趣的课程推荐给该用户,以此来解决冷启动问题。
限于学生,算法考虑的因素较少,有一定的局限性。在下一步的研究中,把以下因素纳入考虑:用户修读课程的轨迹线、课程之间的序列关系、课程之间的相似性等,同时结合用户的评论文本数据。在推荐效果上评价指标也不单看准确率,还有MAE值等。根据用户的兴趣实现更为精确的个性化推荐的同时,从用户的角度出发给用户提出相对应的发展路线,是进一步的研究方向。
4结语
本文实现了基于用户的协同过滤算法在E-Learn⁃
ing平台的个性化推荐课程。但由于其服务的用户局
参考文献:
[1]ChuK,ChangM,HsiaY.DesigningaCourseRecommendationSystemonWebBasedontheStudents'CourseSelectionRecords.Proc.[2]AherSB,LoboLMRJ.CombinationofMachineLearningAlgorithmsforRecommendationofCoursesinE-LearningSystemBasedon[3]柴艳妹,雷陈芳.基于数据挖掘技术的在线学习行为研究综述.计算机应用研究.2018.35(5):1287-1293.[5]王琳琳.基于协同过滤的在线学习个性化推荐技术研究.微型电脑应用,2017,33(5):49-51.HistoricalData[J].Knowledge-BasedSystems,2013,51(1):1-14.
ofWorldConferenceonEducationalMultimedia,HypermediaandTelecommunications,2003:14-21.
[4]孙歆,王永固,邱飞岳.基于协同过滤技术的在线学习资源个性化推荐系统研究.中国远程教育,2012,8:78-82.[6]谢修娟.基于协同过滤技术的在线学习个性化推荐系统研究.电脑知识与技术,2018,14(3):173-176.作者简介:
耿晓利(1982-),女,河南洛阳人,硕士,讲师,研究方向为数据库开发、数据分析与数据挖掘邓添文(1983-),女,四川乐至人,本科,研究方向为高教研究、教育数据挖掘收稿日期:2019-04-03
修稿日期:2019-04-10
ResearchonPersonalizedRecommendationofE-LearningPlatformBasedon
UserCollaborativeFiltering
GengXiao-li,DENGTian-wen,LUOHua-feng,XUJia-hui
(DepartmentofNetworkTechnology,HuasoftwareCollege,GuangzhouUniversity,Guangzhou510990)
Abstract:
E-learningisapopularlearningmethod,butbecauseofitsmuchofresources,userscan'tgetstartedwhentheychoosetolearnresources,andtheyconsumemoretimetofind.Therefore,itisverynecessarytoaccuratelyrecommendcoursesaccordingtotheneedsofusers.ByminingthecharacteristicsofuserdataofE-learningplatform,implementsthepersonalizedcourserecommendationbasedonusercollabor⁃ativefiltering.Theexperimentalresultsshowthatitcanhelpusersquicklyfindvaluablelearningresourcesandreducethetimeforselect⁃ingresources,improveuserlearningefficiency,andhelpusersquicklyandwellestablishtheirownknowledgesystem.Keywords:
E-Learning;CollaborativeFiltering;PersonalizedRecommendation
现代计算机2019.06中
因篇幅问题不能全部显示,请点此查看更多更全内容