当前位置:文档之家› web网络学习系统设计

web网络学习系统设计

自学考试毕业论文(设计)题目(中文):基于Web挖掘的个性化网络学习系统设计(外文):Design and Realization of Personalized Learning System Based on WEB Mining 院(系):专业:学生姓名:准考证号:指导教师:2015年 5 月 9 日毕业论文诚信声明本人郑重声明:所呈交的毕业论文《》是本人在指导老师的指导下,独立研究、写作的成果。

论文中所引用是他人的无论以何种方式的文字、研究成果,均在论文中以明确方式表明。

本声明的法律结果由本人独自承担。

毕业论文作者签名:年月日目录1.引言 (4)1.1 研究背景及意义 (4)1.2国内外研究现状 (2)1.3主要研究内容 (3)1.4论文结构 (3)2.基于Web挖掘的个性化网络学习系统及相关技术 (4)2.1体系结构 (4)2.2 Web个性化技术 (5)2.2.1 Web挖掘的定义 (5)2.2.2 Web挖掘的分类 (5)2.3 Web挖掘中常用的技术 (6)2.3.1 Web内容挖掘中常用的技术 (6)2.3.2 Web结构挖掘中常用的技术 (6)2.3.3 Web使用挖掘中常用的技术 (7)2.4 个性化 (8)2.4.1 改进系统性能和结构 (8)2.4.2 页面推荐 (8)2.4.3 个性化学习系统 (8)2.4.4个性化服务系统的关键技术 (9)2.5 基于Web挖掘的个性化学习系统模型构架 (9)3. Web挖掘的预处理 (9)3.1 Web挖掘的基本流程 (9)3.1.1数据采集 (10)3.1.2数据预处理 (10)3.1.3 模式识别 (11)3.1.4 模式分析 (11)4.个性化网络学习系统的设计与实现 (11)4.1传统的网络学习系统 (11)4.2 基于Web挖掘的个性化网络学习系统模型设计 (11)4.2.1系统的运行环境和主要开发环境 (11)4.2.2构建个性化的网络学习模型 (11)4.2.3网络学习个性化推荐原型系统框架 (12)4.2.4网络学习个性化推荐原型系统结构分析 (12)5.总结 (12)参考文献 (13)基于Web挖掘的个性化网络学习系统设计摘要:文章分析网上每个学习者的个性化需求,提出基于Web挖掘技术的个性化系统框架。

对Web使用挖掘关键算法进行了研究,设计了一种基于Web挖掘的个性化网络学习系统,该系统给出了Web内容挖掘、Web使用挖掘和Web结构挖掘的结果并结合其推荐结果为学习者提供了个性化的服务,并给出了推荐算法。

关键词:Web挖掘;个性化;学习;系统模型1.引言1.1 研究背景及意义目前我国采用的是传统的教育制度,教育模式主要是老师讲,学生听。

为了应试,学校在授课过程中过分强调以知识的传授为中心,只重视教师在课堂中的作用,遏制了学生的创造性,忽视了学生学习的主动性和学习潜力的开发。

学生往往都是为考试听课,为考试学习,毕业后仍然茫然,例如计算机专业的学生所学知识已经或正在被淘汰,即使没有被淘汰,因为实践能力太弱所学知识不能很好的应用于工作中。

因此现代大学生需要一个开阔视野的平台,如可以进行专业学习的网站的出现(这就是下面为大家讲解基于Web挖掘的个性化学习网络)。

作为计算机专业的学生因为计算机时代的来临,其发展需求使计算机专业学生对就业很自信,但计算机技术发展速度飞快,专业迫使计算机专业学生必须走在时代前端,但所学知识越多到最后被淘汰的就越多,在这样的教育体制下,学生不得不自己寻找新的学习模式,例如看计算机专业的新书或刊物,但昂贵的费用不是一个普通大学生所能承担的。

因此学生的学习因经济能力而闭塞,使学生十分焦急,求知心不能得到满足更何况实践能力的培养。

所以大学生需要借助网络,通过网上的各渠道来扩展知识面,学习新知识,知道最新的科技动向。

1.2国内外研究现状目前Web挖掘技术的应用侧重于商业领域的大数据量应用,在教学领域应用的起步相对较晚,并且数据挖掘技术在教学领域的应用与在商业领域中的应用既有相同点也有不同点。

国际学术研究领域中,如何充分有效地队Web数据进行存储和查询,分析提取用户特性并向用户提供个性化学习的网络学习平台已经成为Web 技术的一个研究热点,并且已有一些研究着获得了研究性和实践性的成果。

1.3主要研究内容Web挖掘的处理模型主要是由数据采集、数据预处理、模式识别(数据挖掘算法实施)、模式分析四部分组成在本文的研究中,以目前国内外的Web挖掘已有的学术以及应用成果为基础,以Web挖掘技术为出发点,结合世家的应用对Web挖掘的数据预处理和模式识别进行研究分析,设计了一个基于Web挖掘的个性化学习系统。

论文主要展开了以下几个方面的研究工作:(1)研究Web特征提取中所有涉及的数据特征,对数据来源、数据类型进行分析,对Web日志进行数据预处理。

(2)分析现有的用户访问兴趣的度量方法,基于注册信息建立初始的拥有—资源兴趣评分矩阵,根据用户对页面的访问时间进行用户兴趣度得度量,以此为基础实时更行用户—资源评分矩阵,全局和近期局部相结合,体现用户—资源兴趣度。

(3)基于Web站点的拓扑结构,分析教学资源的组织结构,并通过和测试工具分析用户的学习情况,以这些作为数据源,进行基于内容的过滤处理,产生基于内容的信息推荐集。

(4)针对现有的协同过滤算法的可扩展性问题,系统采用了离线与在线两部分处理方式,首先在离线状态下,基于用户——资源评分矩阵采用K-means算法对用户进行聚类,有效缩小协同过滤同过滤的相关性计算空间,以聚类结果为基础,在线时对目标用火在同一簇内进行基于用户的协同过滤处理,产生目标用户的最近邻居序列,通过最近邻居对资源的评分来预测目标用户对目标资源的预评分,以此为依据形成基于用户端额协同过滤信息推荐集合。

1.4论文结构本文共分为六段。

第一段引言,对论文的研究背景、意义、现状、挑战以及研究的内容和目的进行阐述。

第二段基于Web挖掘的个性化网络学习系统及相关技术介绍。

首先给出了Web挖掘的个性化网络学习系统的体系结构;在介绍了Web个性化技术、Web挖掘的分类模式、Web挖掘等内容;在次将个性化服务引入到个性化学习中,介绍了个性化学习的涵义、推荐过程和技术;最后分析了基于Web日志挖掘的个性化系统模型结构。

第三段Web挖掘的预处理研究。

介绍了Web挖掘的数据来源、数据特点;分析了Web挖掘的数据预处理流程。

第四段基于Web挖掘的个性化推荐模型。

第五段总结,对论文进行概括性总结简述了系统的工作成果及需要完善的问题,对个性化学习系统给予美好的憧憬,还对Web挖掘技术寄于很高的使用前景。

最后,列出了本文相关的参考文献。

2.基于Web挖掘的个性化网络学习系统及相关技术2.1体系结构基于Web挖掘的个性化网路学习系统的体系结构如图2所示。

该系统主要分为两大部分:离线部分和在线部分。

离线部分由个性化处理模块,各种教学资源和网路Web站点结构及用户使用信息组成。

该部分主要对各种数据记性预处理并进行Web内容挖掘(Web content mining)、Web使用挖掘(Web usage mining)、Web结构挖掘(Web structure mining)来得到相应特征。

在线部分的功能主要是根据学习者的登录信息和Web挖掘的结果向学习者推荐个性化学习资料。

图2个性化处理模块式实现个性化网络学习系统的核心部分,主要有三部分组成:Web内容挖掘模块、Web使用挖掘模块、Web结构挖掘模块。

Web内容挖掘模块主要是根据学习站点的各种资源进行聚类以获得页面的内容特征。

2.2 Web个性化技术2.2.1 Web挖掘的定义Web挖掘是利用数据挖掘技术从Web文档及Web服务器中自动发现并提前人们感兴趣的信息。

它是一门综合性技术,涉及到Internet技术、人工智能技术、计算机语言学、信息学、统计学等多个领域。

2.2.2 Web挖掘的分类Web挖掘是一个具有挑战性的课题,它实现对Web存取模式、Web结构和规则以及动态的Web内容的查找。

一般地可分为三类:Web内容挖掘、Web使用挖掘、Web结构挖掘。

在前面Web的体系结构中有介绍过。

在这里我给大家具体介绍下这三种方法如图4,并对其进行比较。

图4 Web挖掘分类一、 Web内容挖掘Web内容挖掘主要是针对组成页面的各种非结构化地数据,如文本数据、音频数据、视频数据、图形、图像数据等多种数据相融合的多媒体数据进行挖掘。

Web内容挖掘的重点是页面分类和聚类。

Web页面的分类是根据页面的不同特征,将其规划为事先建立起来的不同的类。

Web页面的聚类是指在没有给定主题类别的情况下,将Web页面集合聚成若干个簇,并且同一簇的页面内容相似性尽可能大,而簇之间的相似度尽可能小。

二、 Web结构挖掘Web结构挖掘是从Web站点的组织结构、Web文档结构及其链接关系中推导知识。

由于超文本文档的关联关系,使得WWW不仅可以揭示文档中所包含的信息,同时也以揭示文档间的关联关系所代表的信息,反应了文档指间的额某种联系,同时还能体现某个页面的重要程度。

三、 Web使用挖掘除了Web结构挖掘和Web内容挖掘,Web挖掘的另一个重要任务是Web使用挖掘,它通过分析和探究用户访问记录中的规律,可以识别远程教育学习网站的潜在客户,增强对最终学习用户的远程学习信息服务的质量,并该进Web服务器系统的性能和结构。

2.3 Web挖掘中常用的技术2.3.1 Web内容挖掘中常用的技术就其方法而言,Web内容挖掘可以分为两大类:信息查询 (Information Retrieve, IR)方法和数据库方法。

IR方法主要应用IR技术,评估和改进搜索信息的质量,也可以处理无结构化数据和HTML标记的半结构化数据,主要应用于文本分类、聚类和模式发现等。

数据库方法和数据仓库方法都是采用数据抽取和转换的方法将非结构化的Web信息转换或映射为结构化的数据,再采用数据挖掘技术进行信息挖掘。

2.3.2 Web结构挖掘中常用的技术一、选择链接策略在互联网的海洋中,最重要的就是互联互通,不被其他网站引用的网站就是“信息孤岛”。

WEB结构挖掘引擎所有算法都将网页中的链接作为主要挖掘的对象,特别是实际应用中,大多数用户都是使用基于PageRank算法的Google, Yahoo,Baidu都搜索引擎,因此可以采取以下几种策略,提高网站的排名。

1)广泛链接策略来自其他网站的任何反相链接都是有用的。

当前常见的新搜索引擎已经不再只是网站目录的索引,而是更全面的网页索引,所以无论来自其他网站任何地方的反相链接都是非常有价值的。

同时如果一个网页只有大量的进入链接,而缺乏导出链接,也会被搜索引擎认为是没有价值的站点。

相关主题