当前位置:文档之家› 《智能信息处理》实验

《智能信息处理》实验

《智能信息处理》实验指导书
实验一 Python语言编程基础实验
一、实验目的
本课程的主要内容《机器学习》中的代码均使用Python语言编写,而且Python语言具有编写效率高、使用简便、大量科学函数运算支持等等的优点,非常适合作为科学计算的编程语言。

因此,本实验的目的是让学生熟悉Python 语言的基本操作。

二、实验内容及要求
本实验的内容请参照附件电子书《Python编程入门经典》,并按下面步骤要求完成:
1、安装Python2.7和numpy工具包。

2、阅读第1~3章的基本Python语言部分,注意与C++语言和java语言对比区
别。

3、完成第3章的课后作业,Page45,第3、5、7、9小题。

4、阅读第4章,完成Page65,第3、4小题。

5、阅读第5章函数,完成Page84,第3小题。

三、实验报告要求
由于本实验为编程基础训练,因此实验报告无需给出整个完整程序的代码,只需写出关键的核心语句或者函数即可。

实验二 k近邻算法和决策树算法实验
一、实验目的
(1)熟练掌握K-近邻算法和决策树算法;
(2)能使用K-近邻算法和决策树算法解决实际问题。

二、实验内容及要求
按下面步骤要求完成实验:
1、阅读课本第2章“使用k近邻算法改进约会网站的配对效果”和“手写识别
系统”两个k近邻算法实例,要求对每一条Python语句均清楚了解其语法和用法。

2、阅读课本第3章“海洋生物分类”和“预测隐形眼镜类型”两个决策树算法
实例,要求对每一条Python语句均清楚了解其语法和用法。

3、每人独立为一组,设计一个k-近邻算法的应用实例。

其实分类的实例遍布我
们的日常生活,同学们只需要动动脑筋就可以发现很多可以应用k近邻算法来解决分类的问题。

实例所需的数据可以从网络下载,如果下载有困难也可
以自行虚拟数据(但必须合理,而且尽可能贴近实际)。

实例数据应包括两部分——样本数据和其对应的分类,如果实例数据有100份,可将其中随机的90份作为训练样本,10份作为测试样本。

4、每人独立为一组,设计一个决策树算法的应用实例。

基本要求与上面第3点
相同。

三、实验报告要求
本实验报告只需撰写上面的第3和第4两个内容。

并要求
(1)必须有文字描述设计的应用实例的意义。

如已知什么数据?预测(或分类)什么结果?
(2)介绍实例数据的来源,网上下载的数据:要有链接;别人曾经做过的实验:要有文献引用;自己虚拟的数据:要有数据产生的函数。

(3)所使用的k近邻算法和决策树算法,a)如果与课本的例子完全一样则无需在报告中重复打印,但需说明为什么无需更改即可使用。

b)如果使用的算法代码与课本的例子有更改,则对每句不同的地方解释说明更改的原因。

c)如果整个算法大部分发生变更,则在实验报告中附上整个算法的代码,并解释为何课本的算法不适用。

(4)每人必须独立设计实例,不得与其他同学合作共享数据,一经发现有同学的实例和数据完全相同,则均被判抄袭。

(提示:实例很容易不同,稍转换一下应用场景即可,但数据不能相同)
实验三朴素贝叶斯算法和Logistic回归算法实验
一、实验目的
(1)熟练掌握朴素贝叶斯算法和Logistic回归算法;
(2)能使用朴素贝叶斯算法和Logistic回归算法解决实际问题。

二、实验内容及要求
按下面步骤要求完成实验:
(1)读懂课本的实例,使用朴素贝叶斯算法过滤垃圾邮件。

(2)改变朴素贝叶斯算法训练集和测试集的数量,观察结果有什么变化?请分析和说明为什么会出现不同的结果?
(3)读懂课本的“非随机梯度上升”和“随机梯度上升”两种Logistic回归算法。

使用课本的数据集进行训练并绘图。

(4)使用“随机梯度上升”Logistic回归算法,分别测试不同的迭代次数,并记录下不同迭代次数算法的结果,观察这些结果的区别(可参考课本P82-84的分析),请分析和说明为什么会出现不同的结果?
三、实验报告要求
本实验报告只需撰写上面的第2和第4两个内容。

要求:
(1)用列表的形式对比不同的训练集/测试集数量与结果,并分析原因。

(2)用列表或图形的形式对比不同的迭代次数与结果,并分析原因。

实验四支持向量机算法和AdaBoost元算法实验
一、实验目的
(1)熟练掌握支持向量机算法和AdaBoost元算法;
(2)能使用支持向量机算法和AdaBoost元算法解决实际问题。

二、实验内容及要求
按下面步骤要求完成实验:
(1)读懂课本的实例,使用简化版的SMO算法处理小规模数据集。

(2)分别改变常数C和maxIter,观察结果有什么变化?请分析和说明为什么会出现不同的结果?
(3)使用课本的完成版SMO算法,对比与简化版的SMO算法有什么区别?(4)读懂课本的AdaBoost元算法例子。

使用课本的数据集进行训练。

(5)前面实验二和实验三当中,有没有哪些数据集也可以用于AdaBoost元算法来进行分类的?请尝试其中一种数据集。

三、实验报告要求
本实验报告只需撰写上面的第2和第5两个内容。

要求:
(1)用列表的形式对比不同的常数C和maxIter的结果,并试分析其原因。

(2)用列表或图形的形式对比使用AdaBoost元算法和之前其他算法的结果,并试分析其原因。

相关主题