当前位置:文档之家› 统计思维与典型案例的分析

统计思维与典型案例的分析

统计思维与典型案例的分析 东莞中学 庞进发
统计与概率是高中数学新课程的基础知识. 统计是研究如何合理收集、整理、分析数据的学科,它可以为人们制定决策提供依据. 随机现象在日常生活中随处可见,概率是研究随机现象规律的学科,它为人们认识客观世界提供了重要的思维模式和解决问题的方法,同时为统计学的发展提供了理论基础. 统计与概率的思想方法有助于培养学生以随机的观点来理解世界,形成正确的世界观与方法论,为以后进一步学习和工作做好准备. 在教学中,学生将通过解决实际问题,较为系统地经历数据收集与处理的全过程,体会统计思维与确定性思维的差异;结合具体的实例,加深对随机现象以及概率意义的理解.
在选修2—3这一模块中,学生将在必修课程学习的基础上,学习计数原理、统计案例和概率. 通过对典型案例的讨论,了解和使用一些常用的统计方法,进一步体会运用统计方法解决实际问题的基本思想,认识统计方法在决策中的作用.
统计学最关心的是:我们的数据能提供那些信息. 具体地说,面对一个实际问题,我们关心的是(1)如何抽取数据;(2)如何从数据中提取信息;(3)所得结论的可靠性.
案例1 回归分析
回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法. 我们知道,函数关系是一种确定性关系,而相关关系是一种非确定性关系.
求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm 的女大学生的体重.
作出散点图,得到回归方程是 712.85849.0ˆ-=x y
所以,对于身高172cm 的女大学生,由回归方程可以预报其体重为316.60ˆ=y
(kg )
案例2 假设检验
假设检验是利用样本信息,根据一定概率,对总体参数或分布的某一假设作出拒绝或保留的决断,即在论述H 不成立的前提下,有利于H 的小概率事件发生,就推断H 发生.
例2:某地区的羊患某种病的概率是0.4,且每只羊患病与否是彼此独立的,今研制一种新的预防药,任选6只羊做实验,结果6只羊服用此药后均未患病. 你认为这种药是否有效?
现假设“药无效”,则事件“6只羊都不患病”发生的概率为
0467.04.016
≈-)(,这是一个小概率事件. 这个小概率事件的发生,说明“药无效”的假设不合理,应该认为药是有效的.
案例3 独立性检验
独立性检验是对两种分类变量之间是否有关系进行检验.
例3:为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果:(吸烟与患肺癌列联表)
那么吸烟是否对患肺癌有影响?
由列联表可以粗略估计出:在不吸烟者中,有0.54%患有肺癌;在吸烟者中,有2.28%患有肺癌. 现在想要推断的论述是 H 0:吸烟与患肺癌没有关系
d
c c
b a a +≈
+,)()(b a c d c a +≈+,0≈-bc ad 构造一个随机变量
)
)()()(()(2
2
d b c a d c b a bc ad n K ++++-= 其中d c b a n +++=
在“吸烟与患肺癌没有关系”成立的条件下可以估算出
01.0)635.6(2≈≥K P , 05.0)841.3(2≈≥K P , 10.0)706.2(2≈≥K P .
案例4 聚类分析
聚类分析是根据研究对象(个体)的某些指标的数值特征,将对象进行分类的方法. 在聚类分析中,我们关心如何刻画点与点、类与类之间的“远近”,关心聚类的基本思想. 鼓励学生给出不同的刻画“远近”的办法,并能让学生认识到不同方法会得到不同的结果.
谱系聚类是一种逐次合并类的方法,最后得到一个聚类的二叉树聚类图。

其想法是,对于n 个观测,先计算其两两的距离得到一个距离矩阵,然后把离得最近的两个观测合并为一类,于是我们现在只剩了
1-n 个类(每个单独的未合并的观测作为一个类)。

计算这 个类两两之间的距离,找到离得最近的两个类将其合并,就只剩下了 2-n 个类……直到剩下两个类,把它们合并为一个类为止。

当然,真的合并成一个类就失去了聚类的意义,所以上面的聚类过程应该在某个类水平数(即未合并的类数)停下来,最终的类就取这些未合并的类。

决定聚类个数是一个很复杂的问题。

例4:如何对草莓、橙子、桃子、苹果、梨等5种水果进行分类?
可选取的指标:大小、形状、颜色、味道、各种维生素的含量等,既可以选取一个指标也可以选多个指标.。

相关主题