统计学原理( 相关分析)
科学的奠基者。他把数学和统计学方法运用于生物问题,创建了生物统计学,
且与高尔顿共同确定了心理问题的统计法为心理学的基本方法之一。他对生
物、行为和社会科学的研究作《出统计了学较原重理》的刘贡鑫献春 。
3
第七章第一节
第一节 相关分析的意义和种类
一、相关关系的性质
➢相关关系的概念和特点 ✓概念:相关关系是现象间客观存在的,但其
• 现象之间数量上不确定、不严格的依存关系。
注意:相关关系的全称为统计相关关系,相关 关系中一个变量虽然受另一个(或一组)变 量的影响,却并不由这一个(或一组)变量 完全确定。
《统计学原理》 刘鑫春
5
第七章第一节
➢相关关系与函数关系的区别和联系 (教材312)
✓ 区别:函数关系是变量之间的一种严格、完全确定性 的关系,即一个变量的数值完全有另一个(或一组) 变量的数值所决定、控制。通常可以用数学公式确切 地表示出来。相关关系一般不是完全确定的,它很难 用数学公式去进行表达。
• 皮尔逊的统计学的分析技术和方法,体现在其《统计学者和生物统计学者用
表》(1914)中,如频率分布、偏差度和峭度测量、轴线拟合、标准差检验、
相依系数、乘积动差相关系数r、类型的数学公式、双行、多重、多变元非线
性相关和概差偏差数,以及各种统计学的抽样分布等。他还发明了主要成分
分析,后由c.e.斯皮尔曼发展成心理统计学的因素分析。皮尔逊被称为统计
《统计学原理》 刘鑫春
9
第七章第二节
➢相关图: 相关图又叫散布图或散点图,是利用直角坐 标第一象限,用横轴表示自变量,纵轴表示 因变量,将两变量对应的值用坐标点描绘出 来,据以研究两变量间有无相关关系,及相 关的形态,方向和密切程度。
利用EXCEL展示如何绘制散点图
《统计学原理》 刘鑫春
10
第七章第二节
数值是不严格、不完全确定的相互依存关系。
注意:现象间可测定关系一般分为两种:一种 为函数关系,另一种为相关关系。相关关系 指现象之间客观存在但又不具有确定性的依 存关系。
《统计学原理》 刘鑫春
4
第七章第一节
✓特点:
• 现象之间确实存在数量上的相互依存关系。
注意:在表现现象相互依存关系的两个变量之 中作为根据的变量叫做自变量,随自变量变 化发生对应变化的变量叫做因变量。
表了关于指纹的论文和书籍,被认为对于现代利用指纹进行犯罪
搜查方面有很大的贡献。
《统计学原理》 刘鑫春
2
卡尔.皮尔逊 ( Karl ,Pearson,1857-1936)
• 英国统计学家。他的座右铭“我们无知,因此让我们努力” 。他入剑桥大学 学习数学、物理、哲学、宗教和法律,并取得律师资格,但以数学的优异成 绩在该校毕业。任伦敦大学应用数学教授时出版了论弹性以及有关科学哲学 的专著◇因阅读英国科学家f.高尔顿《自然遗传》(1889)一书,使其深受 影响,从而成为高匀顿的忠实学生,开始结合高尔顿关于人的变异、遗传和 优生学等问题来发展统计学的理论和方法。1894年起研究生物分布的常态性。 1901年与高尔顿、w.f.r.韦尔登联合创办《生物统计学》杂志,发表有关生 物学及心理学的定量研究成果。1904年被任命为伦敦大学高尔顿实验室的首 任主任,且第一个开设优生学讲座。1914-1930年撰写写出四卷本的高尔顿 传记《弗朗西斯·高尔顿的生平、学问和劳作》。
关系的表现形式。 ➢确定现象变量间相关关系的密切程度和方向。 ➢选择合适的数学模型 ➢测定变量估计值的可靠程度 ➢对计算出的相关系数,进行显著检验。
《统计学原理》 刘鑫春
8
第七章第二节 第二节 简单线性相关分析
一、定性分析
定性分析是相关分析的起点,即研究者根据 自己的专业知识,理论水平,实践经验和逻 辑推断来分析和判断事物之间有无相关,是 何种相关。
的研究结果,指出回归到平均值(regression toward the
mean)现象的存在,这个概念与现代统计学中的“回归”并不
相同,但是却是回归一词的起源。在此后的研究中,高尔顿第一
次使用了相关系数(correlation coefficient)的概念。他使用
字母“r”来表示相关系数,这个传统一直延续至今。同时他也发
✓ 联系:函数关系在实际工作中往往通过相关关系表现 出来。当人们对某些现象内部规律有较深刻认识时, 相关关系可能变为函数关系。为此,在研究相关关系 时,又常常使用函数关系作为工具,用一定的函数关 系表现相关关系的数量联系。
《统计学原理》 刘鑫春
6
第七章第一节
二、相关关系的种类
➢根据自变量的多少划分,可分为单相关和复 相关
有8个企业生产某种产品,月产量和生产费用的资料如下:
企业编号
123 456 7 8
月产量(千吨)x 1.2 2.0 3.1 3.8 5.0 6.1 7.2 8.0 生产费用(万元)y 62 86 80 110 115 132 135 160
生产费用(万 元)
200 150 100
50 0
0
8个企业月产量和生产费用的散点图
➢ 根据变量间相互关系的表现形式划分,直线 相关(或线性相关)和曲线(或非线性)相 关
➢根据相关关系的方向划分,可分为正相关和 负相关
➢根据相关关系的程度划分,可分为不相关、 完全相关和不完全相关
《统计学原理》 刘鑫春
7
第七章第一节 三、相关分析的主要内容 ➢揭示现象之间是否存在相关关系,以及相关
统计学原理 第七章
相关分析
《统计学原理》 刘鑫春
1
法兰西斯·高尔顿(Francis Galton,1822.2.16-1911.1.17.)
法兰西斯·高尔顿是查尔斯·达尔文的的表兄,
是一名英格兰维多利亚时代的文艺复兴人、
人类学家、优生学家、热带探险家、地理学
家、发明家、气象学家、统计学家、心理学
家和遗传学家。
高尔顿一生中发表了超过3在1883年率 先使用“优生学”(eugenics)一词。在他于1869年的著作 《遗传的天才》(Hereditary Genius)中,高尔顿主张人类的 才能是能够透过遗传延续的。
他在统计学方面也有贡献,高尔顿在1877年发表关于种子
系列1
2
4
6
8
10
产量(千吨)
《统计学原理》 刘鑫春
11
第七章第二节