当前位置:
文档之家› 第1章 统计数据的收集与整理
第1章 统计数据的收集与整理
连续型数据频数(率)表和频数(率)图的编绘: 连续型数据的制表过程: Step 1:确定组距; Step 2:将数据分组,一般来说将数据分成10~15组为
宜(样本含量:组数,30~60:6~8,60~100:7~10,
100~200:9~12,200~500:12~17,500以上:
17~30); Step 3:确定组限、组界。
0.94 0.69
0.96 1.14 0.79 1.03 1.05 0.95 0.93 1.00 1.06 0.65 0.93 0.99 1.10 0.73 0.94 1.03 1.02 0.93 0.90 1.22 0.82 1.02 0.53 1.00
0.88 0.88
0.87 1.00 1.04 1.12 0.73 1.08 0.96 0.64 0.92 1.00 1.37 1.04 1.13 0.93 1.17 1.18 0.93 0.98 1.00 1.02 1.02 0.95 1.10 0.82
1.15
1.07 1.19
1.17 1.18
1.35 0.85 1.13 1.21
1.08 1.02
1.21 1.06 1.38 1.20
1.10 1.01
0.80 0.95 1.22 0.88
1.06 0.78
0.95 1.45 1.33 0.97
1.03
1.18 0.85 0.85 1.00 0.72 0.99 1.20 1.04 0.76 0.90 1.03 0.98
体重,则不可能拿到全部数据,因为新生儿不断出生。
由此可见,只能从全部研究对象(总体)中抽出一部分 个体(样本),通过这一部分个体推断全体的情况。
1.1.2 总体与样本
统计学研究的核心问题是如何通过样本来推断总体。 总体(population),又叫“统计总体”,是指一个统计问题研 究对象的全体,是具有某种(或某些)共同特征的元素的集合。 总体又分为无限总体( infinite population )和有限总体(finite population)。 无限总体:某种条件下生长的小麦的株高、新生儿体重。 有限总体:一所学校今年新生的身高。 统计学中所遇到的总体多数都是无限总体、动态总体和假想总 体。构成总体的每个成员称为个体(individual)。 样本(sample)是总体的一部分,样本内包含的个体数目称为 样本含量(sample size)。
样,这种抽样方式可能会重复抽中某一个个体;(2)
非放回式抽样(sampling without replacement) , 从总体中抽出个体后,不再放回。
1.2 数据类型及频数(率)分布
1.2.1 连续型数据和离散型数据
1.2.2 频数(率)表和频数(率)图的编绘 1.2.3 研究频数(率)分布的意义 1.2.4 频数(率)分布的不恒定性
• 主要内容 :
第一部分 ,概率与统计基础:统计数据的收集与整 理;概率和概率分布;常见概率分布;抽样分布; 统计推断;参数估计;拟合优度检验;期中考试。 第二部分 ,环境科学与生态学常用统计方法与实验 设计:单因素方差分析;双因素及多因素方差分 析;一元回归及简单相关分析;多元回归及复相 关分析;非参数统计;实验设计;期末考试。
1.2.2 频数(率)表和频数(率)图的编绘
离散型数据频数(率)表和频数(率)图的编绘: 例1.1 调查每天出生的10名新生儿中,体重超过3 kg的人数,共调查120天。 每天的10名新生儿中,体重超过3 kg的人数,可 能有11种情况:0、1、2……10人,如表1-1的第一列, 称为组值(class value)。 对每组的人数计数,得到频数,或将各行的结果 除以总数得出频率(将某一类别的数目除以总数)。 把频数或频率按超过3 kg的人数的顺序排列,得 到频数分布(frequency distribution)或百分率分布 (percentage distribution)。 频数表可以比较清楚地描述数据变化规律。
数理统计(生物统计学) Mathematical Statistics ( Biostatistics)
• 课程性质、目的与任务
本课程是环境科学与生态学本科生的专业必 修课,是统计学在环境科学与生态学中的应用。 环境科学与生态学的研究经常涉及到大量的实验 和采样数据,本课程旨在培养学生掌握进行数据 整理、分析和解释的常用统计方法。
19
39 34 10
0.158
0.325 0.283 0.083
10
总计
31200.025源自0.999为更直观地描述数据变化规律,可绘成频数图
50 40
频 30 数 20
10
0
0 1 2 3 4 5 6 7 8 9 10
组别(体重超过3kg的人数) 图1-1 频数图,柱形图(column diagram)。 横轴表示每10名新生儿中,体重超过3 kg的人数, 纵轴表示每一组的频数。若将纵轴改为频率的话,则得 到频率图。频率图和频数图的图形完全一样。
0.92 0.99
0.81 1.26 1.32 1.17 0.94 0.89 1.19 0.92 0.94 0.95 0.59 1.21 1.10 0.95 1.16 1.11 1.02 1.10 1.01 1.09 1.50 0.81 0.85 1.07
1.21 0.83
0.74 0.96 1.13 0.90 0.88 1.10 0.95 1.05 0.98 1.06 0.91 0.88 1.04 0.94 0.99 1.05 0.89 1.36 1.01 0.88 0.92 0.97
1.10 0.95
0.94 0.61 1.00 1.27 1.00 0.69 1.10 0.62 1.13 0.80 1.00 1.27 0.79 1.22 1.11 0.75 0.98 1.13 1.04 0.93 0.92 1.08
0.94 1.13
1.18 1.00 0.97 0.94 0.99 1.13 1.07 0.88 0.84 0.94 0.87 1.04 1.11 1.11 1.08 0.95 0.99 1.04 0.85 0.97 1.00 1.01
1.2 数据类型及频数(率)分布
1.3 样本的几个特征数
1.1 总体与样本
1.1.1 统计数据的不齐性
1.1.2 总体与样本 1.1.3 抽样
1.1.1 统计数据的不齐性
即使从同一类对象中所得到的数据也不完全相同。 例如,(1)考察我国18岁男青年身高,由于个体间存在 着变异,从理论上讲,应当测量全国18岁男青年,用其平均数 来代表身高数值,但这是很难做到的;(2)考察所有新生儿
1.08 1.23
0.61 1.28 1.08 1.01 0.97 1.32 1.20 0.94 0.99 0.91 0.79 0.90 0.91 0.84 1.11 0.52 0.88 0.80 1.09 0.80 1.08 1.21 1.25 0.81
0.93
0.90 1.00 1.09 1.01 1.16 0.96 0.87 0.71 0.99 1.00 0.80 1.10
表1-1 每10名新生儿中体重超过3 kg的人数的频数(率)表
组值 (体重超过3 kg的人数) 0 1 2 3 4 5 — 丅 正正丅 频数计算 0 0 0 1 2 12 频数 频率 0.000 0.000 0.000 0.008 0.017 0.100
6
7 8 9
正正正
正正正正正正正 正正正正正正 正正
0.88 0.89
0.93 0.93 0.94 0.95 0.97 0.97 1.00 1.00 1.01 1.01 1.03 1.03 1.06 1.06 1.09 1.09 1.12 1.12 1.17 1.18 1.22 1.22 1.36 1.37
0.89
0.93 0.95 0.97 1.00 1.01 1.03 1.06 1.10 1.13 1.18 1.23 1.38
表1-3 黑莲子单粒重排序结果
0.52
0.75 0.81
0.53 0.59
0.75 0.76 0.82 0.82
0.61 0.61
0.78 0.79 0.83 0.84
0.62 0.64
0.79 0.79 0.84 0.85
0.65
0.80 0.85
0.69 0.69
0.80 0.80 0.85 0.85
0.92 0.92 0.94 0.94 0.96 0.96 0.99 0.99 1.00 1.00 1.02 1.02 1.04 1.05 1.08 1.08 1.11 1.11 1.16 1.16 1.21 1.21 1.32 1.32
0.88 0.88
0.92 0.92 0.94 0.94 0.97 0.97 0.99 0.99 1.01 1.01 1.02 1.03 1.05 1.05 1.09 1.09 1.11 1.11 1.17 1.17 1.21 1.22 1.33 1.35
为检验对基本方法的掌握情况,考试为笔试闭卷,需带计算器
(如为手机,只能用作计算器),不能带书本和可存储阅读文 件的工具如电脑、ipad、存储与课程有关文件的手机等,为减 少背的内容,试卷会给出相关公式、统计量、查表数据等。
第1章 统计数据的收集与整理
统计学是关于数据的收集、整理、分析和解释 的学科。 1.1 总体与样本
0.71 0.71
0.80 0.80 0.85 0.87
0.72 0.73
0.80 0.81 0.87 0.87
0.73 0.74
0.81 0.81 0.88 0.88
0.88
0.92 0.94 0.96 0.99 1.00 1.02 1.04 1.08 1.11 1.15 1.21 1.31
0.88 0.88