当前位置:文档之家› 研究生统计学讲义第1讲第一章绪论

研究生统计学讲义第1讲第一章绪论


试验者 De Morgan
掷币数n 正面数m
2048
1061
正频率fn 0.5181
Buffon
4040
2048
0.5069
Pearson
12000
6019
0.5016
Pearson
24000 12019
0.5005
统计上常用符号 P 表示概率,概率的统计定义是: 如果事件 A 在大量重复试验中出现的频率稳定在某一 常数p,则称事件 A 的概率为p,记作P(A)=p,
样本的概率分布称为抽样分布,统计上描述一个样 本的性质,就等价于给出它的概率分布。由样本的分 布可以推断出总体的分布,这是随机抽样的特征,可 以把它取作“随机抽样”的定义。从总体中随机抽取 一定个体数目的样本进行研究,通过样本指标推断总 体指标的方法,称为抽样研究方法。
样本的“质”通过适当的抽样方法来保证,必须使样 本中的每一个体确属同质总体,必须遵循随机化抽样 和分配的原则,使样本足以代表总体,能充分反映总 体的实际情况,保证样本的可靠性
数理统计方法就是应用概率论的结果,通过样 本来了解和判断总体的统计特征的科学方法。
3.概率与频率 概率(probability)和频率(frequency) 都是反映某一随机事件发生可能性大小的度量。
若随机事件A在n次独立重复试验中发生了m次,则称 m为频数(counts)。称比值m/ n为事件A在n次试验中出 现的频率或相对频数(relative frequency) ,0≤m/ n≤1, 即事件A发生的频率为m/ n。
7.统计描述与统计推断
统计描述是对原始资料的一种概括,即把分散而不 好理解的原始数据,通过统计指标、统计图、统计表 等方法,来描述资料的特征及其分布规律。统计描述 不考虑抽样误差问题。
统计推断通过样本所提供的信息来推断总体特征 ,并标明可能发生的误差。统计推断包括置信区间 (confidence interval)与假设检验(hypothesis testing ) 。是对整理出的统计量作进一步的分析,统计推断 的结果为研究者下专业结论时提供科学的依据,所 下的推断结论将影响后来的决策。例如,某新药A 与某常规药B对某病疗效的差异有统计意义,A药效 应较好,这种推断结论所导致的决策就是把A药引 入市场,推广应用于临床。
从总体中随机抽取部分个体的过程称为抽样 (sampling),从总体中随机抽取的代表总体的部分个 体的观察值集合称为样本(sample)。样本中所包含的 个体数目,即样本例数,称为样本含量(sample size) 。总体中有很多个体,究竟哪些个体在抽样中被抽 到,要依机会而定。因此,样本是随机变量;
抽样的目的是用样本信息推断总体特征,所以样本 要有足够的含量及代表性。
样本要具有:①随机性:即要使总体中的每一个体 都有同等的机会被抽到和分配,不受研究者的主观意 愿或客观偏性影响,样本可能取值与总体是完全一样 的,并且取各个值的概率也是完全一样的,这就是说 ,样本与总体是同分布的随机变量。②独立性:即各 个样品的取得互不影响,即任何一次抽样都未改变总 体成份,因而下一次抽样是在同样条件下进行的。例 如,有放回的抽样就能保证这一点;无放回的抽样在 总体很大时,也近似满足这一点。
概率的统计定义实际上给出了一个近似计算随机事 件的概率的方法,即当试验次数 n 够大时,可用频率 作为概率的近似值。
注意: 频率具有偶然性;而概率刻划的则是总体中随 机事件(随机变量)出现的可能性大小,一个随机变量 的概率是一个常数,具有必然性,是一,不可能事件的概率 为0,概率越接近1,表明其事件发生的可能性越大, 概率越接近0,其事件发生的可能性越小,P<0.05表 示事件发生的可能性小于0.05,P<0.01表示事件发生 的可能性小于0.01
5.概率分布 对一个随机变量,不但要了解它可能取 得的数值,还要了解它以多大的概率取得这些数值, 只有这样,才算是掌握了这个随机变量所刻划的随机 现象。事实上,随机变量的取值有一定的概率意义, 所以必须用随机变量的取值及其相应的概率才能完整 地刻划随机现象的规律。一个随机变量各可能的取值 与其对应的概率共同构造出它的概率分布(probability distribution),简称分布。
研究生统计学讲义第1讲第一章
观察单位(称为个体)的研究特征(或指标)称为变 量 (variable) 。 变 量 的 观 察 结 果 即 观 察 值 (observed value),称为变量值(value of variable)。变量值是变量 的具体表现。随机变量(random variable)是专指具有 一个分布或一个概率或概率分布的变量,特性:(1) 在一次试验中,取值具有不确定性。随机事件在一次 试验中可能发生,也可能不发生,所以随机变量的取 值是随机的,取决于随机试验结果。(2) 在大量重复 试验中,随机变量的各种可能取值发生的可能性大小 具有一定的统计规律,也就是说,具有一定的“概率 ”意义。可见,随机变量既具有变量的意义,又具有 概率意义,这种双重意义正是随机变量与普通变量的 区别。在不致混淆的情况下,通常将随机变量简称变 量。
6.参数与统计量 出现在总体分布中的统计指标称为 参数(parameter),参数一般用小写的希腊字母表示, 如用μ表示总体均数,用σ表示总体标准差。
通过对样本数据进行统计分析所产生的统计指标 称为统计量(statistical variable)。
统计量也是随机变量,统计量的分布称为抽样分布。 常用的有2分布、t分布、F分布。在统计推断中,抽 样分布充分发挥作用。统计学研究的基本方法是通过 样本构造统计量,再通过抽样分布的研究,对样本所 来自的总体进行分析和推断。
2.总体、个体与样本 研究对象的全体称为总体 (population)。构成总体的每个成员称为个体,亦称 样品或观察单位。总体是根据研究目的所确定的性 质相同的所有个体的研究指标值的集合。
个体(individual)即观察单位(study unit)。总 体的性质特征由其各个个体的性质而定,要研究总 体的性质或特征,须对它的个体进行观测。
相关主题