当前位置:文档之家› 体育统计-总复习

体育统计-总复习

第一章绪论(p1-6页)体育统计:体育统计学主要是数理统计学方法在体育领域中的应用。

总体:总体是所研究(调查)对象的全体,总体是一些值的集合。

(总体中的每一个具体研究对象称为个体;总体中所包含的个体数叫总体含量,一般用字母N表示;如果总体含量具有上限,称该总体为有限总体,否则称为无限总体。

)样本:从总体中抽取的部分个体的集合叫样本,样本中所包含的个体数叫样本含量会举例说明什么是总体和样本简单随机样本:在抽样过程中,如果从总体中抽取的任何一个个体都有同等的机会被抽到样本中来,这个样本称为简单随机样本。

误差:在调查和统计过程中所得到的数据或指标,与客观实际数量特征之间存在的差别,统称统计误差。

统计误差包括系统误差、过失误差、随机测量误差、抽样误差系统误差:测量过程中,由于测量仪器不准等原因引起的误差过失误差:测量过程中,由于测试人员不认真引起的误差随机测量误差:测量过程中,由于各种偶然因素造成同一对象多次测量结果不一致抽样误差:在抽样过程中,由于偶然因素引起的样本结构不能完全代表总体结构而产生的误差,是抽样调查所不可避免的误差统计量:由总体中的样本数据计算得到的描述样本特征的数值称为统计量(样本统计量)总体参数:任何一个由总体中所有数据计算得到的描述这一总体特征的数值称为参数(总体参数)。

体育统计的内容:描述统计、推断统计、统计研究设计描述统计:将原始数据资料加工成统计图表,计算得到若干能代表总体或样本特征的统计量,并设法找出原始数据分布特征的方法推断统计:在描述统计的基础上,利用数据所传递的信息,由部分对总体加以推断。

统计推断(或者推断统计)包括:参数估计和假设检验(参数估计和假设检验是同一问题的两种不同提法)统计研究设计:是根据研究对象的性质和目的,在进行统计研究工作之前,对统计工作的各个方面和全部过程所做的通盘考虑和周密安排第二章统计资料的收集与整理方法(p7-16)变量的测量尺度:名义尺度、次序尺度、区间尺度、比例尺度。

统计资料的类型:计量资料、计数资料常用的统计调查方法:调查可分为全面调查和非全面调查。

全面调查又称为普查,就是对总体中的每个个体都加以调查。

而非全面调查,只是对总体中的部分个体加以调查,非全面调查主要有典型调查和抽样调查。

抽样调查的意义:应用抽样调查可用较少的人力、物力和时间,达到对所研究总体的深刻认识;抽样调查能够解决许多总体无法进行全面调查的任务;用抽样调查能根据事先给定的误差范围做出比较精密的推断。

常用的随机抽样方法:简单随机抽样、等距抽样、分层随机抽样、整群随机抽样简单随机抽样又称单纯随机抽样,每次抽样时,总体中每一个个体都有同等的机会被选中等距抽样又称机械抽样,这种抽样方式是先将总体中每个个体按某一标志排队,然后按一定顺序和间隔来抽取调查个体的组织方式分层随机抽样分层抽样是先把总体中的个体按与所研究的现象有关的某种特征分成若干组或层,然后在各层中进行单纯随机抽样或机械抽样整群随机抽样整群抽样就是从总体中随机抽取若干群,然后对被抽取的每一群中的个体全部加以调查和研究,由此推断总体的情况实验设计(试验设计)的内容:研究目的、保证足够的观察数量、在齐同条件下对比、随机化原则。

什么叫保证足够的观察(研究)数量:只有保证足够的研究数量,才能较大程度的避免偶然因素的影响,得出符合实际的研究结论。

什么叫齐同条件下对比,在分组比较时,力求组间除处理因素外,其余各种条件尽量保持一致,才能避免非处理因素的影响。

什么叫随机化原则:所谓随机化原则就是在抽样或分组时必须作到使总体中的每一个个体都有同等的机会被抽取进入样本中来,以及样本中任何一个个体都有同等机会被分配到任何一个组中去。

第三章 资料的统计描述(p56-68)(书上第四章)1、平均数;n 个性质相同的定量数据之和除以n 所得的结果叫算术平均数,简称为平均数或均数。

即:如果一个含量为n 的定量样本数据分别为x 1,x 2,…,x n ,则其算术平均数用x 表示,∑=++==n i i n x n n x x x x 1211...由部分均数求总均数方法要求会,算术平均数适用于性质相同的、单峰的、且近似对称分布的定量数据,这种近似对称分布,最好是正态分布。

2、中位数:n 个性质相同的定量数据按由小到大的顺序排列后,居中的数据就叫做这组数据的中位数。

中位数用M d 表示。

小样本中位数计算方法:首先将所有数据按从小到大的顺序排列;① 当n 为奇数时,中位数为中间那个数②当n 为偶数时,中位数为中间两数的算术平均数3、众数:众数是指在一组定量数据中出现次数最多的那个数,用M O 表示,在一组定量资料中,有时众数不是唯一的。

平均指标对总体的共性和一般水平作了概括,以此来说明样本数据分布的集中趋势。

要把握一组数据的数量变化规律,仅仅有集中趋势的代表值是不够的,因为数据之间总是存在差异,在表现集中趋势的同时,也呈现出与集中趋势的代表值相分散的趋势,这种趋势反映了数据的离散程度。

显然这种离散程度指标越大,说明集中趋势指标的代表性越差;反之,离散程度指标越小,则集中趋势指标的代表性越好。

描述一组性质相同的定量数据的变异性(离散程度)的指标常用的有:极差、方差和标准差、变异系数。

1、 极差(全距):等于最大值减去最小值2、 样本方差1)(122-∑-==n x x s n i i = 1)(1212--∑∑==n n x x n i i n i i 3、样本标准差 1)(12-∑-==n x x s n i i 1)(1212--∑=∑==n n x x n i i n i i4、变异系数是一个不带单位(量纲)的相对数,是一个万能的离散程度指标,可用来比较任何两组数据的离散程度大小。

这就是样本变异系数,简记为cv ,其公式为:xs cv =平均数与标准差的关系:当两组数据单位相同且平均数相近时,标准差(或方差)较大,说明其数据的离散程度大,数据围绕算术平均数的分布较离散,平均数的代表性较差;反之,标准差较小,表明其数据的离散程度较小,数据围绕算术平均数的分布较密集,平均数的代表性较好。

离散程度指标与集中趋势指标的关系:离散程度越大,说明集中趋势指标的代表性越差;反之,离散程度越小,则集中趋势指标的代表性越好 标准差有单位,与平均数单位相同;变异系数没有单位5、标准误:在抽样调查中,从一个总体中抽取一个含量为n 的样本,通常情况下,由于抽样误差存在,会造成样本算术平均数、样本率等统计量与总体参数之间存在一定的误差,而样本的标准误(或标准误差)就是衡量抽样误差大小的一个样本统计量,它可以定义为样本统计量的标准差。

标准误和样本数据的标准差在意义上、描述对象上、使用上有区别6、百分位数:我们用p x 表示第x 百分位数,它表示在所有数据中,比它小的数据占总数据的x %,比 它大的数据占总数据的(100-x )%7、率:率是强度相对数,表示在一定条件下,某现象(随机事件)的实际发生次数k 与该现象可能发生的总次数n 的比值。

%100⨯=n k 率第四章 正态分布(p80-90)(书上第五章)1、随机事件所谓的随机事件是指在一定条件下可能发生也可能不发生的事件。

在一定条件下必然发生的事件叫必然事件,用U 表示在一定条件下不可能发生的事件,称为不可能事件,用V 表示。

2、概率:随机事件A 在一次试验中发生可能性大小的度量值叫随机事件A 发生的概率,记做)(A P 且满足1)(0≤≤A P频率:在相同条件下随机试验n 次,某事件A 出现m 次,n m ≤,则比值m/n 称为随机事件A 发生的频率。

概率的统计定义n 的增大,随机事件的频率围绕某一常数p 上下波动,且波动的幅度逐渐减少,趋向于稳定,这个频率的稳定值即为该事件的概率。

记为:p n m A P ==)(频率与概率的关系:频率随着试验次数的变化发生变化,而随机事件的概率不随试验次数的变化而发生变化3、正态分布曲线的性质⑴正态分布密度曲线与横轴之间所包围的面积是1,反映了随机变量区X 在(+∞∞-,)之间是一个必然事件。

⑵正态分布密度曲线关于直线μ=X 对称,并在μ=X 处达到最大值,当±∞→X 时,曲线以横轴为渐近线。

⑶μ和σ是正态分布的两个参数;μ决定了正态分布曲线对称轴的位置,而σ决定了正态分布曲线的形状,即其高矮。

固定μ,则曲线的位置相同而形状不同,σ越大,曲线愈扁平,σ越小,曲线愈陡峭。

固定σ,则曲线的形状相同而位置不同。

标准正态分布把1,0==σμ的正态分布叫标准正态分布,记为)1,0(~N X 。

会查标准正态分布表会求类似 之间的面积占总面积的多少。

(在标准正态分布表(第241页—第242页附表1)中,查u=1.3,及u= -1.3时对应的面积,用大数减去小数的结果为所求,即0.9032 - 0.0968=0.8064sx 3.13.1±±或σμ或80.64%)4、应用题⑴利用标准正态分布曲线制订测验标准、⑵估计实际分布情况、⑶估计达到标准的人数。

(此处会书上的例题)会做类似如下题目:某年级有学生600人,跳远的样本统计量,2.0,8.4米米==s x 现规定4.4米及格, 问有多少人不及格。

5、体育评分:⑴ 标准分数是以标准正态曲线横轴上的u 值做为分数的,其计算公式为: 田赛的标准分数sx x u -=径赛的标准分数s x x u -=标准分数优点(特点):分数反映位置;便于综合计算与比较⑵ 标准百分在σμk ±范围内评分时,评分公式为: 田赛标准百分k x Z 210050⨯-+=σμ 径赛标准百分k x Z 210050⨯--=σμ其中k 常取5,4,3,2.5,在实际工作中一般用样本算术平均数x 近似总体均数μ,用样本标准差s 近似总体标准差σ。

注意,在实际应用中标准分数和标准百分适用于数据服从正态分布或近似正态分布的情况;且它们相应的公式都是线性的,也就是说无论运动成绩水平的高低,成绩提高量相同,其分数的增加量也相同,也就是说没有考虑运动成绩提高的难度(在低水平时运动成绩容易提高,而高水平的运动成绩很难提高)。

会求如下例题:设某年级学生100米跑的成绩服从正态分布。

从中随机抽取部分学生测验,其统计量为(秒)6.14=x ,S=0.4秒,如果在s x 5.2±范围内进行标准百分评定,则⑴得60分的成绩为多少秒?⑵得100分的成绩为多少秒?⑶如某两人100米成绩分别为14秒,应得多少标准百分?⑷估计60分以上的人数占总人数的比例为多少?第六章 参数估计(p100-106)1、点估计的定义:一般地讲,设θ是总体X 的某个待估计的参数(可能是μ,也可能是π,或是其他参数),从总体X 中抽取一个含量为n 的样本x x x n ,...,,21,用样本的一个统计量θˆ来估计θ,我们称θˆ是总体参数θ的点估计值。

相关主题