1.参数(parameter):总体的统计指标或特征值。
总体参数是事物本身固有的、不变的。
统计量(statistic):由样本所算出的统计指标或特征值。
2.正态分布:以均数u为中心左右完全对称的分布,记为X~N(u, )
标准正态分布:以均数为0,标准差为1的正态分布,记为u~N(0,1)
3.平均数:也叫平均值,是一组(群)数据典型或有代表性的值。
这个值趋向于落在根据数据大小排列的数据的中心,包括算术平均数、几何平均数、中位数等。
标准差S:将方差开方,得到标准差,它是最常用的变异指标,标准差越大,说明数据的变异程度越大。
标准误S X:在统计理论上将样本统计量的标准差称为标准误,用来衡量均数抽样误差的大小。
据此,样本均数的标准差称为标准误。
S p(样本率的标准差):率的标准误,用来描述样本率的抽样误差。
4.参数检验:总体分布已知,对其中一些未知参数进行估计或检验。
这类统计推断的方法叫参数统计或参数检验。
参数检验:假定比较数据服从某分布,通过参数的估计量( , s)对比较总体的参数(μ)作检验,统计上称为参数法检验(parametric test)。
如t、u检验、方差分析。
非参数检验:是指在统计检验中不需要假定总体分布形式和用参数估计量,直接对比较数据的分布进行统计检验的方法,称为非参数检验(nonparametric test).
5.率(rate):强度相对数,用以说明某现象发生的频率或强度。
是某事物或现象发生的实际数与可能数的比例关系。
构成比(proportion):结构相对数,它说明一种事物内部各组成部分所占的比重或分布,常以百分数表示,其计算公式为:
比(ratio):又称相对比,是A、B两个有关指标之比,说明A为B的若干倍或百分之几,它是对比的最简单形式。
其计算公式为:比=A/B。
6.相关系数:用以说明具有直线关系的两个变量间相关关系的密切程度和相关方向的指标,称为相关系数,又称为积差相关系数。
复相关系数:是决定系数的平方根,相对系数的绝对值,用来度量应变量与多个自变量间的线性相关程度。
决定系数:是反映回归贡献相对程度的指标,是回归平方和与总体平方和之比。
无单位,取值在0到1之间。
回归系数:直线回归方程= a+bX的系数b称为回归系数,也就是回归直线的斜率(slope),表示X 每增加一个单位,Y平均改变 b 个单位。
偏回归系数:是多元线性回归方程中的各个自变量的回归系数。
标准偏回归系数:将原始数据实施标准化变换后的直线回归方程中的偏回归系数,反映各变量对因变量的贡献大小。
零相关:指两个变量间没有直线相关的关系。
7. 统计描述:指选用恰当的统计指标,选用合适的统计表和统计图,对资料的数量特征及其分布规律进行测定和描述。
统计推断:从总体中随机抽取一定含量的样本进行研究,目的是通过样本的信息判断总体的特征,这一过程称为统计推断。
8.X检验:以卡方分布为理论依据,用途颇广的假设检验方法。
秩和检验:推断一个总体表达分布位置的中位数M和已知M0,两个或多个总体的分布是否有差别。
9.生存率:是指接受某种治疗的病人或患某病的病人中,经若干年的随访后,尚存活的病人数所占的比例。
生存概率:表示活过某时间段的可能性的大小。
10.可信区间:按一定的概率或可信度(1-α)用一个区间估计总体参数所在范围,这个范围称作可信度1-α的可信区间,又称置信区间。
参考值范围:也称为正常值范围(normal range),医学上常把绝大多数正常人的某指标值范围称为该指标的正常值范围。
13.点估计:直接用样本统计量作为对应的总体参数的估计值。
区间估计:按一定的概率或可信度(1-α)用一个区间估计总体参数所在范围,这个范围称作可信度1-α的可信区间,又称置信区间。
这种估计方法称为区间估计。
14. 频率:在n次随机试验中,事件A发生了m次,其比值称为事件A在n次试验中出现的频率。
m称为出现的频数。
在实际工作中,当观察单位的例数足够多时,可以用频率来代替概率。
频率是概率的估计值。
概率:在重复试验中,事件A的频率,随着试验次数的不断增加将愈来愈接近一个常数p,这个常数p就称为事件A出现的概率,记作P(A)或P。
描述随机事件发生的可能性大小的数值,常用P来表示。
4. 变量(variable):观察对象个体的特征或测量的结果。
由于个体的特征或指标存在个体差异,观察结果在测量前不能准确预测,故称为随机变量,简称变量。
变量的取值称为变量值或观察值。
根据变量的取值特性,分为数值变量和分类变量。
5. 数值变量:又称为计量资料、定量资料,指构成其的变量值是定量的,其表现为数值大小,有单位。
对每个观察单位用定量的方法测定某项指标的数值,组成的资料。
8. 抽样:从总体中抽取部分观察单位的过程称为抽样。
9. 抽样误差:由于抽样造成的统计量与参数之间的差别,特点是不能避免的,可用标准误描述其大小。
10. 误差:统计上所说的误差泛指测量值与真值之差,样本指标与总体指标之差。
主要有以下二种:系统误差和随机误差。
13. 变异:同质事物间的差别。
由于观察单位通常即为观察个体,故变异亦称为个体变异。
14. 组间变异:用各组均数与总均数的离均差平方和表示
ν组间=k-1,k为实验分组数,组间均方为MS组间=SS组间/( k-1)
15. 组内变异:用各组均数与总均数的离均差平方和表示
,各组自由度为ni-1,则组内自由度为ν组内=N-k,组内均方为MS组内=SS组内/( N-k) 17. 中位数(median):将一组观察值按升序或降序排列,位次居中的数,常用M表示。
适用于偏态分布资料或不规则分布资料和开口资料。
所谓“开口”资料,是指数据的一端或两端有不确定值。
当n为奇数时,M=X(n+1)/2;当n为偶数时,M=[Xn/2+ Xn/2+1]/2。
18. 百分位数:是一种位置指标,以Px表示,一个百分位数Px将全部观察值分为两个部分,理论上有x%的观察值小于Px小,有(1-x%)的观察值大于Px。
19. 变异系数:亦称离散系数(coefficient of dispersion),为标准差与均数之比,常用百分数表示。
, 变异系数没有度量衡单位,常用于比较度量单位不同或均数相差悬殊的两组或多组资料的离散程度。
20. 统计表:统计表就是以表格的形式,表达被研究对象的特征、内部构成及研究项目分组之间的数量关系。
34.Ⅰ类错误:统计学上规定,拒绝了实际上成立的H0,这类“弃真”的错误称为Ⅰ型错误或第一类错误,Ⅰ型错误的概率用α表示。
35.Ⅱ类错误:统计学上规定,不拒绝实际上不成立的H0,这类“存伪”的错误称为Ⅱ型错误或第二类错误,Ⅱ型错误的概率用β表示。
36. 检验效能:又称把握度,即两总体确有差别,按α水准能发现它们有差别的能力。