统计名词解释
2 2 2 2 2
应很小,即出现大X 值概率很小。即X 越大,P越小,若P≤a时,就怀疑假设的成立,拒绝H0。若P>a则没有 理由拒绝H0。 29. X 用途: (1) 实际频数与拟合频数拟合优度: A推断两个或两个以上总体率或构成比有无差别 (四格表/行x列表) 。 B两变量之间有无相互关系。C频数分布的拟合优度检验(判断次样本是否来自某种分布)。 (2)某些分布可用X 近似。 (3)间接应用:如t分布和F分布就是在X 分布基础上推导出来的。 30. 方差分析的基本思想:根据研究目的和设计类型,把总体变异中离均差平方和分解成两部分或更多部 分,也把总变异中的自由度相应分成两部分或更多部分,然后再进行比较,评价由某种因素引起的变异是 否具有统计学意义。 31.假设检验中P,a,b(倍他)的关系及统计学意义: a:检验水准,即显著性检验,在此概率之下的认为是小概率事件,统计学上以为此事件“不可能发生”, 以此判断是否不拒绝H0无效假设, 在假设检验中, 按a检验水准, 拒绝了原来正确的H0, 即犯了第1类错误, 犯此错误的概率为a。 b:在T假设检验中,按照a检验标准,没有拒绝原来错误的无效假设,即犯了第2类错误,犯次错误的概率 是b。 P:是在H0成立时大于等于用样本计算的统计值出现的概率用P值与检验水准a比较,根据比较的结果作出统 计判断。如果P≤a时,就怀疑假设的成立,拒绝H0。若P>a则接受H0拒绝H1。P值越小只能说明作出拒绝H0, 接受H1的推论时犯错误的机会越小。 32.制定参考值步骤: (1)从正常人总体中抽样(2)控制测量误差 (3)判定是否需要分组确定参考值范围(4)决定单侧还是双侧 (5)选择合适的百分上限(6)对资料的分布进行正态性检验 (7)根据资料的分配类型选定恰当的方法进行参考值范围的估计 33. 标准差与标准误不同: (1)二者描述内容不同:前者个体变异;后者群体变异。 (2)二者与n样本含量关系不同:n很小时S不稳定,n足够大时S接近总体标准差;而S不变时,n接近无穷 大时,标准误接近0。 (3)二者用途不同:S:描述观察值的离散程度/计算CV即变异系数/估计医学参考值范围/计算标准误;标 准误:反映均数抽样误差大小/估计总体均数可信区间/用于假设检验。 34. 变量:观察指标在统计学上统称为指标变量,它反应的是生物个体间的变异情况,根据其性质可分为 定性变量(分类)和定量变量(连续)。
1.样本(sample) :是总体中抽取的有代表性的一部分。 样本含量( sample size) :样本中包含的研究单位数。 2.总体(population) :是根据研究目的确定的同质研究单位的全体。更确切地说是同质研究单位某种变量 值的集合。 3. 计量资料(measurement data) :由一群个体的数值变量值构成的资料,即一群变量值。 4.计数资料(enumeration data): 一群个体按无序分类变量的类别清点每类有多少个个体, 即分类个体数。 5.算术均数:简称均数(mean)可用于反映一组呈对称分布的变量值在数量上的平均水平或者说是集中位 置的特征值。 6.几何均数(geometric mean) : 可用于反映一组经对数转换后呈对称分布的变量值在数量上的平均水平 7.中位数(median) :是将变量值从小到大排列,位置居于中间的那个变量值。 8.百分位数(percentile)是一种位置指标。一个百分位数将全部变量值分为两部分,在不包含的全部变 量值中有的变量值比它小,变量值比它大。 9.极差:用 R 表示:即一组变量值最大值与最小值之差。 10.方差(variance)也称均方差(mean square deviation) ,反映一组数据的平均离散水平。 11.变异系数: 记为 CV 多用于观察指标单位不同时,如身高与体重的变异程度的比较;或均数相差较大 时,如儿身高与成人身高变异程度的比较 12. 医学参考值(reference value)是指包括绝大多数正常人的人体形态、机能和代谢产物等各种生理及 生化指标常数,也称正常值。 13. 抽样误差:由个体变异产生的、抽样造成的样本统计量与总体参数的差别 14. 单样本 t 检验: 即样本均数 (代表未知总体均数)与已知总体均数0(一般为理论值、标准值或经 过大量观察所得稳定值等)的比较 15: 假设检验的步骤: (1)建立假设检验和确定检验水准。 (2)选择检验方法和计算检验统计量。 (3)确定概率值作出推断(包 括统计专业推断) 用F 检验 (1) 建立检验假设,确定检验水准 (2) 计算检验统计量 (3) 确定P值,作出推断结论 16.完全随机设计: (completely random design)是采用完全随机化的分组方法,将全部试验对象分配到g 个处理组(水平组) ,各组分别接受不同的处理,试验结束后比较各组均数之间的差别有无统计学意义,推 论处理因素的效应。 17. 随机区组设计(randomized block design)又称为配伍组设计,是配对设计的扩展。具体做法是:先按 影响试验结果的非处理因素(如性别、体重、年龄、职业、病情、病程等)将受试对象配成区组(block), 再分别将各区组内的受试对象随机分配到各处理或对照组。 18.率:说明某现象发时 期 内 发 生 某 现 象 的 观 察 单 位 数 比 例 基 数 同 期 可 能 发 生 某 现 象 的 观 察 单 位 总 数
19.构成比:表示事物内部某一部分的个体数与该事物各部分个体数的总和之比,用来说明各构成部分在总 体中所占的比重或分布。 20. 标准化法的意义和基本思想:当比较的两组或多组资料, 其内部各小组率明显不同, 且各小组观察例数 的构成比,诸如年龄、性别、工龄、病情轻重、病程长短等也明显不同时,直接比较两个或多个合计率是 不合理的。因为其内部构成不同,往往影响合计率大小。 21.标准化方法 1、直接法 2、间接法 22.动态数列(dynamic series):是一系列按时间顺序排列起来的统计指标(可以为绝对数,相对数或平均 数) ,用以观察和比较该事物在时间上的变化和发展趋势 23.最小二乘法(least sum of squares),即可保证各实测点至直线的纵向距离的平方和最小
24.直线相关(linear correlation)又称简单相关(simple correlation),用于双变量正态分布资料。 25.决定系数:回归平方和与总平方和之比, 26. 四格表X2检验注意: (1)1≤T<S,而n≥40时,需要计算校正X2值或改用四格表资料的确切概率法计算。 (2)T<1,或n<40时,改用四格表确切。。。。 (3)n≥40且T ≥S时用基本或专用公式,但当P约等于a时,用Fisher确切 (4)X2连续性校正只用于四格表资料。 27. 同质:影响研究指标的主要因素易控制的因素基本上相同。 28. 卡方基本思想:X 分布是一种连续型分布,可用于检验资料的实际频数和按检验假设计算的理论频数 是否相等等问题。X 反应实现了实际频数与理论频数的吻合程度。如果检验假设成立,则A-T一般不大,X