当前位置:文档之家› 医学统计知识点整理

医学统计知识点整理

医学统计学知识点整理第一节统计学中基本概念一、同质与变异同质:统讣研究中,给观察单位规定一些相同得因素情况。

如儿童得生长发冇,规泄同性别、同年龄、健康得儿童即为同质得儿童。

变异:同质得基础上个体间得差异。

"同质"就是相对得,就是客观事物在特左条件下得相对一致性,而"变异”则就是绝对得二、总体与样本1、总体:就是根据研究目得所确定得,同质观察对象(个体)所构成得全体。

2、样本:就是从总体中随机抽取得部分观察单位变量值得集合。

三、参数与统计量总体参数:根据总体个体值统计计算出来得描述总体得特征量。

用希腊字母表示。

卩、6、兀样本统计量:根据样本个体值统汁计算出来得描述样本得特征量。

用拉丁字母表示。

X、S、p 总体参数一般就是不知道得,抽样研究得目得就就是用样本统计量来推断总体参数,包括区间估计与假设检验四、误差:实测值与真值之差★1、随机误差:就是一类不恒立得、随机变化得误差,由多种尚无法控制得因素引起。

随机测量误差、抽样误差。

2、系统误差:就是一类恒左不变或遵循一泄变化规律得误差,其产生原因往往就是可知得或可能掌握得。

3、非系统误差:过失误差,可以避免或淸除。

五、概率就是用来描述事件发生可能性大小得一个量值,常用P表示。

概率取值07。

统计上一般将PW0、05或PW0、01得事件称为小概率事件,表示其发生得概率很小,可以认为在一次抽样中不会发生。

第二节统计资料得类型*变量:确宦总体之后,研究者应对每个观察单位得某项特征进行观察或测就,这种特征能表现观察单位得变异性,称为变量。

一、数值变量资料又称为汁量资料、定量资料:观测每个观察单位某项指标得大小而获得得资料。

表现为数值大小,带有度、童、衡单位。

如身高(cm)、体重(kg)、血红蛋白(g)等。

二、无序分类变量资料又称为左性资料或汁数资料:将观察对象按观察对象得某种类别或属性进行分组讣数,分组汇总各组观察单位后得到得资料。

分类:二分类:+ -;有效,无效;多分类:ABO血型系统特点:没有度量衡单位,多为间断性资料【例题单选】某地A、B、0、AB血型人数分布得数据资料就是( )A、定量资料B、计量资料C、计数资料D、等级资料【答案】C【解析】ABO血型系统人数分布资料属于无序分类变量资料,又称为讣数资料。

因为就是按照变量得血型分类,血型表现为互不相容得属性。

所以本题选Co【例题单选】测量正常人得脉搏数所得得变量就是( )A、二分类变量B、多分类变量C、泄量变量D、泄性变量【答案】C【解析】脉搏数有数值大小,有度量衡,所以这个资料属于左量资料。

本题选C。

三、有序分类变量资料半定量资料或等级资料:将观察对象按观察对象得某种属性得不同程度分成等级后分组讣数, 分组汇总各组观察单位后得到得资料。

特点:每一个观察单位没有确切值,各组之间有性质上得差别或程度上得不同举例:-+ ++ +++第三节统计工作得基本步骤★1、统计设计2、收集资料3、整理资料4、分析资料:统计描述:就是利用统计指标、统讣表与统讣图相结合来描述样本资料得数量特征及分布规律。

统讣推断:就是使用样本信息来推断总体特征。

统汁推断包括区间估计与假设检验。

第四节统计表与统计图*一、统计表统计表得基本结构与要求标题:髙度概括表得主要内容,时间、地点、研究内容,位于表得上方,居中摆放,左侧加表得序号。

标目:横标目与纵标目。

线条:通常采用三线表与四线表得形式。

没有竖线或斜线。

数字:表内数字一律用阿拉伯数字。

同一指标,小数位数应一致,位次对齐。

无数字用“一”表示。

暂缺用表示。

"0”为确切值。

备注:位于表得下而,通常就是对表内数字得注解与说明,必要时可以用等标出。

一张统计表得备注不宜太多。

二、制表原则重点突出,一个表一个中心内容主谓分明,层次淸楚简单明了, 一切文字数字线条尽量从简【例题单选】统计表内不列得项就是( )(2010、7)A、标目B、线条C、数字D、备注【答案】D【解析】统讣表内备注位于表得下面,不列在统计表内,所以本题选择Do三、统计图1、(2)标题⑵标目(3)刻度(4)图例:不同颜色或者不同线条表示,需要说明。

2、常用统汁图得适用条件与要求(1)条图:适用于比较、分析独立得或离散变量得多个组或多个类别得统计指标.⑵圆图与百分比条图:构成比得比较(3)线图:描述某统计量随另一连续性数值变量变化而变化得趋势。

(4)直方图:数值变量得频数分布。

(5)散点图:用点得密集程度与趋势描述2个变量间得数量关系(6)箱式图:多组数据分布得比较(7)统计地图:用不同得颜色与花纹表示统计量得在地理分布上得变化,适宜描述研究指标得地理分布。

【例题填空】描述某地十年间结核病死亡率得变化趋势宜绘制______________ 图。

【答案】线图数值变量资料得统计分析第一节数值变量资料得统计描述一、频数分布表★1.编制步骤(1)计算全距(2)确定组距⑶划分组段⑶统计频数⑷确左频率与累计频率2.频数分布表得主要用途:(1)揭示资料得分布类型(2)观察资料得集中趋势与离散趋势(3)便于发现某些特大或特小离群值(4)便于进一步计算统计指标与作统计处理二、集中趋势指标★数值变量资料得集中趋势指标就是用平均数来描述得,代表一组同质变虽值得平均水平。

常用得有算术均数、几何均数与中位数。

1、算数均数适用于对称分布(正态分布)或者近似对称分布得资料。

习惯上以u表示总体均数,以衣表示样本均数。

2、几何均数数值变量呈倍数关系或者呈对数正态分布,如抗体效价及抗体滴度,某些传染病得潜伏期、细菌计数等,宜用几何均数(G)。

几何均数常用于等比资料或对数正态分布资料。

3、中位数就是指将一组变量值从小到大排列,位次居中得观察值就就是中位数。

适用条件:变虽:值中岀现个别特别大或特别小得数值;偏态分布资料;数值一端或两端无确定数值;资料类型不明。

4、百分位数就是一种位宜指标,以Px表示,把一组数据从小到大排列后,理论上有x%得变量比Px 小,有(200-刃%得变量值比Px大。

【例题单选】描述正态分布资料集中趋势得指标就是()A、中位数B、几何均数C、算术平均数D、标准差【答案】C【解析】算数均数适用于对称分布或者近似对称分布得资料。

几何均数常用于等比资料或对数正态分布资料。

中位数适用条件:变量值中出现个别特别大或特别小得数值;偏态分布资料; 数值一端或两端无确泄数值;资料类型不明。

标准差描述数据得离散趋势指标。

所以本题选择C。

三、离散趋势指标★1、极差与四分位数间距极差:简记为R,亦称全距,即一组变量值中最大值与最小值之差,反应变量值得离散范困。

四分位数间距Q:—般与中位数一起描述偏态分布资料得分布离散趋势。

3.方差与标准差:方差表示样本观察值得离均差平方与得均值。

表示一组数据得平用途:(1)用于表示正态或近似正态分布资料得离散度;⑵反映均数得代表性标准差越小,数据离散程度越小,均数得代表性越好。

(3)确定医学参考值范围95%医学参考值范围J ± 1. 96s3、变异系数(CV)适用条件:①观察指标单位不同,如身髙、体重②同单位资料,但均数相差悬殊四、正态分布与参考值范围得制定*(一)正态分布1、概念:也称髙斯分布,就是医学与生物学最常见、最重要得一种连续性分布。

2、特征:(1)在直角坐标得横轴上方呈钟型曲线,两端与X轴永不相交,且以X二U为对称轴左右完全对称(2)在x二P处,f (X)取最大值(3)正态分布有两个参数,即均数U与标准差a。

均数u描述了正态分布得集中趋势位置,若固立。

,改变卩值,曲线沿着X轴平行移动,其形状不变,故u称为位置参数。

标准差0描述了正态分布得离散程度,若固泄u , «越小,曲线越陡峭;反之,。

越大,曲线越平坦.故。

称为形状参数或离散度参数。

(4)正态曲线下得而积分布有一泄得规律。

4、正态曲线下而积得分布规律-258<r-1.96<r -l<r 4 la 1.96<r 258(r1 J 68,27% —1I1------ 95.00% ------- 11--------- 99.00% ---------(二)医学参考值范囤得制左医学参考值:就是指绝大多数正常人得人体形态、功能与代谢产物等各种生理及生化指标常数,也称正常值。

表参考值范凰的制定正态分布法百分位数法%双侧单侧双側单i只有下限只有11限只有下限只有上限90X + 1.64S X-1.28S X + 1.28S P艸P刃95X + 1.96S X-1.64S X + 1.64S P2.$~P«5p$P笳99X+2.58S X-2.33S X + 2.33S P|).广P99.5Pl P叫第二节数值变量资料得统计推断★一、均数得抽样误差与标准误抽样误差:由于个体变异与抽样造成得样本统计量与总体参数与样本统计量之间得差异。

均数得抽样误差:由于抽样造成得样本均数与总体均数与样本均数间得差异。

标准误:样本均数得标准差,用云来表示。

(G未知)二、t分布t分池册缪收Q■为q叼巡分佩疔丼单峰分布曲线,u不同,曲线形状不同S/Vn S- °t分布与I有关八越小,t值越分散龙分布得雌部越低,而两侧尾部翘得越髙t界值表中一侧尾部而积称单侧概率(«)两侧尾部而积之与称双侧概率(« /2)如:tO、0玖9=2、262, tO、05,9=1、833在相同自由度时,Itl值增大,a减小在相同a时,单尾a对应得t值比双尾u得小三、总体均数得区间估计统计描述统计分析彳参奴鈕…用样本指标估计总体指标I统计推断彳L假设检验总体均数置信区间(可信区间)得计算区间估计:就是按预先给定得概率(1-a)所确定得包含未知总体参数得一个范围。

(一)小样本或a未知•…按t分布<x-t a/2> x + t a/2>应〉(二)1、已知。

一u 分布(丘一U K/2I x4- %/z、,o»2、a未知,但大样本(n>60卜…按u分布0 7".庄,袁+也v耳〉四、假设检验得意义与基本步骤★假设检验:先对总体得参数或分布做出某种假设,再用适当得统计方法根据样本对总体提供得信息,推断此假设应当拒绝或不拒绝。

基本步骤:1、建立检验假设,确定检验水准(1)Ho:(无效假设)U利。

(2)Hj:(备择假设加H “°川〉“0或go⑶确左检验水准u=0、052、选左检验方法,计算检验统汁量3、确定P值,作出推断结论第三节均数得t检验与u检验★t检验应用条件:样本与总体/两样本均数得比较①当*60时,要求样本取自正态分布得总体,总体标准差未知;②两小样本均数比较时,要求两样本总体方差相等(»12= O 22)O③n含量较大,u分布一、单样本t检验适用于样本均数代表得未知总体均数P与已知总体均数円得比较。

相关主题