写出假设检验的基本步骤
预防医学基础课件(第二版)
制作:太原市卫生学校 石海兰
第4章人群健康研究的统计方法
学习目标 1 .说出统计中几个基本概念和统计工作的基本 步骤 2 .学会根据不同的资料选择适宜的集中趋势和 离散趋势指标,并会进行计算。 3.写出假设检验的基本步骤,会作常用的t检验 4.简述常用相对数的种类及应用时的注意事项 5 .能够根据资料的性质正确选择检验方法,会 作常用的检验 6 .统计表和统计图的意义和制作方法,会根据 不同资料选择合适的统计图
表4-1某年某市100名成年男子血清 总胆固醇(mmol/L)测定结果
二、统计工作的基ห้องสมุดไป่ตู้步骤
统计工作一般分四个步骤,即先有一个周密的设 计、然后根据设计的要求搜集资料、整理资料和分析 资料。这四个步骤是相互联系、前后呼应、不可分割 的整体。 (一)统计设计 设计是统计工作的第一步,也是最关键的一步,是 对统计工作全过程的设想和计划,是今后研究工作应 遵循的依据。
(二)搜集资料
(三)抽样误差
由于总体中各观察单位间存在个体差异 ,抽样 研究中抽取的样本 ,只包含总体的一部分观察单位, 因而,样本指标不可能恰好等于相应的总体指标。这 种由于抽样而引起的样本指标与总体指标、样本指标 与样本指标之间的差异,统计学上称为抽样误差 (samplingerror)。 一般说来,样本越大,则抽样误差越小 ,越和 总体的情况相接近 ,用样本推断总体的精确度越高, 反之亦然。由于个体变异是客观存在的,因而抽样误 差是不可避免的,但可以通过增加样本含量来减小抽 样误差。
(五)概 率
概率 (probability) 是描述某事件或某现象发生的 可能性大小的一个度量,用符号P来表示 。根据事件 发生可能性的大小,将所有事件分为三类:在一定条 件下,肯定发生的事件称为必然事件,肯定不发生的 事件称为不可能事件, 可能发生也可能不发生的事件, 称为随机事件或偶然事件。必然事件的概率等于1, 不 可能事件的概率等于0,随机事件的概率介于0与1之间。
搜集资料(collectionofdata)是根据统计设计 的要求,及时取得完整、准确的原始数据的过程。 1.医学研究资料的来源
(1)日常医疗卫生工作记录
(2)统计报表与报告卡 (3)专题调查和实(试)验资料 2.搜集资料的注意事项 搜集资料时应注意资料的完整、准确、及时。
(三)整理资料
整理资料(sortingdata)是根据设计的要求,对 原始资料进行科学的加工、整理,使其条理化、系统 化,以便进一步进行统计分析的过程。一般来说,整 理资料首先应检查核对资料,检查核对资料要注意以 下几点: 1.资料的逻辑检查 2.从专业角度对资料的合理性进行检查 3.从专业角度对资料的一致性进行检查
(四)分析资料
分析资料( analysisofdata),就是将整理好的资 料,按照设计的要求,进行统计描述和统计推断,阐明 事物的内在规律。 统计描述( descriptivestatistics )是将计算得 到的统计指标与统计图表结合,来描述数据的分布特征、 变化趋势等,为进一步进行统计推断奠定基础。 统计推断( inferentialstatistics )是根据研究 目的和资料性质,利用样本信息对总体特征进行估计和 推断的统计方法,包括参数估计和假设检验。 分析资料时应注意,不同资料类型,不同分析目的, 使用的统计分析方法不同,本章后几节将作详细介绍。
第2 节
数值变量资料的统计
计量资料经过整理后,可以计算一系列统计指标, 以说明资料的特征,便于对资料作进一步的统计分析。 平均数描述其集中趋势或平均水平,标准差描述 其离散程度或变异程度。 当例数较多时,可先编制成频数表,了解变量值 的分布情况,然后再计算其统计指标。
一、数值变量资料的频数分布
所谓频数就是观察值的个数。频数表 (frequencytable),即同时列出观察值在其取值范围内, 于各组段中频数分布情况的表格。 1.频数表的编制 现举例说明数值变量资料的频数表编制方法。 例 4-1 某年某市 100 名成年男子血清总胆固醇测定 结果如表4-1,试编制频数表。
(二)总体和样本
总体(population) 是根据研究目的所确定的同 质的观察单位的全体。 样本(sample)是从总体中随机抽出的部分有代 表性的个体。 所谓随机,即总体中的每一个个体均有同等的 机会被抽取。这种从总体中抽取部分个体的过程称 为抽样(sampling)。 样本所包含的个体数目,称为样本含量或样本 大小,用n表示。
3.资料的转化
实际上,资料的类型可以根据研究分析的需要 进行相互转化。例如,观察每个人的血红蛋白含量 (g/L),属计量资料;若按血红蛋白正常与异常分 为两组,清点各组人数,则为计数资料;若将血红 蛋白含量 (g / L) 的多少分为五个等级:重度贫血、 中度贫血、较度贫血、正常、血红蛋白增高,清点 各等级人数,则成为等级资料。
(四)资料的类型
1.数值变量资料 对每个观察单位用定量方法测定某项指标的数值 大小,所得的资料称为数值变量资料,亦称为计量资 料(measurementdata)。 2.分类变量资料 将观察单位按某种属性或类别不同进行分类计数 所得的资料,称为分类变量资料。分类变量资料分为 无序分类变量即计数资料(enumerationdata)和有序分 类变量即等级资料(rankeddata)。
x2
第1节卫生统计的基本概念和步骤
一、统计中的基本概念 (一)同质和变异 同质(homogeneity)是指事物的性质、影响条件或背 景相同或相近。例如,研究儿童生长发育情况,应选取同 性别、同年龄儿童进行观察。 同质个体间的差异,称为变异(variation)。如研究儿童 的身体发育,即使同质(同性别、同年龄)儿童的身高,也 有高有低,各不相同,称为身高的变异。同一种药物,同 样的剂量治疗同样病种的病人,其疗效亦不一样。 同质观察单位之间的个体变异,是生物的重要特征。统计 的任务就是在同质分组的基础上,通过对个体变异的研究 ,透过偶然现象,反映同质事物的本质特征和规律。