当前位置:文档之家› 统计研究工作基本步骤

统计研究工作基本步骤

统计研究工作基本步骤名词解释总体:是根据研究目的确定的同质观测单位的集合。

样本:是从样本总体中随机抽取的,具有代表性的部分观测单位的集合。

参数:引入一个或一些另外的变量来描述自变量与因变量的变化,引入的变量本来并不是当前问题必须研究的变量,我们把这样的变量叫做参变量或参数。

统计量:统计量是统计理论中用来对数据进行分析、检验的变量。

概率:描述随机事件发生可能性大小的一个度量。

频率:指某种现象发生的次数。

变异:在一个总体中,各单位的品质标志或数量标志的标志表现具有差异性。

指标:说明总体单位数量特征的科学概念和具体数值。

简答题1什么叫医学统计学?医学统计学与统计学、卫生统计学、生物统计学有何联系和区别?医学统计学是运用概率论与数理统计的原理及方法,结合医学实际,研究数字资料的搜集、整理分析与推断的一门学科。

医学研究的对象主要是人体以及与人的健康有关的各种因素。

医学统计学:是运用统计学原理和方法研究生物医学资料的搜索、整理、分析和推断的一门学科统计学:是研究数据的收集、整理、分析与推断的科学。

卫生统计学:是把统计理论、方法应用于居民健康状况研究、医疗卫生实践、卫生事业管理和医学科研的一门应用学科。

生物统计学:是一门探讨如何从不完整的信息中获取科学可靠的结论从而进一步进行生物学实验研究的设计,取样,分析,资料整理与推论的科学。

2医学统计学资料主要来源于哪些方面?有何要求?1、医学统计资料主要有实验数据和现场调查资料、医疗卫生工作记录、报表和报告卡等。

实验数据是指在试验过程中活的的数据;现场调查资料主要来源于大规模的流行病调查获取的资料;医疗卫生工作记录有门诊病历卡、住院病历卡、化验报告等;报表有卫生工作基本情况年报表、传染年(月、日)报表、疫情旬(年、月、日)报表等;报表卡有传染病发病报告卡、出生报告卡、死亡报告卡等等。

这些资料的手机过程中,必须进行质量抗旨,包括它的统一性、确切性、可重复性。

这些原始数据的精读和偏性应有明确的范围。

3.当今医学研究的趋势和特点如何?医学统计方法主要有哪些?4.医学统计资料类型有哪些?方法有哪些?1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。

计量资料亦称定量资料、测量资料。

.其变量值是定量的,表现为数值大小,一般有度量衡单位。

如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、脉搏(次/分)、血压(KPa)等。

(2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。

计数资料亦称定性资料或分类资料。

其观察值是定性的,表现为互不相容的类别或属性。

如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。

(3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。

等级资料又称有序变量。

如患者的治疗结果可分为治愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为 +、++、+++等。

等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。

5.误差、系统误差、随机测量误差、抽样误差有何区别?对误差控制各有何要求?如何控制?(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。

要尽量查明其原因,必须克服。

(2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。

譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。

对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。

一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。

(3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。

这种差异是由抽样引起的,故这种误差叫做抽样误差,要用统计方法进行正确分析。

单变量资料的统计描述名词解释平均数:平均数是指在一组数据中所有数据之和再除以数据的个数。

均数:均数是指在一组数据中所有数据之和再除以数据的个数。

几何均数:是用于反映一组经对数转换后呈对称分布的变量值在数量上的平均水平,在医学研究中常适用于免疫学的指标。

中位数与百分位数:指将数据按大小顺序排列起来,形成一个数列,居于数列中间位置的那个数据。

百分位数:统计学术语,如果将一组数据从小到大排序,并计算相应的累计百分位,则某一百分位所对应数据的值就称为这一百分位的百分位数。

全距(极差):全距是用来表示统计资料中的变异量数,其最大值与最小值之间的差距标准差:标准差,也称均方差,是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根,用σ表示。

变异系数:变异系数又称“标准差率”,是衡量资料中各观测值变异程度的另一个统计量。

当进行两个或多个资料变异程度的比较时,如果度量单位与平均数相同,可以直接利用标准差来比较。

简答题:1、试述频数表的要素及用途。

要素:组段,频距。

用途:①描述资料的分布特征和分布类型。

频数分布有两个重要特征:集中趋势和离散趋势。

大部分观察值向某一数值集中的趋势称为集中趋势,常用平均数指标来表示,各观察值之间大小参差不齐。

频数由中央位置向两侧逐渐减少,称离散趋势,是个体差异所致,可用一系列的变异指标来反映。

②便于进一步计算有关指标或进行统计分析。

当数据较多且需手工计算时,常先编制频数表,再进行统计计算。

③发现特大、特小的可疑值。

如果频数表的一端或两端出现连续几个组段的频数为零后,又出现少数几个特大值或特小值,使人怀疑其是否准确,需进一步检查和核对并做相应处理。

④当样本含量比较大时,可用各组段的平率作为概率的估计值。

2、描述单变量资料的统计指标分哪两大类,分别是什么指标?分类:①描述数据分布集中趋势的指标:算术均数、几何均数、中位数。

②描述数据分布离散程度的指标:极差、四分位数间距、方差、标准差、变异系数。

3、试述平均数、标准差、变异系数的含义及用途?4.什么对象可作为医学正常参考值的正常人?如何制定95%正常参考值范围?所谓“正常人”不是指健康人,而是指排除了影响所研究指标的疾病和有关因素的同质人群。

制定参考值范围:1.决定参考值范围的单双侧根据一个指标是否过大、过小均属异常,决定该指标的参考值范围是双侧范围还是单侧范围。

若一个指标过大、过小均属异常,则相应的参考值范围既有上限又有下限,是双侧参考值范围;若一个指标仅过大属异常,则此指标的参考值范围只有上限,是单侧参考值范围;若一个指标仅过小属异常,则此指标的参考值范围只有下限,也是单侧参考值范围。

2.利用大样本资料制定参考值范围随机抽取一个大样本后,如果指标服从正态分布,就采用正态分布法制定其参考值范围。

如果指标不服从正态分布,就采用百分位数法。

5.正态分布曲线下面积有何分布规律?所有的正态分布曲线,在υ左右的相同倍数的标准差范围内的面积相同。

并且,在υ±σ范围内的面积约为68.3%;在υ±1.96σ范围内的面积约为95%;在υ±2.58σ范围内面积约为99%。

6.资料的标准差是否一定小于均数?均数和标准差是两类不同性质的统计指标.标准差用于描述数据的变异程度,变异程度大,则该值大,变异程度小,则该值小.标准差可大于均数,也可小于均数。

单变量资料的统计推断名词解释抽样误差与标准误:抽样方法本身所引起的误差。

当由总体中随机地抽取样本时,哪个样本被抽到是随机的,由所抽到的样本得到的样本指标x与总体指标μ之间偏差,称为实际抽样误差。

标准误,即样本均数的标准差,是描述均数抽样分布的离散程度及衡量均数抽样误差大小的尺度,反映的是样本均数之间的变异。

标准误不是标准差,是多个样本平均数的标准差。

可信区间:按一定的概率或可信度(1-α)用一个区间来估计总体参数所在的范围,该范围通常称为参数的可信区间或者置信区间,预先给定的概率(1-α)称为可信度或者置信度常取95%或99%.假设检验:假设检验是数理统计学中根据一定假设条件由样本推断总体的一种方法。

第一类错误:即统计推断结果拒绝了实际上成立的H。

,犯了“弃真”的错误。

又称假阳性错误。

第二类错误:即统计推断的结果不拒绝实际上不成立的H。

,犯了“存伪”的错误。

又称假阴性错误。

t分布: t分布为一簇单峰分布曲线,以0为中心,左右对称。

主要用于总体均数的区间估计和t检验。

简答题:1、标准差与标准误有何区别和联系?•区别:1.含义不同:⑴s描述个体变量值(x)之间的变异度大小,s越大,变量值(x)越分散;反之变量值越集中,均数的代表性越强。

⑵标准误是描述样本均数之间的变异度大小,标准误越大,样本均数与总体均数间差异越大,抽样误差越大;反之,样本均数越接近总体均数,抽样误差越小。

2.与n的关系不同: n增大时,⑴s σ(恒定)。

⑵标准误减少并趋于0(不存在抽样误差)。

3.用途不同: ⑴s:表示x的变异度大小,计算cv,估计正常值范围,计算标准误等⑵ :参数估计和假设检验。

•联系:二者均为变异度指标,样本均数的标准差即为标准误,标准差与标准误成正比。

2.统计描述与统计推断分别应该掌握哪些要点?3.T检验证、z检验的的公式有哪些类型,在应用上有何异同?t检验:当样本例数n较小时,要求样本取自正态总体。

t检验的类型:单样本t检验,独立t检验,配对t检验z检验:样本例数较大,或n虽小而总体标准差已知。

4、在统计推断中,如何区别单侧检验和双侧检验?如果将拒绝性概率平分于理论抽样分布的两侧,称为双侧检验。

例如选定显著性水平α= 0.05,双侧检验就是将α概率所规定的拒绝区域平分为两部分而置于概率分布的两边,每边占有 =0.025。

双侧检验只强调差异是否显著而不强调方向性。

如果将拒绝性概率置于理论抽样分布的一侧(左侧或右侧),称为单侧检验(右侧检验或左侧检验)。

单侧检验强调差异的方向性。

在具体的假设检验中,选择双侧检验或单侧检验可分为以下三种情况:第一种:H0:μ=μ:μ≠μ双侧第二种:H0:μ≥μ:μ<μ单侧(左侧)第三种:H0:μ≤μ:μ>μ单侧(右侧)6设检验和总体均数区间估计有何联系?假设检验:是对总体做出某种假定,然后根据样本信息推断总体是否成立的一类统计学方法总称。

相关主题