第八章科研资料的整理与分析
(2)确定显著性水平: 显著性水平是用来判断小概率事
件是否发生的标准,常用 通常
(3)计算统计量:
来表示。
取值为0.05 或 0.01。
2 根据所选用的统计方法,公式计 算相应的统计量,如t值、F值、 值
等
(4)确定概率值 根据计算所得的统计量查相应的 工具表可得出概率P的大小。从而得 出概率P与a大小的关系 计算机软件进行统计处理时会自
计量资料 计数资料
12 kPa 轻度高血压 15 kPa 中度高血压 17 kPa 重度高血压
等级资料
二、描述性统计
统计描述是指用统计指标、统计表 、统计图等方法,对资料的数量特 征及其分布规律进行测定和描述不 涉及由样本推论总体问题。
1. 计量资料的描述性分析: 集中趋势 众数(mode):在分布中出现频率最高的 数值。 中位数(median):是将一组观察值从 小到大按顺序排列,住次居中的观察 值。 平均数(mean):反映一组观察值在数 量上的平均水平
140 120 100 80 60 40 20 0
© §£ ¨1/Ç Ê £ ö Â À Í ù Ë ¤´ Ó
1949 1950 1951 1952 1953 1954 1955 1956 1957 1958 Ä ê« Ý
¼ Í5Ä ±³ Ø 1949-1958Ä êÓ ¤´ ùË ÀÍ öÂ Ê
动报告P值的大小
(5)作出推断结论
如果P>α,则H0假设成立,即两种 扫床方法扫床后空气中菌落数无差别。 如果P<α,则H1假设成立,拒绝H0
接受H1 ,差别有统计学意义。即 两种
扫床方法扫床后空气中菌落数有差别。
(二)常用的推断性统计 方法
计量资料
t检验:(大样本用u检验) 样本均数与总体均数的比较 两样本均数的比较(独立样本t检验) 配对样本均数比较(配对t检验) 方差分析(F检验) 适用于两个以上样本均数比较 两个以上样本均数间的两两比较用q检验 相关分析:变量间相互关系的密切程度 回归分析:某变量随着其他变量的变化而变化的数量 关系
三、推断性统计
定义:统计推断是指如何由样本信息推 断总体特征问题。 先看2组数据,比较AB两地人的身高。 A162 164 166 表面看B高,实际一样。 164 166 168 为何差异?抽样误差。 到底如何判断?假设检验 B164 166 168 162 164 166
参数: 总体的统计指标 μ π σ 统计量: 样本的统计指标 x ρ s
平均数
1、均数:即算术平均数的简称,反映 一组观察值在数量上的平均水平。 总体均数用希腊字母ū表示,样本均数 用X表示。 2. 几何均数(geometric mean G): 适用 于资料变量值呈倍数变化(等比资料) 或偏态分布资料
2.离散趋势
离散趋势:一组计量资料中各数据 之间的参差程度。 了解资料离散情况的常用指标有极 差、方差、标准差和变异系数,最 常用的是标准差和方差。
利用线条高低、面积大小等来代表数
量。通俗易懂,便于理解和比较。
统 计 图 和 统 计 表
但从统计图中不 能获得确切数字
常用的统计图类型
1.直条图 2.百分条图、圆图 3.线图、半对数线图
4.直方图
5.散点图
条图(bar chart) 适用资料: 不连续的、
有明确分组的资料。
形式:单式(图1)
复式(图2)
百分条图(percentage bar chart)
适用资料:计数资料的构成比
形式:以各段面积所占的百分比来表示各
部分在全体中所占的比例
绘制要点:
一定有标尺在图 的上方或下方,全 长100%;附图例说 明
ºÎ ô üÏ ³¼ °° ¡ «È ² ¾° ¡ ÏÌ È ìÈ ªÏ Ý äË Æ ü
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
第八章 科研资料的 整理与分析
科研顺序
拿到资料-核查原始数据并整理(录入 易查) 进行分析(前提弄清数据类型) 根据数据类型借助SPSS统计分析(描 述和推断) 分析的结果用图和表在论文呈现
主要内容
第一节科研资料的整理 第二节科研资料的统计学分析
第一节科研资料的整理
原始数据和资料是庞杂和无序的,经过 整理和加工使之系统化条理化,这是资 料的整理过程。资料的整理是统计分析 的前提。 两方面:核校原始数据、建立数据库
相对比(ratio R): 指两个有关指标之比, 说明A是B的若干倍 或百分之几. 指标可以性质相同或不同 相对比=A/B, 护士数与床位数之比 构成比(percentage):又称百分比, 表示事物内部各组成部分 在总和中所占比重的大小 率(rate):指某种现象人数占调查人数的比例。 例:某地区老年人640人,其中患病者为320人,有患 者痴呆病患者8人,问患老年痴呆者的构成比和百分率各 是多少。构成比=8/320×100%=2.5% 百分率=8/640×100%=1.25%
标准差(S):
一般都是计算样本的标准差。 单用均数不能表达出实验数据的离散程序, 还需要通过计算标准差值来反映均数中各值的 波动范围(离散程度),标准差值越小,说明 观察值(X)的变异程度越小,则均数的代表 性越好,收集的资料可靠性大。 在论文中均数和标准差以
x s 的形式写出。
2. 计数资料的统计描述
绘制要点:横轴为观察
项目,纵轴为数值;各 直条等宽,等间距;间 距宽度与条宽相等或等 于条宽的1/2
120 100 80 60 40 20 0 © Ö © ¢ Ä Ñ Ð ª ¹ Ü ¼ ° ° ¡
© ò £ ¨1/10Í Ê £ ö Â À Í Ë
Ä Ð Å ®
¼ 2.Ä Í ± ³ Ø 1995Ä ê © © Ö ¢ ¡ ¢ Ð Ä Ñ ª ¹ Ü ¼ ° ° ¡ Ë À Í ö Â Ê
第二节科研资料的统计学 分析
统计方法是揭开科学研究结果的钥 匙
选对钥匙开对门
一、资料类型 二、描述性统计 三、推断性统计 四、统计表和统计图
统计学分析分为两大类:描述性统计 和推断性统计。 两大类方法的分析前提一定要明确 资料的类型。
一、资料类型
计量资料
计数资料
等级资料
1、计量资料
定义: 用仪器、工具等测量方法获得的数据,
¼ 3.Ä Í ±³ Ø 5Ë êÒ ÔÏ Â´ ùÍ ¯Ë ÀÒ ò« Ö° ¼
9%
18%
圆图 (pie chart)
30%
43%
º ô « ² È Ï ä Æ
Î ³ ü Ï ¼ ° ° ¡ ¾ ° È ¡ ì Ð Ì Ô ° ¼ ° ¡ ü Ë
¼ 4.Ä Í ± ³ Ø 5Ë ê Ò Ô Ï Â ´ ù Í ¯ Ë À Í ö Ô Ò ò Ö «° ¼
2、假设检验:应用统计学的原理从 样本之间的差别去推断样本所代表的
基 本 概 念
总体之间是否存在差别的一个重要的
推断方法,又称显著性检验。
实际抽样差异时统计学回答
湿干扫哪个更能减少空气中菌落数
假设检验的步骤
(1)建立假设:无效假设H0
备择假设H1
如:H0:两种扫床方法扫床后空气中菌落数
无差别 H1:两种扫床方法扫床后空气中菌落数 有差别
对各观察单位用定量方法测定某项指标量的 大小,一般有度量衡单位。
特点:有计量单位,如患者的身高(cm)、
体重(kg)、血压(mmHg)、脉搏(次/分)、 红细胞计数(1012/L)
2、计数资料
定义:将全体观察单位按某种性质或特征
分组,然后分别清点每组中观察单位的个数 所得的数据称计数资料。
特点:如肤色(黑、白)、血型(A、B、
计数资料 四格表X2检验:两个样本率的比较 行×列表X2检验:多个样本率或构 成比的比较 等级资料: 秩和检验
常用统计分析方法
描述性统计 计量资料 均数、几何均数、 中 位数、众数、方差、 标准差、变异系数、 相关与回归分析 计数资料 率、相对比、构成比 推断性统计
t 检验、 u
检验、 方 差分析、 或 秩和检验 2 检验 、 二项分布 2 检验、 秩和检验
O)、性别(男、女);无固有计量单位, 且均为整数,
3. 等级资料(Rank data)
定义:是介于计量资料和计数资料之间的一
种资料类型,也称半定量资料、有序分类资 料。如: ①癌症分期:早、中、晚 ②药物疗效:治愈、好转、无效、死亡 ③尿蛋白: 、、、++、+++及以上
三类资料举例
一组2040岁成年人的血压 以12kPa为界分为正常与 异常两组,统计每组例数
绘制表格的基本要求
1 、 表号、表题: 表格上方中央,扼要说明 表的主要内容。 2 、 标目: 有计量单位者应注明单位。标目 均须注法定计量单位,标目应遵循从小到 大排列。
3 、 线条: 统计表中只有横线,无竖线和斜 线。通常为三线表,复合表可出现分层线
4、数字:用阿拉伯数字表示,同一列 小数位数一致,且位次对齐。表格 中不应有空格,暂无记录或未记录 用“· · · ”表示,无数据用“—”表 示,数据为零则填“0”。
数量关系。
结构:统计表由文字、数字和线条组成
统计表的结构
表1 甲、乙两地某年HbsAg阳性率
地区
甲地 乙地
表号、表题 顶线
横标目 分界线 数据
调查数
5000 6000
阳性数 阳性率(%)
1100 1050 22.0 17.5
合计
11000
2150
19.5
纵标目
底线
统计表的结构
分层线 表2 甲乙两种方法治疗压疮的效果
等级资料 率、构成比
注:当资料分布类型为不确定或者呈非正态分布 时,可选用秩和检验