当前位置:文档之家› 数据统计与分析方法

数据统计与分析方法

中学
分娩方式
顺产
妊娠结局
足月
2025653
2025830 2025677 2025647 2025848 2019915 2025861
22
25 24 30 32 27 29

管理人员 知识分子 管理人员 无 无 无
小学
大学 中学 大学 小学 中学 大学
助产
顺产 顺产 顺产 剖宫产 顺产 剖宫产
足月
1、什么是数据?
数据是指对客观事件进行记录并可以鉴 别的符号,是对客观事物的性质、状态以 及相互关系等进行记载的物理符号或这些 物理符号的组合。它是可识别的、抽象的 符号。
数据表现形式
表现形式一
2006年客户销售分析报表 A客户 12月 1月 B客户 C客户 D客户 E客户 F客户 G客户 H客户 合计
57.5% 60.2% 53.5% 51.5% 47.3% 47.4% 43.3% 37.4% 39.5% 35.5% 33.0% 30.4% 27.3% 25.5%
数据类型的分类
1、计量资料 (measurement data)
用仪器、工具等测量方法获得的数据,又称数值变量。 特点:有计量单位,如患者的身高(cm),体重(kg),血压(kPa)等.
1.69
1.7 1.71


160
1.77
编制频数表,绘制频数分布图
组段 (1) 0.5~ 0.6~ 正 划记 (2) 频数,f (3) 3 9 组中值,X ( 4) 0.55 0.65 fX (5)= (3)×(4) 1.65 5.85
0.7~
0.8~ 0.9~ 1.0~ 1.1~
正正
正正 正正正 正正正 正正正正
频数表的编制步骤
(1)求极差(range):即最大值与最小值之差,又称为全距。 (2)数据分组: 由样本容量n确定组数、通常分10-15个组; 一般采取等距分 组, 组距=极差/组数。 (3)列出组段:第一组段的下限略小于最小值,最后一个组段上限必须包 含最大值,其它组段上限值忽略。 (4)划记计数:用划记法将所有数据归纳到各组段,得到各组段的频数。
农民 0 6 10 28 25 10 11 3 5 1 1 2 102
商业服务 0 10 24 52 45 34 22 14 3 4 0 0 208
无 3 18 70 153 133 78 39 24 12 5 2 0 537
知识分子 0 0 11 44 70 57 17 3 2 1 1 0 206
2、计数资料 (count data)
按某种属性分类计数后得到的数据,又称无序分类变量,有二分 类和多分类两种情形. 特点:无计量单位,如肤色(黑白)、血型(ABO)、职业(工农兵)、 性别(1=男,2=女)等.
3、等级资料 (ordinal data)
半定性或半定量的观察结果,有大小顺序,又称有序分类变量. 如 ①癌症分期:早、中、晚。 ②药物疗效:治愈、好转、无效、死亡。 ③尿蛋白: ,,,++,+++及以上
第一部 数据统计概述
什么是统计方法
统计方法是指有关收集、整理、 分析和解释统计数据,并对其所 反映的问题作出一定结论的方法 。统计方法是一种从微观结构上 来研究物质的宏观性质及其规律 的独特的方法。
一般统计方法
根据数据的类型可以分为以下三种统计方法 1 、计量资料的统计方法** 2 、计数资料的统计方法 3 、等级资料的统计方法
X X 1 X 2 X n X n n
X
f1 X 1 fX 2 fX 3 f k X k fX i f1 f 2 f 3 f k f i
n为奇数 n为偶数
G n X1 X 2
Xn

fi lg X i G lg 1 f i
7 月
5月 108 77 85 141 78 100 154 743
8 月
6月 108 82 91 136 82 97 150 746
9 月
7月 114 80 92 134 78 89 136 723
1 0 月
8月 110 80 93 139 78 91 137 728
1 1 月
99 67 87 148 75 87 132 696
描述性分析:数据分时段走势、差距变化情况以及 相应的时间背景
数据表现形式三
销售码洋结构比
90% 80% 70% 60% 50% 40% 30% 20% 10% 0% 12月 1月 2月 3月 4月 5月 6月 7月 8月 9月 10月 11月 12月 13.2% 31.0% 21.1% 43.4% 36.2% 30.8% 36.4% 36.1% 64.3% 67.0% 49.0% 85.3%
例: 率与构成比
白内障 患者年龄 年龄组 受检人数 例数 构成比(%) 患病率(%) ⑴ ⑵ ⑶ ⑷ ⑸=(3)/(2) 560 68 15.18 12.14 40~ 441 129 28.79 29.25 50~ 296 135 30.13 45.61 60~ 149 97 21.65 65.10 70~ ≥80 22 19 4.24 86.36 合计 1468 448 100.00 30.52
98 70 84 143 76 86 134 692
数据 列表
数据表现形式二
销售码洋趋势图
800 700 600 500 400 300 248 200 100 0 12月 1月 2月 3月 4月 5月 6月 7月 8月 9月 10月 11月 12月 422 303 269 320 224 245 255 254 237 211 171 166 412 420 381 667 595 470 410 366 403 330 343 247 477
表2-1: 160名正常成年女子的血清甘油三酯(mmol/L)
编号 1 2 3 4 5
血清甘油三脂 0.51 0.52 0.59 0.61 0.61
编号 … 153 154 155 156
血清甘油三脂 … 1.65 1.66 1.67 1.67
6
7 8
0.62
0.63 0.64
157
158 159
2019464
2025783
24
29
158
154
70.5
57.0
3
7

干部
中学
中学
助产
剖宫产
足月
足月
计量资料
计数资料
三类资料间关系
例:一组2040岁成年人的血压
<8 8
等级资 料
低血压 正常血压 轻度高血压 中度高血压 重度高血压
计量资料
12 15 两组,统计每组例数
实例数据
住院号 2025655 2025653 2025830 2022543 2022466 2024535 2025834 年龄 身高 27 22 25 23 25 27 20 165 160 158 161 159 157 158 体重 71.5 74.0 68.0 69.0 62.0 68.0 66.0 住院 天数 5 5 6 5 11 2 4 职业 无 无 管理员 无 商业 无 无 文化 程度 中学 小学 大学 中学 中学 小学 中学 分娩 方式 顺产 助产 顺产 剖宫产 剖宫产 顺产 助产 妊娠 结局 足月 足月 足月 足月 足月 早产 早产
运用统计方法应遵循的原则
坚持用数据说话的基本观点。 有目的地收集数据。 掌握数据的来源。 认真整理数据。
统计分析流程
确定问题确定分析目标 采用科学方法收集数据 考察数据时效性整理数据 统计分析 出具分析报告,提出解决 意或建议
计量资料的统计描述
1、频数分布 (frequency distribution) 为了了解数据的分布情况,可以编制频数表(frequency table).
1.7~1.8 合计
3
160
1.75
5.25
182.30
对称分布:以频数最多组段为中心左右
大体对称.
右(正)偏态分布: 频数最多组段右侧组段
数多.(skewed to the right distribution)
左(负)偏态分布: 频数最多组段左侧组段
数多.(skewed to the right distribution)
R X max X min
S
四分位间距:QR=P75- P25
X 2 X n
2
n 1
S CV 100% X
三、SPSS实现计量资料的统计描述
下面是SPSS软件中绘制频数图的步骤
四、计数资料的统计描述
1、计数资料数据的整理
住院号
2025655
年龄
27
职业

文化程度
足月 早产 足月 足月 死产 足月
2024601
2000386
25
26
农民

中学
小学
顺产
顺产
足月
足月
按年龄(2岁一组)与职业整理
年龄 18 20 22 24 26 28 30 32 34 36 38 40 合计
工人 2 9 28 50 50 34 11 14 4 2 3 0 207
管理人员 0 2 7 34 43 35 14 2 2 1 1 0 141
数据统计与分析方法
培训主要内容:
1、数据统计的一般方法;
2、数据分析的一般方法; 3、了解数据统计和分析在实际案例中的应用; 4、了解时间序列分析及相关软件应用;
心电图的由来
1780年有一天,43岁的意大利解剖学 家伽伐尼Galvani Luigi,1737-1798) ,在实验室解剖青蛙,在用银质手术 刀触碰放在铁盘上的青蛙的时候,无 意间发现青蛙腿部肌肉抽搐了一下, 仿佛受到电流的刺激.如果换用一种 金属器械去触动青蛙,就无此种反应 。 1832年,一个晴朗的日子,还是意 大利,还是青蛙,只是做实验的人 换成了马泰乌奇。 这一次,马泰乌奇探测到损伤和未 损伤的肌肉之间存在一种电流,他 称之为“肌肉电流”。他发现,包 括心脏在内,一切正在收缩的肌肉 都会产生肌肉电流。
相关主题