医学统计学概论
Multi-stage sampling is a kind of complex sample design in which two or more levels of units are imbedded one in the other.
4.变量与资料(variable and data)
医学论文中的统计学问题
➢ New Science 杂志调查 Ⅰ 74%有不正当修改数据的情况 Ⅱ 17%拼凑实验结果 Ⅲ 7%凭空捏造数据
Ⅰ Ⅳ 2%故意曲解结果
3
今日科学2015-10-14
重庆医科大学副校长论文涉嫌捏造评审过程被撤销
据外媒报道,被撤销的9篇论文均来自中国,这些论文作 者捏造评议人邮件,捏造评审意见并提交给期刊助论文 发表。中国学术圈一次性被大量撤稿已在国际学术圈引 起负面影响。今年3月,英国现代生物出版集团宣布撤销 银镜发表的43篇论文,其中有41篇来自中国大陆,撤稿 理由是发现有第三方机构有组织地为这些论文提供虚假 的同行评审。随后,斯普林格出版集团也宣布撤回旗下 10个学术期刊已经发表的64篇论文,这些文章全部出自 中国作者。
2. Define the size of the sample and calculate sampling interval (k = N/n)
3. Draw a random number ( k) for starting
4. Draw every k units from first unit
variation:difference existing among the variable values of homogeneity individuals
2. 参数与统计量(parameter 总体指 标,一般用希腊字母 表示。如 μ。
第一节 统计学的几个基本概念
一. homogeneity and variable 二. parameter and statistic 三. population and sample 四. Variable and date 五. error 六. relative frequenty and probability
将总体单位按某种特征分 为若干次级(层),然后 从每一层内单纯随机抽样 组成一个样本。
First, stratify the population into several strata by character of areas, ages, etc. then select objects using random sampling in each strata.
27
军人 5.24
变量转化
原则:变量只能由高级向低级转化
连续型
有序
多分类
二分类
离散型变量常常通过适当的变换或连续 性校正后借用连续型变量或有序变量的 方法来分析。
28
5.误差(Error)
误差:泛指实测值与真值之差。 Error:the difference between measurement value and true value.
变量:研究总体确定 后,研究者要对每个 观察单位的某项特征 进行测量和观测,这 种特征称为变量。
资料:变量的测得值或观 察值称为变量值,由变 量值构成资料。
资料分类:计量资料、 计数资料、等级资料
计量资料Measurement data
计量资料又称定量资料 或数值变量资料。为观 测每个观察单位某项指 标的大小而获得资料, 一般有度量衡单位。
7
1 同质与变异 .
(Homogeneity and Variation)
同质:影响被研究指标较 大,可以控制主要因素尽 可能相同或一致。
变异:在同质基础上各观
察单位之间的变异。
Homogeneity:common characteristics for the given individuals
统计量:由总体中随机抽 取样本而计算样本指标, 一般用拉丁字母表示。统 计量是参数附近波动的随 机变量 。
3.总体与样本 (population and sample)
根据研究目的 而确定的同质 观察单位全体, 分为有限总体 和无限总体。
The whole homogeneity individuals determined by specific purpose. Finite population:the space, time and population for a specific population have been limited. Infinite population: no time and space limits for the population. Suchpopulations only exist in imagination, so it is called infinite population
Statistics
Statistics ---- A science dealing with the collection, analysis, interpretation, and presentation of masses of numerical data” (Webster,s international Dictionary) The science and art of dealing with variation in data through collection,classification and analysis in such a way as to obtain reliable results.(A Dictionary of Epidemiology)
Example: Systematic sampling
整群抽样 Cluster sampling
将总体分成若干群组, 抽取其中部分群组作为 观察单位组成样本
The entire population of interest is divided into groups, or clusters, and a random sample of these clusters is selected.
特点 ☆ 半定量性质,每一个观察单位没有确切值。 ☆ 各组之间有性质上的差别或程度上的不同。 ☆ 各类资料可以转化,由高级向低级。
资料分类
病例号
1 2 3 4 5 6 7 8 9
年龄
(岁)
35 44 26 25 41 45 50 28 31
性别
女 男 男 女 男 女 女 男 女
身高 血型 心电图 尿WBC
分层随机分组 (stratified randomization)
总 体
可按年龄、性
层
层
层
别、种族、教
育水平等分层
在各层内再 进行简单随 机分组
多级抽样 Multistage sampling
将抽样过程分阶段进行,每个阶段使用的抽样 方法往往不同,即将以上抽样方法结合使用, 在大型流行病学调查中常用。
减少抽样误差方法
(1)改进抽样方法(误差从大到小) 整群抽样单纯随机抽样系统抽样分层抽样 (2) 增加样本量 (3)选择变异程度较小的研究指标。
12
抽样方法
1
2
3
4
5
整群 抽样
单纯 随机 抽样
系统 抽样
分层 抽样
多级 抽样
单纯随机抽样
Simple random sampling
最简单、最基本抽样方法 从总体N个对象中,利用 抽签或其他随机方法抽取 n个 总体中每个对象被抽到概 率相等
Simplest and basic method To select number n subjects by drawing lot or by using a table of random number from population with N units Equal chance for each subject in the target population
Measurement data: it is also called as quantitative or numerical data. Its value is quantitative. Measurement data always has measurement units.
计数资料(enumeration data)
单纯整群抽样(Simple cluster sampling) 二阶段抽样 (Two stages sampling)
Example: Cluster sampling
Section 1
Section 2
Section 4
Section 3 Section 5
分层抽样 Stratified sampling
Ranked data: ordinal or semiquantitative data. It need to classify observatory units into different classes according the extent before calculate the frequencies of each groups. There exists obvious differences among different classes.
Postgraduate books recommended by Degree Management and Postgraduate Education Bureau, Ministry of Education
生活中的统计问题…
药物疗效的判断?(假设检验) 彩票中奖的几率?(概率论) 子女身高与父母身高的关系?(相关与回归) 同龄孩子为什么有胖有瘦(医学参考值) 人口普查资料(抽样) 统计学是对令人困惑费解的数字问题做出设想的艺术。