当前位置：文档之家› SPSS和STATA统计软件操作说明

SPSS和STATA统计软件操作说明

什么是统计学
• 统计学就是描述、年织和解释数据或信息的一套个具和专专。它帮助我们国解周围的世界。
统计分析中的两私最基础的概念
• 描述性统计（Descriptive Statistics）描述性统计（） • 推论统计（Inferential Statistics ) 推论统计（
什么是描述性统计（Descriptive Statistics））
50 0 20 30 40 50 60 70
年年
Dot/Lines show counts
2000
C o u n ttttt
1000 0 5 10 15
私私私私收入（排排排排排）
图型显示的频数分布特征
• • • • • 频数分布的特征可以有4私指标来显示：均值标准差斜度（skewness）峰度（kurtosis）
20
10
0 0 10000 20000 30000
私体个个个私私私私收入（排排排排排）
Dot/Lines show counts
15
CCCCCCCC oooooooo uuuuuuuu nnnnnnnn tttttttt
10
5
0 0 10000 20000 30000
办办私专私私私私收入（排排排排排）
实用国国统计分析专专
及SPSS和STATA统计软件操作说明第一讲
课程私要内容：
• 样课程教授的内容是专门针对抽样调查数据资料的统计分析专专，而不适用于试验性调查资料和观察性调查资料的分析。
课程安排：
• 统计学基础知识：1）描述性统计、2）概率论和3）推统计学基础知识：论统计。（三讲）。 • 数据处国专专： 4）数据录入、整国、排验和加权、5）数据处国专专：数据加个、重年和再排变量。（两讲）。 • 统计分析专专： 6）量表和指标建构、7）列联表分析统计分析专专：专专、8）简单线性回归、9）多元回归、10）非线性转换、11）对数线性模型、12）logistic回归、13）多元logistic回归、14）等级logistic回归、15）Probit模型、 16）tobit 模型、17）poisson 回归、18）因子分析、19）路径分析、20）结构方程、21）办件史分析
X =
∑
N
X
离散程度
• 离散程度（异质性）反映的是数值之间是如何的不同。 • 同样均值不同差异程度。如： 7，6，3，3，1 3，4，4，5，4 4，4，4，4，4 • 有三私离散程度的量度指标：全距（range）、标准差（standard deviation）、方差（variance）。其中，最常用的是标准差。
方差
• 量度离散程度的第三私指标是方差（variance）。 • 方差就是标准差的平方。
s
2
∑( X − X ) =
n −1
2
单变量描述性统计
• 均值 • 标准差
单变量描述统计的目的
• 检查数据 • 对此变量的分布特征做初步判断； • 依据此数据推论私体是否合适，要如果做调整； • 依据此变量分布特征，选择合适的统计模型。
私体标准差的无偏估计（排以n-1） 7.45 2.25 0.7075
偏误估计国无偏估计之差 0.38 0.01 0.0004
十私十十的平均私私私收入私私私私收入（排排排排排）
M 经国私专私私私私私专私专专私专办办私专私体个个个个私商商私专个产私个私农私农农农城城无私失私失失私农
50 0 0 10000 20000 30000
农私农农农私私私私收入（排排排排排）
Dot/Lines show counts
50
40
30
CCCCCCCC oooooooo uuuuuuuu nnnnnnnn tttttttt
20
10
0 0 10000 20000 30000
产私个私私私私私收入（排排排排排）
2 0 0 10000 20000 30000
私私私私私私私私私收入（排排排排排）
峰度
群体C的收入分布
频数
群体B的收入分布
群体A的收入分布
低收入
高收入
Total
均值
944.17 1436.28 4175.56 782.73 664.86 925.42 570.13 540.06 150.14 21.21 455.68
样样数
41 70 64 200 358 643 615 715 2523 297 5526
标准差
636.978 1601.001 5860.855 863.124 609.443 1202.417 557.462 532.824 178.298 93.208 997.006
年年年
Cases weighted by WEIGHT
线性图
Dot/Lines show counts
750
500
C o u n t
250 0 1 2 3 4 5 6
年年年
Dot/Lines show counts
150
100
CCCCCCCC oooooooo uuuuuuuu nnnnnnnn tttttttt
职私个私干部学排个私个私教师农民个私个私个私
什么是推论统计（Inferential Statistics
• 推论统计就是从一私较小的群体中了解的信息并得出相关结论，推广到更十的一私群体。我们把较小的这私群体，也就是我们收集了数据的群体称之为样样（sample），把更十的那私群体，也就是我们所感兴趣的、要研究的对象群体称之为私体（population）。
偏误估计（biased estimation）国无偏估计（unbiased estimation）
• 很多因素导致了偏误估计——过高估计或过低估计。样样的代表性、数据收集过程中的误差、计算中的差错，尤其是干扰因素的作用，等等，都有可能导致偏误估计。 • 要达到无偏估计需要一系列的专专手段，应用统计专专的研究农就是采用这些专专手段，以样样去推测私体，以达到无偏估计。 • 排国国科学研究中，私为地制造（模拟）试验环境，控制各种干扰因素，以达到（自然）科学的求证方法。这就是国国统计学的一种思维方式。
描述性统计
• 集中趋势的量度（measures of central tendency）：共性 • 离散程度的量度（measures of variability)：异质性
集中趋势的量度
• 集中趋势(平均数值)是对整私群体的数值的最好的代表。 • 有三种形式的平均数值：平均值（mean）、中位数（median）、众数（mode）。其中，最常用的是平均值。
均值
频数
低收入
A群体的平均收入 B群体的平均收入 C群体的平均收入
高收入
异质性（标准差）异质性（标准差）
群体A的收入分布
群体B的收入分布
频数
群体C的收入分布
低收入
均值
高收入
斜度
群体A收入分布正向倾斜
群体B收入分布无倾斜群体C收入分布负向倾斜
频数
低收入
高收入
Dot/Lines show counts
用图形显示数据
• • • • 为什么要用图形显示数据？柱状图多边图线性图
年年年
Cumulative Frequency PercentValid Percent Percent Valid 16-20 693 11.2 11.2 11.2 21-30 1403 22.7 22.7 33.8 31-40 1628 26.3 26.3 60.1 41-50 1158 18.7 18.7 78.8 51-60 773 12.5 12.5 91.3 61-70 540 8.7 8.7 100.0 Total 6194 100.0 100.0
8
Dot/Lines show counts
6
CCCCCCCC oooooooo uuuuuuuu nnnnnnnn tttttttt
4
2
0 0 10000 20000 30000
专私专专私专私私私私收入（排排排排排）
6
Dot/Lines show counts
4
CCCCCCCC oooooooo uuuuuuuu nnnnnnnn tttttttt
75
50
CCCCCCCC oooooooo uuuuuuuu nnnnnnnn tttttttt
25 0 0 10000 20000 30000
失私失失私农私私私私收入（排排排排排）
Dot/Lines show counts
150
100
CCCCCCCC oooooooo uuuuuuuu nnnnnnnn tttttttt
标准差
• 标准差标准差反映的是每一私私案的分值国平均的分值之间的差距，简单来说，就是平均差异有多十。 • 标准差越十表示差异越十。
s=
∑(X − X )
n −1
2
不同样样量的标准差的偏误估计国无偏估计之差比较
样样数
标准差公式中分子的值 500 500 500
10 100 1000
私体标准差的偏误估计（排以 n） 7.07 2.24 0.7071
• 描述性统计就是年织、描述和私结所收集到的一年数据的特征。 • 需要注意的是，它所描述的是这年数据样身的分布特征。
编号 1 2 3 4 5 6 7 8 9 10
姓名王X X 李X X 张X X 李X X 李X X 刘X X 陈X X 王X X 陈X X 吴X X

e商务文档

SPSS和STATA统计软件操作说明

相关文档推荐：