数据分析实验报告
.000
.
.018
.025
N
21
21
21
21
x3
相关系数
.434*
.511*
.691**
Sig.(双侧)
.049
.018
.
.001
N
21
21
21
21
x4
相关系数
.431
.488*
.691**
Sig.(双侧)
.051
.025
.001
.
N
21
21
21
21
**.在置信度(双测)为时,相关性是显着的。
*.在置信度(双测)为时,相关性是显着的。
第一次试验报告
习题
1建立数据集,定义变量并输入数据并保存。
2数据的描述,包括求均值、方差、中位数等统计量。
分析—描述统计—频率,选择如下:
输出:
统计量
全国居民
农村居民
城镇居民
N
有效
22
22
22
缺失
0
0
0
均值
中值
方差
百分位数
25
50
75
3画直方图,茎叶图,QQ图。(全国居民)
分析—描述统计—探索,选择如下:
21
**.在.01水平(双侧)上显着相关。
结果:x4与其他数据无相关性,其他三组数据线性相关
相关系数
x1
x2
x3
x4
Spearman的rho
x1
相关系数
.790**
.434*
.431
Sig.(双侧)
.
.000
.049
.051
N
21
21
21
21
x2
相关系数
.790**
.511*
.488*
Sig.(双侧)
概率论课本习题
8一个正态总体独立样本均值的t检验与区间估计
分析—比较均值—独立样本T检验:
输出:
One-Sample Statistics
N
Mean
Std. Deviation
Std. Error Mean
折断力
10
结果:样本均值为与总体均值2820比较接近
One-Sample Test
Test Value = 2820
输出:
全国居民Stem-and-Leaf Plot
Frequency Stem & Leaf
0 . 4
0 . 56788
1 . 03
1 . 7
2 . 3
2 . 689
3 . 1
Stem width: 1000
Each leaf: 1 case(s)
分析—描述统计—QQ图,选择如下:
输出:
习题
4数据正态性的检验:K—S检验,W检验
习题
5多维正态数据的统计量
数据:
统计量
x1
x2
x3
x4
N
有效
21
21
21
21
缺失
0
0
0
0
均值
均值向量为:
项间协方差矩阵
x1
x2
x3
x4
x1
x2
x3
x4
相关性
x1
x2
x3
x4
x1
Pearson相关性
1
.766**.385.336源自显着性(双侧).000
.085
.136
N
21
21
21
21
x2
Pearson相关性
t
df
Sig. (2-tailed)
Mean Difference
95% Confidence Interval of the Difference
Lower
Upper
折断力
9
.254
结果:
t值为小于临界值,且P值为大于显着性水平,接受原假设,即认为样本均值与总体均值之差可能是抽样误差所导致
概率论课本习题
数据:
取显着性水平为
分析—描述统计—探索,选择如下:
(1)K—S检验
单样本Kolmogorov-Smirnov检验
身高
N
60
正态参数a,,b
均值
标准差
最极端差别
绝对值
.089
正
.045
负
Kolmogorov-Smirnov Z
.686
渐近显着性(双侧)
.735
a.检验分布为正态分布。
b.根据数据计算得到。
9两个正态总体均值差异比较的t检验与配对检验
分析—均值比较—独立样本T检验,选择如下:
输出:
结果:P值为1大于显着性水平,认为方差相等。此时,p值(Sig. (2-tailed))为大于显着性水平,认为样本均值是相等的,即电阻均值没有显着性差异。
分析—比较均值—配对样本T检验,选择如下:
输出:
结果同上:认为样本均值是相等的,即电阻均值没有显着性差异。
.766**
1
.427
.340
显着性(双侧)
.000
.054
.131
N
21
21
21
21
x3
Pearson相关性
.385
.427
1
.613**
显着性(双侧)
.085
.054
.003
N
21
21
21
21
x4
Pearson相关性
.336
.340
.613**
1
显着性(双侧)
.136
.131
.003
N
21
21
21
结果:由Spearman相关矩阵的输出结果看,取显着性水平,p值皆小于,所以数据相关性显着
习题
6线性回归线的拟合,回归系数的区间估计与假设检验,回归系数的选择、逐步回归。
7残差分析
分析—回归—线性,选择如下:
输出:
逐步回归结果:
两变量的系数p值均小于均有统计学意义。
结果:由残差统计量表看出,数据无偏离值,标准差比较小,认为模型健康。
结果:p= 大于 接受原假设,即数据来自正太总体。
(2)W检验
正态性检验
Kolmogorov-Smirnova
Shapiro-Wilk
统计量
df
Sig.
统计量
df
Sig.
身高
.089
60
.200*
.972
60
.174
a. Lilliefors显着水平修正
*.这是真实显着水平的下限。
结果:在Shapiro-Wilk检验结果 ,p=大于 接受原假设,即数据来自正太总体。