当前位置：文档之家› 数据分析实验报告

数据分析实验报告

.000
.
.018
.025
N
21
21
21
21
x3
相关系数
.434*
.511*
.691**
Sig.（双侧）
.049
.018
.
.001
N
21
21
21
21
x4
相关系数
.431
.488*
.691**
Sig.（双侧）
.051
.025
.001
.
N
21
21
21
21
**.在置信度（双测）为时，相关性是显着的。
*.在置信度（双测）为时，相关性是显着的。
第一次试验报告
习题
1建立数据集，定义变量并输入数据并保存。
2数据的描述，包括求均值、方差、中位数等统计量。
分析—描述统计—频率，选择如下：
输出：
统计量
全国居民
农村居民
城镇居民
N
有效
22
22
22
缺失
0
0
0
均值
中值
方差
百分位数
25
50
75
3画直方图，茎叶图，QQ图。（全国居民）
分析—描述统计—探索，选择如下：
21
**.在.01水平（双侧）上显着相关。
结果：x4与其他数据无相关性，其他三组数据线性相关
相关系数
x1
x2
x3
x4
Spearman的rho
x1
相关系数
.790**
.434*
.431
Sig.（双侧）
.
.000
.049
.051
N
21
21
21
21
x2
相关系数
.790**
.511*
.488*
Sig.（双侧）
概率论课本习题
8一个正态总体独立样本均值的t检验与区间估计
分析—比较均值—独立样本T检验：
输出：
One-Sample Statistics
N
Mean
Std. Deviation
Std. Error Mean
折断力
10
结果：样本均值为与总体均值2820比较接近
One-Sample Test
Test Value = 2820
输出：
全国居民Stem-and-Leaf Plot
Frequency Stem & Leaf
0 . 4
0 . 56788
1 . 03
1 . 7
2 . 3
2 . 689
3 . 1
Stem width: 1000
Each leaf: 1 case(s)
分析—描述统计—QQ图，选择如下：
输出：
习题
4数据正态性的检验：K—S检验，W检验
习题
5多维正态数据的统计量
数据：
统计量
x1
x2
x3
x4
N
有效
21
21
21
21
缺失
0
0
0
0
均值
均值向量为：
项间协方差矩阵
x1
x2
x3
x4
x1
x2
x3
x4
相关性
x1
x2
x3
x4
x1
Pearson相关性
1
.766**.385.336源自显着性（双侧）.000
.085
.136
N
21
21
21
21
x2
Pearson相关性
t
df
Sig. (2-tailed)
Mean Difference
95% Confidence Interval of the Difference
Lower
Upper
折断力
9
.254
结果：
t值为小于临界值，且P值为大于显着性水平，接受原假设，即认为样本均值与总体均值之差可能是抽样误差所导致
概率论课本习题
数据：
取显着性水平为
分析—描述统计—探索，选择如下：
（1）K—S检验
单样本Kolmogorov-Smirnov检验
身高
N
60
正态参数a,,b
均值
标准差
最极端差别
绝对值
.089
正
.045
负
Kolmogorov-Smirnov Z
.686
渐近显着性(双侧)
.735
a.检验分布为正态分布。
b.根据数据计算得到。
9两个正态总体均值差异比较的t检验与配对检验
分析—均值比较—独立样本T检验，选择如下：
输出：
结果：P值为1大于显着性水平，认为方差相等。此时，p值（Sig. (2-tailed)）为大于显着性水平，认为样本均值是相等的，即电阻均值没有显着性差异。
分析—比较均值—配对样本T检验，选择如下：
输出：
结果同上：认为样本均值是相等的，即电阻均值没有显着性差异。
.766**
1
.427
.340
显着性（双侧）
.000
.054
.131
N
21
21
21
21
x3
Pearson相关性
.385
.427
1
.613**
显着性（双侧）
.085
.054
.003
N
21
21
21
21
x4
Pearson相关性
.336
.340
.613**
1
显着性（双侧）
.136
.131
.003
N
21
21
21
结果：由Spearman相关矩阵的输出结果看，取显着性水平，p值皆小于，所以数据相关性显着
习题
6线性回归线的拟合，回归系数的区间估计与假设检验，回归系数的选择、逐步回归。
7残差分析
分析—回归—线性，选择如下：
输出：
逐步回归结果：
两变量的系数p值均小于均有统计学意义。
结果：由残差统计量表看出，数据无偏离值，标准差比较小，认为模型健康。
结果：p= 大于接受原假设，即数据来自正太总体。
（2）W检验
正态性检验
Kolmogorov-Smirnova
Shapiro-Wilk
统计量
df
Sig.
统计量
df
Sig.
身高
.089
60
.200*
.972
60
.174
a. Lilliefors显着水平修正
*.这是真实显着水平的下限。
结果：在Shapiro-Wilk检验结果，p=大于接受原假设，即数据来自正太总体。

e商务文档

数据分析实验报告

相关文档推荐：