《统计实习》SPSS实验报告姓名:成功学号:2011516199班级:会计二班实验报告二实验项目:描述性统计分析实验目的:1、掌握数据集中趋势和离中趋势的分析方法;2、熟练掌握各个分析过程的基本步骤以及彼此之间的联系和区别。
实验内容及步骤一、数据输入案例:对6名男生和6名女生的肺活量的统计,数据如下:1.打开SPSS软件,进行数据输入:通过打开数据的方式对XLS的数据进行输入其变量视图为:二、探索分析进行探索分析得出如下输出结果:浏览由上表可以看出,6例均为有效值,没有记录缺失值得情况。
由上表可以看出,男女之间肺活量的差异,男生明显优于女生,范围更广,偏度大。
男男 Stem-and-Leaf PlotFrequency Stem & Leaf2.00 1 . 342.00 1 . 892.00 2 . 02Stem width: 1000Each leaf: 1 case(s)女女 Stem-and-Leaf PlotFrequency Stem & Leaf2.00 1 . 233.00 1 . 568 1.00 2 . 0Stem width: 1000Each leaf: 1 case(s)三、频率分析进行频率分析得出如下输出结果:由上图可知,分析变量名:肺活量。
可见样本量N为6例,缺失值0例, 1500以下的33%,1500-2000男生33%女生50%,2000以上女生16.7%,男生33%。
四、描述分析进行描述分析得出如下输出结果:由上图可知,分析变量名:工资,可见样本量N为6例,极小值为男1342女1213,极大值为男2200女2077,说明12人中肺活量最少的为女生是1213,最多的为男生有2200,均值为1810.50/1621.33,.标准差为327.735/325.408,离散程度不算大。
五、交叉分析实验报告三实验项目:均值比较实验目的:.学习利用SPSS进行单样本、两独立样本以及成对样本的均值检验。
实验内容及步骤(一)描述统计案例:某医疗机构为研究某种减肥药的疗效,对15位肥胖者进行为期半年的观察测试,测试指标为使用该药之前和之后的体重。
编号 1 2 3 4 5服药前198 237 233 179 219服药后192 225 226 172 214编号 6 7 8 9 10服药前169 222 167 199 233服药后161 210 161 193 226编号11 12 13 14 15服药前179 158 157 216 257服药后173 154 143 206 249输入SPSS建立数据。
由上图可知,结果输出均值、样本量和标准差。
因为选择了分组变量,所以三项指标均给出分组及合计值,可见以这种方式列出统计量可以非常直观的进行各组间的比较。
由上表可知,在显著性水平为0.05时,服药前后的概率p值为小于0.05,拒绝零假设,说明服药前后的体重有显著性变化(二)单样本T检验进行单样本T检验分析得出如下输出结果:由上表可以知,单个样本统计量分析表,的基本情况描述,有样本量、均值、标准差和标准误,单样本t检验表,第一行注明了用于比较的已知总体均值为14,从左到右依次为t值(t)、自由度(df)、P值(Sig.2-tailed)、两均值的差值(Mean Difference)、差值的95%可信区间。
由上表可知:t=34.215,P=0.000<0.05。
因此可以认为肺气肿的总体均值不等于0.(三)双样本T检验案例:研究某安慰剂对肥胖病人治疗作用,用20名患者分组配对,测得体重如下表,要求测定该安慰剂对人的体重作用是否比药物好。
进行双样本T检验得出如下输出结果:T检验成对样本统计量均值N 标准差均值的标准误对 1 安慰剂121.80 10 11.419 3.611 组药物组111.80 10 10.185 3.221由上图可知,对变量各自的统计描述,此处只有1对,故只有对1。
成对样本相关系数N 相关系数Sig.对1 安慰剂组& 药物组10 .802 .005此处进行配对变量间的相关性分析成对样本检验成对差分t df Sig.(双侧)均值标准差均值的标准误差分95%置信区间下限上限对1 安慰剂组-药物组10.006.896 2.181 5.067 14.9334.586 9 .001配对t检验表,给出最终的检验结果,由上表可见P=0.001,故可认为安慰剂组和药物组对肥胖病人的体重有差别影响实验报告四实验项目:相关分析实验目的:1.学习利用SPSS进行相关分析、偏相关分析、距离分析、线性回归分析和曲线回归。
实验内容及步骤(一)两变量的相关分析案例:某医疗机构为研究某种减肥药的疗效,对15位肥胖者进行为期半年的观察测试,测试指标为使用该药之前和之后的体重。
编号 1 2 3 4 5服药前198 237 233 179 219服药后192 225 226 172 214编号 6 7 8 9 10服药前169 222 167 199 233服药后161 210 161 193 226编号11 12 13 14 15服药前179 158 157 216 257服药后173 154 143 206 249进行相关双变量分析得出如下输出结果:相关性相关系数系数表。
变量间两两的相关系数是用方阵的形式给出的。
每一行和每一列的两个变量对应的格子中就是这两个变量相关分析结果结果,共分为三列,分别是相关系数、P值和样本数。
由于这里只分析了两个变量,因此给出的是2*2的方阵。
由上表可见,服药前和服药后自身的相关系数均为1(of course),而治疗前和治疗后的相关系数为0.911,P<0.01(二)偏相关分析偏相关已知有某河流的一年月平均流量观测数据和该河流所在地区当年的月平均雨量和月平均温度观测数据,如表所示。
试分析温度与河水流量之间的相关关系。
观测数据表月份月平均流量月平均雨量月平均气温1 0.50 0.10 -8.802 0.30 0.10 -11.003 0.40 0.40 -2.404 1.40 0.40 6.905 3.30 2.70 10.606 4.70 2.40 13.907 5.90 2.50 15.408 4.70 3.00 13.509 0.90 1.30 10.0010 0.60 1.80 2.7011 0.50 0.60 -4.8012 0.30 0.20 -6.00由上表可见控制月平均雨量之后,“月平均流量”与“月平均气温”的相关系数为0.365,P=0.27,P>0.05,因此“月平均流量”与“月平均气温”不存在显著相关性。
(三)距离分析案例:植物在不同的温度下的生长状况不同,下列是三个温度下的植物生长编号10度20度30度1 12.36 12.4 12.182 12.14 12.2 12.223 12.31 12.28 12.354 12.32 12.25 12.215 12.12 12.22 12.16 12.28 12.34 12.257 12.24 12.31 12.28 12.41 12.3 12.46近似值(四)线性回归分析已知有某河流的一年月平均流量观测数据和该河流所在地区当年的月平均雨量和月平均温度观测数据,如表所示。
试分析关系。
观测数据表月份月平均流量月平均雨量月平均气温1 0.50 0.10 -8.802 0.30 0.10 -11.003 0.40 0.40 -2.404 1.40 0.40 6.905 3.30 2.70 10.606 4.70 2.40 13.907 5.90 2.50 15.408 4.70 3.00 13.509 0.90 1.30 10.0010 0.60 1.80 2.7011 0.50 0.60 -4.8012 0.30 0.20 -6.00进行线性回归分析得出如下输出结果:回归输入/移去的变量b模型输入的变量移去的变量方法1 月平均流量a . 输入a. 已输入所有请求的变量。
b. 因变量: 月平均雨量由表可知,是第一个问题的分析结果。
这里的表格是拟合过程中变量进入/退出模型的情况记录,由于只引入了一个自变量,所以只出现了一个模型1(在多元回归中就会依次出现多个回归模型),该模型中身高为进入的变量,没有移出的变量,这里的表格是拟合过程中变量进入/退出模型的情况记录,由于只引入了一个自变量,所以只出现了一个模型(在多元回归中就会依次出现多个回归模型),该模型中身高为进入的变量,没有移出的变量。
模型汇总模型R R 方调整R方标准估计的误差1 .855a .732 .705 .6117a. 预测变量: (常量), 月平均流量。
拟合模型的情况简报,显示在模型中相关系数R为0.855,而决定系数R2为0. 732,校正的决定系数为0.705,说明模型的拟合度较高。
Anovab模型平方和df 均方 F Sig.1 回归10.208 1 10.208 27.283 .000a残差 3.741 10 .374总计13.949 11a. 预测变量: (常量), 月平均流量。
b. 因变量: 月平均雨量这是所用模型的检验结果,可以看到这就是一个标准的方差分析表!从上表可见所用的回归模型F值为27.283,P值为.00a,因此用的这个回归模型是有统计学意义的,可以继续看下面系数分别检验的结果。
由于这里所用的回归模型只有一个自变量,因此模型的检验就等价与系数的检验,在多元回归中这两者是不同的。
系数a模型非标准化系数标准系数t Sig. B标准误差试用版1 (常量) .387 .247 1.564 .149月平均流量.462 .088 .855 5.223 .000a. 因变量: 月平均雨量包括常数项在内的所有系数的检验结果。
用的是t检验,同时还会给出标化/未标化系数。
可见常数项和身高都是有统计学意义的残差统计量a极小值极大值均值标准偏差N 预测值.526 3.113 1.292 .9633 12 残差-.6337 1.1358 .0000 .5832 12 标准预测值-.795 1.890 .000 1.000 12标准残差-1.036 1.857 .000 .953 12a. 因变量: 月平均雨量图表(五)曲线回归分析某地1963年调查得儿童年龄(岁)与体重的资料试拟合对数曲线。
年龄(岁)体重1 2 3 4 5 6 768 65 67 50 70 76 77进行曲线回归分析得出如下输出结果:实验报告五实验项目:聚类分析和判别分析实验目的:1.学习利用SPSS进行聚类分析和判别分析。
实验内容及步骤(一)系统聚类法为确定老年妇女进行体育锻炼还是增加营养会减缓骨骼损伤,一名研究者用光子吸收法测量了骨骼中无机物含量,对三根骨头主侧和非主侧记录了测量值,结果见教材表。