应用数理统计实验报告
选取一组有意义的双因素试验数据;
利用SAS的“交互数据分析”进行双因素方差分析,并进行如下说明:
(1)模型的效应是否显著?哪个量能反映这一点?
(2)因素A的不同水平间有无显著差异?哪个量能反映这一点?
(3)因素B的不同水平间是否有显著差异?哪个量能反映这一点?
(4)因素A与因素B的交互作用是否显著?哪个量能反映这一点?
3.由方差膨胀因子可以看出,X1,X3的方差膨胀因子较大,故具有多重共线性。
下面进行相关系数分析。
由相关系数阵可以看出,Y与X1,X3的相关性比较大,与X2的相关性不是很大,应建立Y于X1,X3的线性方程,但同时注意到,X1和X3由极大地相关性,故建立Y于X3的线性方程即可。
最后可用的回归方程为:Y=13.6366-0.0006X3
实验结果及分析:
实验数据来源于国家统计局,选择了1998年各项税收收入的数据,单位为“亿元”。以下表格1是SAS数据文件,其中各列分别为:“年份”、“合计”、“工商税收”、“关税”、“农牧业税”、“国营企业所得税”、“集体企业所得税”。图1是各单变量的直方图。表2包括单变量统计量,协方差矩阵,相关系数矩阵。
2.残差图表明该模型的随机误差项 呈现独立同分布的性质;而Q-Q图表明随机误差基本上不违背正态性,故模型的前提假设满足。
通过分析家得到实验结果如下
由实验结果可以看出,A,B,E之间没有显著性差异,C,D与其他各因素之间有显著性差异。
双因素方差分析实验报告(六)
2014年11月24日
姓名
班号
学号
实验内容:
利用SAS的“交互数据分析”建立X与Y之间的回归方程。结果如下:
表格3
图3
表格4பைடு நூலகம்
表格5
图4
(1)表3给出了回归方程的具体表达形式,即月销售额与月广告花费之间的线性关系是:月销售额=-998.247+13.8838*月广告花费;
(2)表5中的 和调整的 都大于0.996,说明月销售额变化的99.6%来自于月销售额和月广告花费的这种线性关系,而另外的近0.4%来自于统计误差或其他没有考虑到的随机因素;
(3)模型的前提假设是否满足?如何判定?
实验结果及分析:
在注塑成形过程中,成形品尺寸与射出压力和模腔温度有关,实验选择某工程师根据不同水平设置的射出压力和模腔温度得出某成形品德关键尺寸,研究两因素及其交互作用对成型品关键尺寸是否存在重要影响。因素A代表射出压力,因素B代表模腔温度,首先建立SAS数据集。
马克·吐温:0.225,0.262,0.217,0.240,0.230,0.229,0.235,0.217
斯诺·特格拉斯:0.209,0.205,0.196,0.210,0.202,0.207,0.224,0.223,0.220,0.201
设两组数据分别来自正态分布,两样本相互独立,要求检验两个作家所写的小品文中包含由三个字母组成的词的比例是否有显著性差异。
实验结果及分析:
实验选择将五种常用的抗生素注入到牛的体内时,抗生素与血浆蛋白质结合的百分比,检验在显著性水平 下这些百分比的均值有无显著性差异。以A,B,C,D,E分别代表青霉素,四环素,链霉素,红霉素和氯霉素。
首先建立SAS数据集如下:
通过“交互数据分析”得到实验结果如下:
1.由方差分析表可以看出, ,因此按0.05水平拒绝因素的不同水平对试验指标的影响无显著差异零假设,即因素的不同水平对试验指标的影响有显著性差异。
单因素方差分析实验报告(五)
2014年11月24日
姓名
班号
学号
实验内容:
选取一组有意义的单因素试验数据;
利用SAS的“交互数据分析”进行单因素方差分析,并进行如下说明:
(1)因素的不同水平对试验指标的影响有无显著差异?哪个量能反映这一点?
(2)因素的各个水平间是否有显著差异?哪些量能反映这一点?
(3)模型的前提假设是否满足?如何判定?
表格2
一元回归实验报告(三)
2014年11月10日
姓名
班号
学号
实验内容:
选取一组有意义的数据: ;
说明x与y之间具有较强的相关性;
利用SAS的“交互数据分析”建立回归方程,并进行如下说明:
(1)方程的显著性如何?哪些量能反映这一点?
(2)方程的前提假设是否满足?如何判定?
实验结果及分析:
公司的广告花费会直接影响销售额,故实验选取某公司15月内有关广告花费X与销售额Y的数据,如下:
下面是有“交互数据分析”得出的结果。
1.由方差分析表可以看出,p<0.0001,因此按0.05水平拒绝Y与X1,X2和X3之间没有线性关系的零假设,即回归方程是显著的。由参数估计值表可以看出,除X2外,回归系数都是显著不为零的。
2.残差图表明该模型的随机误差项 呈现独立同分布的性质;而Q-Q图表明随机误差基本上不违背正态性,故方程的前提假设满足。
3.残差图表明该模型的随机误差项 呈现独立同分布的性质;而Q-Q图表明随机误差基本上不违背正态性,故模型的前提假设满足。
下面通过“分析员应用”对不同因素方差分析的均值进行比较,实验结果如下:
由结果可以看出,因素B之间无显著性差异,因素A,A2与A1和A3之间有显著性差异,A1和A3之间没有显著性差异。
简单统计描述实验报告(一)
2014年10月31日
姓名
班号
学号
实验内容:
选择一组多维有意义的数据;
编写SAS数据文件;
利用SAS作单变量的直方图,计算基本统计特征(均值、方差或标准差)并由此分析单变量的基本分布情况;
利用SAS计算多维随机变量的样本协方差阵、样本相关系数阵并由此分析变量之间的相关性;
要求打印:SAS数据文件;直方图;计算结果;分析结果。
通过“交互数据分析”得出的实验结果如下:
1.在方差分析表中,检验模型显著性的F统计量为16.42,相应的p值为0.0002<0.05,所以模型的效应是显著的。
2.在Ⅲ型检验表中,将模型平方和分解为两个因素和它们的交互作用,表中看出,检验A变量效应的p值小于0.0001,所以从总体上看因素A的不同水平之间有显著差异;检验B变量效应的p值为0.2020>0.05,所以因素B的不同水平之间没有显著差异;检验两者交互作用的p值为0.0009<0.05,所以交互作用的影响也是显著的。
表格1
图1
图2
结果分析:
1.由直方图和各单变量的统计结果可以看出,税收总计逐年增加,且幅度较大,变化很快,说明了我国从1975年到1995年的二十年里,税收收入迅速增加。具体的各项收入可以看出,工商税收是变化最为显著的,关税和农牧业税收稳定增加,而国营企业所得税和集体企业所得税则相对保持稳定。
2.由协方差矩阵和相关系数矩阵可以看出,对总税收影响最大的是工商业税收,其次是农牧业税收。
(3)由表4可以看出 ,因此按0.05水平拒绝月销售额与月广告花费没有线性关系的零假设;
(4)残差图表明该模型的随机误差项 呈现独立同分布的性质;而Q-Q图表明随机误差基本上不违背正态性;
(5)结论:这个模型可用来分析和预测月销售额和月广告花费之间的关系。
多元回归实验报告(四)
2014年11月17日
姓名
班号
学号
实验内容:
选取一组有意义的数据:
利用SAS的“交互数据分析”建立回归方程,并进行如下说明:
(1)方程和回归系数的显著性如何,如何判定?
(2)方程的前提假设是否满足?如何判定?
(3)多重共线性如何,你认为最后可用的回归方程是哪一个?
实验结果及分析:
实验结果及分析:
实验选择1988年至2008年间,人口自然增长率和国民总收入,居民消费价格指数增长率以及人均GDP作为实验数据,研究国民总收入,居民消费价格指数增长率以及人均GDP对人口自然增长率的影响。通过SAS建立人口自然增长率和其他三个变量之间的线性关系。首先通过以下数据建立SAS数据集。
假设检验实验报告(二)
2014年11月10日
姓名
班号
学号
实验内容:
选择两组有意义的一维样本;
检验零假设: ;
说明:(1)这个检验的前提假设是什么?
(2)写出检验统计量的具体表达形式及利用SAS的“分析员应用”计算的统计量值;
(3)在什么水平下接受或拒绝了零假设。
实验结果及分析:
实验选择了两个文学家马克·吐温(Mark Twain)的8篇小品文以及斯诺·特格拉斯(Snodgrass)的10篇小品文中由三个字母组成的词的比例:
设两正态母体分别记为X,Y,其均值分别为 和 ,零假设是 ,备选假设是 。
检验统计量 ,其中 .
由表2可以看出检验统计量T在两总体方差相等和不相等的情况下分别为3.878和3.704。
P=0.0013(0.0032)<0.025,因此按0.05水平拒绝零假设。即两个作家所写的小品文中包含由三个字母组成的词的比例有显著性差异。