当前位置:文档之家› 统计学上机

统计学上机

统计学上机实验报告班级:工商管理1302班**:***学号:**********实验一用Excel搜集与整理数据一.用excel搜集数据【例13-1】假定有100个总体单位,每个总体单位给一个编号,共有从1到100个编号,输入工作表后如图所示:总体各单位编号表等距抽样结果二.用excel进行统计分组【例13-2】我们采用第三章例3-1,把50名工人的月产量资料输入工作表,如图所示:工人月产量资料频数分布和直方图应当注意,上图实际上是一个条形图,而不是直方图。

调整后的直方图三.用excel作统计图【例13-3】我们这里采用第三章表3-13的资料,看一下如何作饼图。

首先把数据输入到工作表中,如图所示:河北省主要市2001年人口情况饼图实验二用EXCEL计算描述统计量一、用函数计算描述统计量(一)众数【例13-4】:为了解某经济学院新毕业大学生的工资情况,随机抽取30人,月工资如下:15601340160014101590141016101570171015501490 16901380168014701530156012501560135015601510 15501460155015701980161015101440(二)中位数(三)算术平均数(四)标准差函数计算描述统计量(大学生工资情况)二.描述统计工具量的使用描述统计输出结果Excel 实验二补充第一部分:用EXCEL1.为研究人们对不同类型软饮料的偏好情况,一家调查公司在某超市随机调查了50名消费者。

右表是顾客性别及其所偏好的饮料类型记录。

生成频数分布表,观察不同性别的消费者及其所偏好的饮料类型的分布状况,并进行描述性分析1)生成频数分布表EXCEL用数据透视表生成定性数据的频数分布2【例】2011年北京、天津、上海和重庆地区按收入法计算的地区生产总值(按当年价格计算)数据。

绘制环形图比较四个地区的生产总值构成利用表中数据绘制环形图并进行说明.如下张图制作的环形图:由上图通过比较不同色环形的总面积可得,上海的地区生产总值最高,其次为北京,而重庆为最低。

第二部分:利用SPSS3例题:为研究人们对不同类型软饮料的偏好情况,一家调查公司在某超市随机调查了50名消费者。

右表是顾客性别及其所偏好的饮料类型记录。

生成频数分布表,观察不同性别的消费者及其所偏好的饮料类型的分布状况,并进行描述性分析(1)生成频数分布表(2)生成列联表4从某大学经济管理专业二年级学生中随机抽取11人,对8门主要课程的考试成绩进行调查,所得结果如表。

试绘制各科考试成绩的批比较箱线图,并分析各科考试成绩的分布特征11名学生各科的考试成绩数据学生编号课程名称1234567891011英语经济数学西方经济学市场营销学财务管理基础会计学统计学计算机应用基础766593746870558590958187757391789751768570926881717488698465739570786690737884709363798060878167869183777690708283829284817069727875789188669480857186746879628181557870756871775我国31 个地区2011年的固定资产投资额、地区生产总值(GDP)和最终消费支出数据。

绘二维散点图,重叠散点图并观察它们之间的关系.实验三用EXCEL进行参数估计和假设检验一、用EXCEL进行区间估计【例13-14】:某饭店在7星期内抽查49位顾客的消费额(元)如下:15 24 38 26 30 42 18 30 25 26 34 44 20 35 24 26 34 48 18 28 46 19 30 36 42 24 32 45 36 21 47 26 28 31 42 45 36 24 28 27 32 36 47 53 22 24 32 46 26求在概率90%的保证下,顾客平均消费额的估计区间。

如图:参数估计数据及结果二、用EXCEL 进行假设检验【例13-15】:某厂铸造车间为提高缸体的耐磨性而试制了一种镍合金铸件以取代一种铜合金铸件,现从两种铸件中各抽一个样本进行硬度测试(表示耐磨性的一种考核指标)其结果如下:合镍铸件(X ) 72.0 69.5 74.0 70.5 71.8 72 合铜铸件(Y ) 69.8 70.0 72.0 68.5 73.0 70.0根据以往经验知硬度()211,~σμN X ,()222,~σμN Y ,且221==σσ,试在05.0=α水平上比较镍合金铸件硬度有无显著提高。

输入数据到工作表:结果:双样本平均差分析结果 在上面的结果中,我们可以根据P 值进行判断,也可以根据统计量和临界值比较进行判断。

如本例采用的是单尾检验,其单尾P 值为0.17,大于给定的显著性水平0.05,所以应该接受原假设,即镍合金铸件硬度没有明显提高;若用临界值判断,得出的结论是一样的,如本例Z值为0.938194,小于临界值1.644853,由于是右尾检验,所以也是接受原假设。

三、课本154页5.5157页5.7161页5.9165页5.11实验四方差分析P187的6.2.3 用excel进行方差分析选择“数据”“数据分析”“方差分析:单因素方差分析”由表可看出,F=3.4066>F0.05(3,19)=3.12735,所以拒绝原假设H0 ,即u 1=u2=u3=u4不成立,表明u1、u2、u3、u4之间存在差异。

课本练习题1.从三个总体中各抽取容量不同的样本数据,得到的资料如下表.检验3个总体的均值之间是否有显著差异.解:提出假设:H 0 :u1=u2=u3H 1 :u1≠u2≠u3由单因素方差分析得:从方差分析表中可以看到,由于F=4.830791<F0.01(2,9)=8.021517,所以不拒绝原假设H0,即U1=U2=U3,表明U1、U2、U3之间的差异不显著。

2.某家电制造公司准备购进一批5#电池,现有A、B、C 3个电池生产企业愿意供货,为比较它们生产电池质量,从每个企业各随机抽取5只电池,经试验得出其寿命(小时)数据如下表。

3个企业电池寿命试验数据试分析3个企业生产的电池平均寿命之间有无显著性差异。

(α=0.05)如果有差异,用LSD方法检验哪些企业之间有差异。

解:提出假设检验一:H0 : uA=uBH 1 : uA≠uB检验二:H0 : uA=uCH 1 : uA≠uC检验三:H0 : uB=uCH 1 : uB≠uC由单因素方差分析得:从方差分析表中可以看到,由于F=17.0683>F0.05(2,12),所以拒绝原假设,即U0=U1=U2不成立,表明U1、U2、U3之间的差异是显著的。

也就是说,有95%的把握认为电池的生产企业对电池的平均寿命的影响是显著的。

计算检验统计量:∣x1-x2∣=∣44.4-30∣=14.4∣x1-x3∣=∣44.4-42.6∣=1.8∣x2-x3∣=∣30-42.6∣=12.6由表可知,MSE=18.03333。

自由度=n-k=15-3=12,查t分布表得tα/2=t0.025=2.1788.由于A、B、C样本量相同,则各检验LSD相同,即:LSD1= LSD3=LSD3=2.1788×√(18.03333×(1/5+1/5))=5.85174412因为∣x1-x2∣=14.4 > 5.85174412 则拒绝原假设,即A与B企业生产的电池有显著性差异。

∣x1-x3∣=1.8 < 5.85174412 则不拒绝原假设,即A与C企业生产的电池没有显著性差异。

∣x2-x3∣=12.6 > 5.85174412 则拒绝原假设,即B与C企业生产的电池有显著性差异。

3.某企业准备用3种方法组装一种新的产品,为确定那种方法每小时生产的产品数量最多,随机抽取了30名工人,并指定每个人使用其中一种方法。

通过对差异源SS df MS F P-value F crit组间420 2 210 1.478102 0.245946 3.354131组内3836 27 142.0741 ———总计4256 29 ————(1)完成上面的方差分析表。

(2)若显著性水平α=0.05,检验3种方法组装的产品数量之间是否有显著性差异。

解:(1)表格数据红笔所示:(2)提出假设:H 0 :u1=u2=u3H 1 :u1≠u2≠u3从方差分析表中可以看到,由于F=1.4781<F0.05(10,8)=3.354131,所以不拒绝原假设H0,即U1=U2=U3,表明三种方法组装的数量之间的差异不显著。

【例5.11】数据录入选择“数据”“数据分析”“t检验:双样本等方差假设”excel输出的检验结果由上表得,“t双尾临界”值为2.160369,即在自由度df为13,α为0.05时对应的t分布的临界值分别为2.1160369和-2.160369,而检验统计量的值t Stat 为-0.85485,没有落入拒绝域,因而不拒绝原假设。

或将“P(T<=t)双尾”值0.408114与α=0.05进行比较,0.408114>0.05,即P>α,则不拒绝原假设。

也就是说两台机床加工的零件直径一致。

[例5.12]数据录入选择“数据”“数据分析”“t检验:双样本异方差假设”excel输出的检验结果由上表得,“t双尾临界”值为2.178813,即在自由度df为12,α为0.05时对应的t分布的临界值分别为2.178813和-2.178813,而检验统计量的值t Stat为-0.84779,没有落入拒绝域,因而不拒绝原假设。

或将“P(T<=t)双尾”值0.413143与α=0.05进行比较,0.413143>0.05,即P>α,则不拒绝原假设。

也就是说没有理由证明,两台机床加工的零件直径不一致。

[例5.13]数据录入选择“数据”“数据分析”“t-检验:平均值的成对二样本分析”excel输出的检验结果由上表得,“t双尾临界”值为2.364624,即在自由度df为7,α为0.05时对应的t分布的临界值分别为2.364624和-2.364624,而检验统计量的值t Stat为-1.35724,没有落入拒绝域,因而不拒绝原假设。

或将“P(T<=t)双尾”值0.216838与α=0.05进行比较,0.216838>0.05,即P>α,则不拒绝原假设。

也就是说没有证据证明,消费者对新旧饮料的评分有显著差异。

[例5.15]数据录入选择“数据”“数据分析”“F-检验:双样本方差”excel输出的检验结果由于S12/S22>1,所以将检验统计量与Fα/2(n1-1,n2-1)进行比较。

相关主题