当前位置:文档之家› 数据模型与决策习题解答

数据模型与决策习题解答

第二章习题(P46)14.某天40只普通股票的收盘价(单位:元/股)如下:29.625 18.000 8.625 18.5009.250 79.375 1.250 14.00010.000 8.750 24.250 35.25032.250 53.375 11.500 9.37534.000 8.000 7.625 33.62516.500 11.375 48.375 9.00037.000 37.875 21.625 19.37529.625 16.625 52.000 9.25043.250 28.500 30.375 31.12538.000 38.875 18.000 33.500(1)构建频数分布*。

(2)分组,并绘制直方图,说明股价的规律。

(3)绘制茎叶图*、箱线图,说明其分布特征。

(4)计算描述统计量,利用你的计算结果,对普通股价进行解释。

解:(1)将数据按照从小到大的顺序排列1.25, 7.625, 8, 8.625, 8.75, 9, 9.25, 9.25, 9.375, 10, 11.375, 11.5, 14, 16.5, 16.625, 18, 18, 18.5, 19.375, 21.625, 24.25, 28.5, 29.625, 29.625, 30.375, 31.125, 32.25, 33.5, 33.625, 34, 35.25, 37, 37.875, 38, 38.875, 43.25, 48.375, 52, 53.375, 79.375,结合(2)建立频数分布。

(2)将数据分为6组,组距为10。

分组结果以及频数分布表。

为了方便分组数据样本均值与样本方差的计算,将基础计算结果也列入下表。

根据频数分布与累积频数分布,画出频率分布直方图与累积频率分布的直方图。

频率分布直方图从频率直方图和累计频率直方图可以看出股价的规律。

股价分布10元以下、10—20元、30—40元占到60%,股价在40元以下占87.5%,分布不服从正态分布等等。

累积频率分布直方图(3)将原始数据四舍五入取到整数。

1,8 ,8 ,9 ,9 ,9 ,9 ,9 ,9 ,10 ,11 ,12 ,14 ,17 ,17 ,18 ,18 ,19 ,19 ,22 ,24 ,29 ,30 ,30 ,30 ,31 ,32 ,34 ,34 ,34 ,35 ,37 ,38 ,38 ,39 ,43 ,48 ,52 ,53 ,79以10位数为茎个位数为叶,绘制茎叶图如下由数据整理,按照从小到大的准许排列为:)40()39()2()1(x x x x ≤≤⋯≤≤最小值25.1)1(=x ,下四分位数()03125.11375.11431041341)11()10(=⨯+⨯=⨯+=x x Q l ,中位数()9375.22225.24625.2121)21()20(=+=+=x x M e ,上四分位数())30()29(341x x Q u +⨯= 3125.3425.35413443=⨯+⨯=,最大值375.79)40(=x ,四分位数间距28125.2313=-=Q Q IQR ,375.792344.695.1)40(3=<=+x IQR Q ,因此可以做出箱线图为:茎叶图的外部轮廓反映了样本数据的分布状况。

从茎叶图和箱线图可以看出其分布特征:中间(上下四分位数部分)比较集中,但是最大值是奇异点。

数据分布明显不对称,右拖尾比较长。

(4)现用原始数据计算常用的描述性统计量 样本均值:421875.2540/875.1016401401===∑=i ixx样本方差:196.26340391240122=⎪⎪⎭⎫ ⎝⎛⨯-=∑=x x s i i样本标准差:2233.16196.2634039124012==⎪⎪⎭⎫ ⎝⎛⨯-=∑=x x s i i 用分组数据计算常用的描述性统计量:97561='∑=k kk x f,33925612='∑=k kk x f样本均值:375.2440/97540161=='=∑=k kk x fx样本方差:4968.260403912612=⎪⎪⎭⎫ ⎝⎛⨯-'=∑=x x f s k kk 样本标准差:1399.164968.260403912612==⎪⎪⎭⎫ ⎝⎛⨯-'=∑=x x f s k k k 与用原始数据计算的结果差别不大。

此外,可以用Excel 中的数据分析直接进行描述性统计分析,结果如下:补充习题:1. 测量血压14次,记录收缩压,得样本如下:121,123,119,130,125,115,128,126,109,112,120,126,125,125 求样本均值,样本方差,样本中位数,众数和极差。

2. 根据列表数据3. 调查30个中学生英语成绩,得样本如下:54, 66, 69, 69, 72,75, 77, 75, 76, 79, 76,77, 78, 79,81, 81, 85, 87, 83, 84,89, 86,89, 89, 92, 95,96,96, 98, 99把样本分为5组,组距为10,且最小组的下限为50,作出列表数据和直方图 补充习题答案1. 测量血压14次,记录收缩压,得样本如下:121,123,119,130,125,115,128,126,109,112,120,126,125,125 求样本均值,样本方差,样本中位数,众数和极差。

解:排序:109 112 115 119 120 121 123 125 125 125 126 126128130均值:1nii xx n==∑= 121.71方差:222211()11nniii i x x xnxs n n ==--==--∑∑= 37.76中位数:12202n nx x m -+== 124众数:m e = 125 极差:R=x n -x 1= 212.根据列表数据解:样本均值:11ki ii x x f n ==∑= 31.59091样本方差:222211()11kni ii i i i x x f x f nxs n n ==--==--∑∑=25.32468样本标准差:s =3调查30个中学生英语成绩,得样本如下:54, 66, 69, 69, 72,75, 77, 75, 76, 79, 76,77, 78, 79,81, 81, 85, 87, 83, 84,89, 86,89, 89, 92, 95,96,96, 98, 99把样本分为5组,组距为10,且最小组的下限为50,作出列表数据和直方图 解:列表第四章习题(p118)21.下面的10个数据是来自一个正态总体的样本数据: 10,8,16,12,15,6,5,14,13,9 (1)总体均值的点估计是多少? (2)总体标准差的点估计是多少? (3)总体均值99%的置信区间是多少? 解:(1)总体均值的点估计8.10108101ˆ=⨯==x μ (2)总体标准差的点估计()7947.34.148.10101296911091ˆ221012==⨯-=⎪⎪⎭⎫ ⎝⎛⨯-==∑=x x s i i σ (3)这是正态总体方差未知的条件下,总体均值μ的区间估计问题99.01=-α,01.0=α,2498.3)9()1(005.02/==-t n t α总体均值99%的置信区间为:⎪⎪⎭⎫⎝⎛-+--n s n t x n s n t x )1(,)1(2/2/αα)(6997.14,9.6107947.32498.38.10,107947.32498.38.10=⎪⎪⎭⎫ ⎝⎛⨯+⨯-= 第五章习题(p154)7.某一问题的零假设和备择假设分别如下:25:0≥μH 25:1<μH当某个样本容量为100,总体标准差为12时,对下面每一个样本的结果,都采用显著性水平05.0=α计算检验统计量的值,并得出相应的结论。

(1)0.221=x 。

(2)5.232=x 。

(3)8.223=x 。

(4)0.244=x 。

解:这是总体分布未知,大样本前提下,总体均值的单边检验问题。

故,可以用大样本情况下单个总体均值的检验。

提出原假设与备择假设:25:0≥μH 25:1<μH 选择检验统计量nx z /25σ-=,当0H 成立时,)1,0(~//25N nx nx z σμσ-≤-=给定显著性水平05.0=α,645.105.0==z z α,拒绝域645.105.0-=-≤z z (1)0.221=x ,645.15.2100/122522/25-<-=-=-=nx z σ,拒绝0H 。

接受1H ,即不能认为25≥μ。

(2)5.231=x ,645.125.1100/12255.23/25->-=-=-=nx z σ,接受0H 。

即认为25≥μ。

(3)8.221=x ,645.183333.1100/12258.22/25-<-=-=-=nx z σ,拒绝0H 。

接受1H ,即不能认为25≥μ。

(4)0.241=x ,645.18333.0100/122524/25->-=-=-=nx z σ,接受0H 。

即认为25≥μ。

12.有一项研究要作的假设检验是: 20:0=μH 20:1≠μH某个样本有6个数据,他们分别是:20,18,19,16,17,18。

根据这6个数据,分别回答以下问题:(1)它们的均值和标准差各是多少?(2)当显著性水平05.0=α时,拒绝规则是什么? (3)计算检验统计量t 的值。

(4)根据以上信息,你所得出的结论是什么?解:说明:本题是小样本,应该有总体服从正态分布),(2σμN 的假定。

(1)由样本数据得6=n ,10861=∑=i ix,1954612=∑=i ix样本均值:186/1086161===∑=i ixx ;样本方差:2)1861954(51651226122=⨯-=⎪⎪⎭⎫ ⎝⎛⨯-=∑=x x s i i样本标准差:4142.126512612==⎪⎪⎭⎫ ⎝⎛⨯-=∑=x x s i i (2)在总体服从正态分布的假定之下,这是正态总体方差未知的条件下,总体均值的双边检验问题,用t 检验。

提出原假设与备择假设:20:0=μH 20:1≠μH 选择检验统计量:ns x t /20-=,当原假设0H 成立时,)1(~//20--=-=n t ns x ns x t μ当显著性水平05.0=α时,5706.2)5()1(025.02/==-t n t α,因此:拒绝域为: 5706.2)5(025.0=≥t t(3)计算检验统计量t 的值236.255/22018/20-=-=-=-=ns x t(4)5706.2236.2/20<=-=ns x t ,接受0H 。

相关主题