当前位置:文档之家› 定性数据分析第二章课后答案

定性数据分析第二章课后答案

. 页脚 第二章课后作业 【第1题】 解:由题可知消费者对糖果颜色的偏好情况(即糖果颜色的概率分布),调查者

取500块糖果作为研究对象,则以消费者对糖果颜色的偏好作为依据,500块糖果的颜色分布如下表1.1所示: 表1.1 理论上糖果的各颜色数 橙色 黄色 红色 棕色 绿色 蓝色 150 100 100 50 50 50

由题知r=6,n=500,我们假设这些数据与消费者对糖果颜色的偏好分布是相符,所以我们进行以下假设: 原假设::0H类iA所占的比例为)6,...,1(0ippii

其中iA为对应的糖果颜色,)6,...,1(0ipi已知,1610iip 则2检验的计算过程如下表所示: 颜色类别 i

n

0inp

020)(iiinpnpn

1A 172 150 3.2267

2A 124 100 5.7600

3A 85 100 2.2500

4A 41 50 1.6200

5A 36 50 3.9200

6A 42 50 1.2800

合计 500 500 0567.182

在这里6r。检验的p值等于自由度为5的2变量大于等于18.0567的概率。在Excel中输入“)5,0567.18(chidist”,得出对应的p值为05.00028762.0p,故拒绝原假设,即这些数据与消费者对糖果颜色的偏好分布不相符。 . 页脚 【第2题】 解:由题可知 ,r=3,n=200,假设顾客对这三种肉食的喜好程度相同,即顾客

选择这三种肉食的概率是相同的。所以我们可以进行以下假设: 原假设 )3,2,1(31:0ipHi

则2检验的计算过程如下表所示: 肉食种类 i

n

inp

iiinpnpn2)(

猪肉 85 66.67 5.03958 牛肉 41 66.67 9.88374 羊肉 74 66.67 0.80589

合计 200 200 72921.152

在这里3r。检验的p值等于自由度为2的2变量大于等于15.72921的概率。在Excel中输入“)2,72921.15(chidist”,得出对应的p值为05.00003841.0p,故拒绝原假设,即认为顾客对这三种肉食的喜好程度是不相同的。

【第3题】 解:由题可知 ,r=10,n=800,假设学生对这些课程的选择没有倾向性,即选

各门课的人数的比例相同,则十门课程每门课程被选择的概率都相等。所以我们可以进行以下假设: 原假设)10,...,2,1(1.0:0ipHi

则2检验的计算过程如下表所示: 类别(课程) in 0inp

020)(iiinpnpn

1 74 80 0.4500 2 92 80 1.8000 3 83 80 0.1125 4 79 80 0.0125 5 80 80 0.0000 6 73 80 0.6125 . 页脚 7 77 80 0.1125 8 75 80 0.3125 9 76 80 0.2000 10 91 80 1.5125 合计 800 800 125.52

在这里10r。检验的p值等于自由度为9的2变量大于等于5.125的概率。在Excel中输入“)9,125.5(chidist”,得出对应的p值为05.0823278349.0p,故接受原假设,即学生对这些课程的选择没有倾向性,各门课选课人数的频率为0.1。

【第4题】 解:(1)由题可知,r=3,n=5606,假设1997年8月中国股民投资状况的调查

数据和比较流行的说法是相符合。所以我们可以进行以下假设: 原假设::0H类iA所占的比例为)3,2,1(0ippii

其中)3,2,1(iAi为股票投资中对应的赢、持平和亏,)3,2,1(0ipi已知,1310iip 则2检验的计算过程如下表所示: 股票投资状况 i

n

0inp

020)(iiinpnpn

1A 1697 560.6 2303.61213

2A 1780 1121.2 387.10082

3A 2129 3924.2 821.24842

合计 5606 5606 96137.35112 在这里3r。检验的p值等于自由度为2的2变量大于等于3511.96137的概率。在Excel中输入“)2,72921.15(chidist”,得出对应的p值为05.00p,故拒绝原假设,即认为1997年8月中国股民投资状况的调查数据和比较流行的说法是不相符合的。 (2)解:由题知股票投资中,赢包括盈利10%及以上、盈利10%以下,符合条件 . 页脚 的股民共有151+122=273人;持平可以指基本持平,符合条件的股民共有240人;亏包括亏损不足10%和亏损10%及以上,符合条件的股民共有517+240=757人。 由题可知,r=3,n=1270,假设2003年2月青年报上的调查数据和比较流行的说法是相符合。所以我们可以进行以下假设: 原假设::0H类iA所占的比例为)3,2,1(0ippii

其中)3,2,1(iAi为股票投资中对应的赢、持平和亏,)3,2,1(0ipi已知,1310iip 则2检验的计算过程如下表所示: 股票投资状况 in 0inp

020)(iiinpnpn

1A 273 127 167.84252

2A 240 254 0.77165

3A 757 889 19.59955

合计 1270 1270 21372.1882

在这里3r。检验的p值等于自由度为2的2变量大于等于188.21372的概率。在Excel中输入“)2,21372.188(chidist”,得出对应的p值为05.00p,故拒绝原假设,即认为2003年2月青年报上的调查数据和比较流行的说法是不相符合的。

【第5题】 解:由题意,我们将“开红花”、“开白花”和“开粉红色花”分别记为321,,AAA,

并记iA所占的比例为)3,2,1(ipi,本题所要检验的原假设为: pqpqpH2 ,p ,p :322210 其中1qp,这些ip都依赖一个未知参数p。在原假设0H成立时的似然函数为 . 页脚 13210860362242)1()2()()()(pppqqppL

则对L(p)取对数得 )1ln(132ln108)(lnpppL 从而有对数似然方程 01132108)(lnppp

pL

即pp132)1(108。据此求得p的极大似然估计45.0ˆp,从而得到ip的极大似然估计 3,2,1),ˆ(ˆipppii。它们分别为0.2025、0.3025和0.495。由此得各类的期望频数的估计值3,2,1,ˆipni。它们分别为24.3、36.3、132.20和59.4。所以2统计量的值为 0.012244.59)4.5960(3.36)3.3636(3.24)3.2424(2222 这里r=3,m=1,r-m-1=1。检验的p值等于自由度为1的2变量。利用Excel可以算出p值05.0911893.0)1,01224.0(chidistp,故接受原假设,即我们认为以上数据在0.05的水平下与遗传学理论是相符的。

【第6题】 解:由题意,我们可以得到以下信息:

① 遗传因子的分布律为:(其中p+q+r=1)

遗传因子 A B

O

概率 p q

r

②血型的分布律为: 血型 O A B AB

概率 2

r

prp22 qrq22

pq2

将“O”血型、“A”血型、“B”血型和“AB”血型这四类血型分别记为41A......, ,A,并记iA所占的比例为)4,......,1( ipi,本题所要检验的原假设为: . 页脚 pqpqrqpprprH2 ,2 ,2p ,p :42322210 这些ip都依赖两个未知参数qp,。在原假设0H成立时的似然函数为

5813213243643674858132243623742)2()22()22()1( )2()2()2()(),(pqpqqqppqppqqrqprprqpL

则对L(p,q)求对数得 pqpqqqppqpqpL2ln58)22ln(132ln132)22ln(436ln436)1ln(748),(ln对),(lnqpL求偏导数得





058221321322287201748ln058222640224364361748lnqpqqqpqpq

L

ppqqppqppL

利用Mathematica软件求解(程序编码及运行结果见附录) 解得p和q的极大似然估计为100.0ˆ89,2.0ˆqp,从而得ip的极大似然估

计4,....,1 ),ˆ,ˆ(ˆiqpppii。它们分别为0.37332、0.43668、0.13220和0.05780。由此得各类的期望频数的估计值1,....,4i ,ˆipn。它们分别为373.32、436.68、132.20和57.80。所以2统计量的值为

003292.0 80.57)80.5758(20.132)20.132132(68.436)68.436436(32.373)32.373374(22222

这里r=4,m=2,r-m-1=1。检验的p值等于自由度为1的2变量。有Excel可以算出p值为05.0 954245.0)1 ,003292.0(chidistp,故接受0H,我们认为以上数据与遗传学理论是相符的。

附录 ①程序代码: NSolve[{(-748)/(1-p-q)+436/p+(-436)/(2-p-2*q)+0+(-264)/(2-q-2*p)+58/p==0,(-748)/(1-p-q)+0+(-872)/(2-p-2*q)+132/q+(-132)/(2-q-2*p)+58/q==0},{p,q}]//MatrixForm

相关主题