文案大全1某公司48名工人某年月平均生活费支出(元)如下,试根据此资料编制组距式分布数列。
并绘制直方图。
352、312、336、257、408、321、234、268、204、358、270、466、328、347、369、349、397、386、318、382、430、300、484、289、523、476、315、377、294、458、326、365、492、209、446、446、302、277、548、334、400、424、282、308、371、363、337、302解:统计分组(1)组数7lg 322.31log log 1210N 10≈+=+=N K (2)507204548=-==K R d (3)确定组限最小组的下限从最小值204向下延伸4个单位确定为200,最高组的上限从最大值548向上延伸2个单位确定为550.(4)计算各组次数或频率形成分布数列直方图略2、试根据如下资料绘制茎叶图。
72、75、60、52、65、90、95、85、76、8692、63、75、53、87、77、69、85、86、6463、66、71、78、84、98、79、62、57、76茎叶5 2 3 76 0 2 3 3 4 5 6 97 1 2 5 5 6 6 7 8 98 4 5 5 6 6 79 0 2 5 8文案大全文案大全3、算术平均数、中位数和众数三者之间有何关系?(1)如果数据的分布是对称的,则众数、中位数、和均值完全相等O e M M X ==(2)如果数据是左偏分布O e M M X << (3)如果数据是右偏分布O e M M X >>(4)当数据分布的偏斜程度不是很大时,算术平均数到众数的距离是算术平均数到中位数距离的3倍。
即:)(3e o M X M X -=-4、选择题(1)不同数列的标准差不能简单进行对比,这是因为不同数列的(A ,D )A 平均数不同B 标准差不同C 个体数不同D 计量单位不同(2)某居民区家庭人口数的分布资料如下:家庭人口数(人) 1 2 3 4 5 6 7 户 数(户) 10 50 80 60 30 20 10 该居民区家庭人口数的中位数是:(C)A 130户B 130.5户C 3人D 4人文案大全(3)变量数列中出现次数最多的值是(D)A 算术平均数B 调和平均数C 中位数D 众数 6、为了了解大学生每月生活费用支出情况,某省在全省高校中随机抽取了250名学生进行调查,调查得样本资料如下:试计算:(1)250名学生的平均生活费用月支出额;(2)月生活费用的中位数和众数;(3)月生活费用的标准差。
解:(1)=244(2)中位数所在组200—25018.2435011030-12520021=⨯+=⨯-+≈-d f S NL M m m e(3)文案大全91.24050)90110()20110(20110200)()(1110=⨯-+--+=⨯-+--+≈+--if f f f f f L M7、某信息传呼台两名接线员5天中每天接呼次数资料如下: A 接线员 120 108 76 184 165 B 接线员 94 68 113 55 99从日均次数的代表性和接线次数和日分布的均衡性角度作简要评价和分析。
解:B 接线员日均次数的代表性较好8、某投资银行的年利率按复利计算,10年的年利率分别是有一年为7%,有3年为8%,有四年为10% ,有两年为11%,试求平均年利率。
解:%29.109%)111(%)110(%)108(%)107(1024312121=⨯⨯⨯=∑⨯⋅⋅⋅⨯⨯=F FN F F G NX X X X 平均年利率为9.29% 1、选择题(1)要求估计量的数学期望等于被估计的总体指标的真值,文案大全称为( C )A 一致性B 有效性C 无偏性D 充分性 (2)在不放回抽样下,样本均值得方差等于( c )A 2σ B S 2C 1-- 2N n N n σ D22σ(3)置信区间的长度越短,估计的精度则( a )。
A.越高B.越低C.与长短无关D.无法判定(4)若1ˆθ和2ˆθ均为总体指标θ的无偏估计量,下列哪种情况表示1ˆθ比2ˆθ更有效(c ) A θθθ==)()(21ˆˆE E B Var(1ˆθ) > Var(2ˆθ) C Var(1ˆθ) < Var(2ˆθ) D MSE(1ˆθ)< MSE(2ˆθ) 2、影响样本容量的因素有哪些?(1)总体中个体之间的差异程度。
即总体方差)1(2P P -或σ。
总体方差越大,所需的样本容量越大;反之,总体方差越小,所需的样本容量越小。
(2)允许误差d 的大小。
允许误差越小,估计的精确度越高,则所需的样本容量越大;反之,允许误差越大,估计的精确度越低,则所需的样本容量越小。
(3)估计的可靠性高低。
估计的可靠性越高,所需的样本容量越大;反之,估计的可靠性越低,所需的样本容量越小。
(4)抽样方式。
在其他条件相同的情况下,采用重置抽样方式比采用不重置抽样方式所需的样本容。
文案大全3、如果总体方差未知,在确定样本容量时,应如何? 在实践中,估计样本量时若2σ未知,可根据以下方法来确定2σ:第一,根据历史资料已有的方差代替;第二,在正式抽样调查之前,开展一次试验性调查,根据试验性调查所得资料加以估计;第三,如果有多次实验结果或多个历史方差,则根据最大的方差来代替总体方差计算样本量。
4、 解:5.3=x s 2=1.457 201.0=x σ 9.31.3<<μ5、解:X =2.12 S= ()12--∑n X X =0.2239=X ±t 2αnS因此总体均值95%的置信区间为( 1.96,2.28)6、某企业生产某种产品的工人有1000人,某日采用不重复抽样从中随机抽取100人调查他们的当日产量,样本人均产量为35件,产量的样本标准差为4.5件,试以95.45%的置信度估计平均产量的抽样极限误差和置信区间。
文案大全35=x s=4.5∆ =z 2αnS =总体均值95%的置信区间为(34.146, 35.854)7、 (1) 解:S=11.3772=X ±z 2αnS =76.6±2该校学生英语测试的平均成绩的置信区间为( 73.32 , 78.87) (2)大样本情形下总体比例P 的置信区间为:文案大全)平均成绩在80分以上的学生所占的比重为(0.38 ,0.58)2.均值比较的T 检验分几种类型?独立样本均值的T 检验和配对样本均值的T 检验3.解: H 0:,H 1: 样本比例 检验统计量接受原假设认为50%的消费者是中学生 4.略 5. 解:从两种工艺条件下生产的产品中各抽取100个样本属于独立样本。
H 0: μ1=μ2 , H 1: μ1≠μ2))1(,)1((22nP P Z p nP P Z p -+--αα文案大全502.1-1005.2810028286-280)-(-)-(222221212121=+=+=n s n s x x Z μμ,接受原假设,两种工艺条件下生产产品的强力无显著差异。
6. 解已知:小样本,正态分布,方差相等,x 1=20.1 x 2=19.8 s 12=0.17 s 22=0.14。
)05.0(=α,,H 0: μ1=μ2 , H 1: μ1≠μ22)1()1(2121221121-+-+-=--n n s n s n s n n =0.42822973.14282.061818.191.20112121=⨯+-=+-=sn n x x t对于给定的显著性水平α=0.05,查t 分布表可得t 0.025(12)=2.1788 ,由于|t |=1.2973<2.1788=t 0.025(12),所以应接受原假设。
认为甲、乙两台机器加工的产品平均直径无显著差异。
7.某企业生产三种不同口味的点心,为了分析不同性别的消费者的口味偏好,随机抽取了110名消费者进行调查,在品尝三种不同口味的点心后陈述其偏好,结果如下表所示:文案大全在显著性水平0.05下,检验性别是对口味的偏好是否有显著差异?解:性别与口味不相关:0H性别与口味相关:1H根据公式),,2,1;,,2,1(c j r i nn n f ji ij ==⨯=⋅⋅可计算得在原假设成立的条件下的期望分布表如下:0794.22)-(ij22==∑ijij ij f f n χ当显著性水平为0.05时,929.5)2(22=>αχχ,检验结果表明性别与口味相关,性别是对口味的偏好是有显著影响。
文案大全文案大全第六章1.方差分析的基本原理是什么?总偏差平方和可分解为组间方差与组内方差。
组间方差即水平间的方差,该方差既有由于水平均值不同而引起的系统性误差,又有随机误差存在。
如果H 0成立,水平间的方差就只包含随机误差,没有由于均值的不同而导致的系统性差异,此时,组间方差与组内方差均是随机误差,他们的取值就应该接近,比值应该接近于1;相反若H 0不成立,水平间的方差既包含随机误差,又有系统性误差,组间方差大于组内方差,二者的比值也显著的大于1,当大到超过某一临界值时,就可认为水平均值之间存在差异。
2.说明单因素方差分析中SST 、SSE 、SSA 的含义及三者之间的关系。
SST 总离差平方和,是全部试验的每一观察值X ij 对其总平均数X 的离差平方总和。
SST=2)(∑∑-X X ij∑∑-=2)(i ij X X SSE ,为各行观察值对各该行平均数(组平均数)的离差平方和的总和,反映的是水平内部,或组内观察值的离散状况,称其为组内平方和或组内方差,反映了由于随机误差的作用而在数据X ij 中引起的波动。
∑∑∑-=-=22)()(X X k X X SSA i i i 为组平均数对总平均数的离差平方和,反映的是组间差异,其中既包括随机因素,也包括系统因素,称其为组间平方和或水平项离差平方和。
SSA SSE SST +=3,4,5,6题可进行软件操作,略第七章1.什么是相关关系?当一个或几个相互联系的变量取一定数值时,与之相对应的另一变量的值虽然不确定,但它仍按某种规律在一定范围内变化,变量间的这种具有不确定性的相互关系,称为相关关系。
2.相关分析与回归分析有何联系与区别?相关分析与回归分析有着密切的联系。
相关分析需要依靠回归分析来表明现象数量相关的具体形式,而回归分析则需要依靠相关分析来表明现象数量变化的相关程度,只有当变量之间存在着高度相关时,进行回归分析寻求其相关的具体形式才有意义。
可以这样说,相关分析是回归分析的基础和前提,回归分析是相关分析的深入和继续。
区别:(1)相关分析中,变量x变量y处于平等的地位;回归分析中,变量y称为因变量,处在被解释的地位,x称为自变量,用于预测因变量的变化(2)相关分析中所涉及的变量x和y都是随机变量;回归分析中,因变量y是随机变量,自变量x可以是随机变量,也可以是非随机的确定变量(3)相关分析主要是描述两个变量之间线性关系的密切程度;回归分析不仅可以揭示变量x对变量y的影响大小,还可以由回归方程进行预测和控制。