第一早1. 统计学:研究数据的搜集、整理与分析的科学,面对不确定性数据作出科学的推断。
因而统计学是认识世界的重要手段。
2. 食品试验设计与统计分析:数理统计原理与方法在食品科学研究中的应用,是一门应用数学。
3. 食品试验科学的特点:1.食品原料的广泛性2•生产工艺的多样性 3.质量控制的重要性4.不同学科的综合性4. 统计学发展概貌:古典记录统计学、近代描述统计学、现代推断统计学。
第二早5. 总体:根据研究目的确定的研究对象的全体。
6. 个体:总体中一个独立的研究单位。
7. 样本:根据一定方法从总体中抽取部分个体组成的集合。
8. 样本含量n (样本容量):即样本中个体的数目。
(n<30的样本叫小样本,n >30的样本叫大样本)9. 随机样本:总体中的每一个个体都有同等机会被抽取组成样本。
10. 参数:由总体计算的特征数。
11. 统计量:由样本计算的特征数。
12. 参数和统计量的关系:由相应的统计量来估计参数,如样本平均数估计总体平均数,样本标准差估计总体标准差。
13. 准确性(准确度):在调查或试验中某一实验指标或性状的观测值与真实值接近的程度。
(观测值与真实值之间)14. 精确性(精确度):在调查或试验中同一实验指标或性状的重复观测值彼此接近的程度。
(观测值与观测值之间)15. 试样中的误差:随机误差和系统误差。
16. 随机误差(抽样误差):由许多无法控制的内在和外在偶然因素所造成的误差,不可避免和消除,影响试验的精确性。
17. 系统误差(片面误差):由于试验对象相差较大,测量的仪器不准、标准试剂未经校正所引起,可以通过改进方法、正确试验设计来避免、消除,影响试验准确性。
18. 资料的分类:连续性资料:对每个观测值单位使用仪器或试剂等量测手段来测定其某项指标的数值大小而得至U 的资料。
间断性资料:用计数方式得到的数据资料。
分类资料:可自然或人为地分为两个或多个不同类别的资料。
等级资料:将观察单位按所考察的性状或指标的等级顺序分组,然后清点各组观察单位的次数而得的资料。
19. 连续性资料的整理:采用组距式分组1.求全距2.确定组数3.求组距4.确定组限和组中值(最小值为下限,最大值为上限。
第一组的组中值以接近于或等于资料中最小值为好。
)5.制作次数分布表20. 统计表的绘制原则:结构简单,层次分明,内容安排合理,重点突出,数据准确,便于理解和分析21. 统计表种类:简单表,复合表22. 统计图用图形将统计资料形象化。
长条图、圆图、线图、直方图、折线图。
23. 平均数豪:指出资料中数据集中较多的中心位置,描述资料的集中性。
反应了总体分布的集中趋势。
24. 平均数的种类:算术平均数、中数、众数、几何平均数、调和平均数。
25. 算数平均数计算方法:直接法、加权法26. 算数平均数的特性:离均差为0,离均差平方和最小。
27. 离均差:每个观测值均有一个偏离平均数的度量指标。
算术平均数的离均差之和为零。
28. 离均差平方和:各个离均差平方后相加。
29. 方差(MS ):也称均方,各数据与平均数的差的平方和与自由度的比。
样本方差用S2表示。
(无单位)30. 自由度df :样本内独立而能自由变动的离均差个数。
31. 标准差:样本方差的算术平方根。
(有单位,与观测值单位相同)32. 标准差的特性:1.标准差的大小受每个观测值的影响,若数值之间变异大,其离均差亦大,标准差必然大。
33. 样本标准差:EXCEL用STDEV函数计算。
34. 变异系数CV :标准差相对于平均数的百分数。
反映了总体的可比程度。
CV= 2*100%X35. 变异系数的作用:当资料所带的单位不同或单位虽然相同而平均数相差较大时,不能直接用标准差比较各个样本资料的变异程度大小。
消除了不同单位和平均数的影响。
第二早36. 伯努利试验:只有两种实验结果的随机试验。
37. N重伯努利试验:伯努利试验在完全相同的实验条件下独立的重复n次,并作为一个随机试验。
38. 二项分布(n , p ):离散型随机变量分布。
亠k k n_kP(x=k)= C p q (k=0,1,2,3 …,n)39. 二项分布的特征n1. P n ( K)>02. ( p+q ) n=13.在一定范围内的总概率P等于被包含的几个概率之和。
4. 当p值较小且n不大时,分布是偏倚的。
随着n的增大,分布逐渐趋于对称。
5. 当p值趋于0.5时,分布趋于对称。
40. 二项分布的应用条件:(1 )试验结果为两大类或两种可能的结果。
(2)每次试验的条件不变,每次试验A的发生概率均为n。
(3)各次试验独立,每个观察单位的观察结果不会影响到其他观察单位的结果。
41. 二项分布的平均数:亠np42. 二项分布的方差:;^=npq43. 泊松分布XfP(h):可以用来描述和分析随机地发生在单位空间或时间里的稀有事件的分布。
(即小概率事件分布,意外事故、自然灾害都近似服从)P(x=k)=k!44. 泊松分布特点:离散型随机变量概率分布,均值与方差相等。
尸/=入。
45. 泊松分布的应用条件:1. 随机地发生在单位时间或空间里的稀有事件的概念分布。
2. 在二项分布中,n很大,p很小时。
3. 事件不随机时,不能用泊松分布。
46. 正态分布x、N(J;「2 3 4):连续型随机变量的概率分布。
47. 正态分布的特点:1. 正态分布曲线是以均数•为中心左右对称的单峰悬钟形曲线。
在平均数的左右两侧,只要(X-」)绝对值相等,f ( x)值就相等。
2. f ( X)在x= •处达到最大值,且f(」)=1/( d 2二)3. f ( x)是非负函数,以横轴为渐近线,分布从-*到+ ^,且曲线在J±d处各有一个拐点。
4. 卩是位置参数,d是形状参数。
5. 正态分布的次数多数集中于平均数」的附近,离均数越远,其相应的次数越少。
6. 曲线f (x)与横轴之间所围成的面积等于1。
5.泊松分布, >30时,用正态分布代替。
51.抽样分布: 统计量的分布概率。
52.抽样误差 :由随机抽样造成的误差。
53.标准误差(标准误,均数标准误):样本平均数抽样总体的标准差。
反应精确性的高低匸X越大精确度越低。
54. t分布:在计算Sx时,由于采用S来代替「使得t变量不再服从标准正态分布,而是服从t分布。
t= (x- /S x第四章55. 统计推断:根据抽样分布规律和概率理论,由样本结果去推断总体特征。
主要包括假设检验(显著性检验)和参数估X- _0= -+ ;- -0= (-L-)+ ;57. 统计假设检验:对研究总体提出假设,然后在此假设下构造合适的检验统计量,并由该统计量的抽样分布计算出样本统计量的概率,再根据概率值的大小作出接受或否定假设的判断。
59. 备择假设H A :与无效假设相对应的假设。
「60.进行假设检验的基本依据:把小概率事件在一次试验中看成是实际不可能发生的事件称为小概率事件实际不可能性原理。
|61. 显著水平 a : 决定接受或否定H o的小概率标准。
(常用显著水平有0.05 和0.01 )62. 统计假设检验步骤:1.建立假设 2.确定显著水平 a 3.检验计算 4.统计推断63. I型错误(第一类错误):指当H。
本身正确,但通过假设检验后却否定了它,也就是将非真实差异错判为真实差异。
犯第一类错误的概率是〉。
(减少I型错误,可将显著水平定得小一点。
)64. n型错误(第二类错误):当H0本身错误时,通过假设检验后却接受了它,也即把真实差异错判为非真实差异。
(减少n型错误,通常是通过减少均数标准误来减小第二类错误的概率。
而均数标准误的减小是通过精密的试验设计、严格的试验操作和增大样本容量来实现的。
由于一般来说a大B就小,增大了犯第一类错误的概率时,犯第二类错误的可能性就小。
反之,a小,B大。
因此在实践中可以根据试验目的,通过调整a的大小来控制检验时犯错误的概率。
)65. 两尾检验:备择假设中,包含了严妙和庐妙两种情况,因而这种检验有两个否定域,分别位于样本平均数分布曲线的两尾。
_66. 一尾检验:否定域位于;分布曲线某一尾的统计假设检验。
67. 选用两尾检验还是一尾检验应根据专业的要求在试验设计时确定。
若事先不知道卩与⑷谁大谁小,为了检验两者是否有差异就用两尾检验。
如果能凭借专业只是推测p不会小于(或大于)卩0时,为了检验□是否大于(或小于)炉应用一尾检验。
68. u检验:在假设检验中利用标准正态分布来进行统计量的概率计算的检验方法。
69. u检验使用范围:若样本资料总体方差已知,或样本含量》30时用u检验。
70. 假设统计误差中试验误差:随机误差71. 统计假设检验中应注意的问题: 1.试验要科学设计和正确实施 2.选用正确的统计假设检验方法 3.正确理解差异显著性的统计意义 4.合理建设统计假设,正确计算检验统计量由于常用显著水平空有氏05和0.0U故柞统计推断时就有3种可能蜡果+毎次检的必须且只能得其中之一「①当计算岀的槪率邑〉%05艾h说明表面效应仅由谋差造成的槪率不很小•故炖接受无效假设H叮拒绝丹…此称为愛建不星笫②当计算岀的概率匸01[怎dgS时‘说明表面效应仅由逞羞造成的槪率很小,则应否定接受Hz此时旋歸苹丽差异显著。
差异显著通常是在计寡的统计就值上川机空> 杯来表示"»冷③当计算出的槪率卫竜gJH时,说明表面效应仪由课差遣成的概率更小,更应否定05单个样本平均数的假设检验1)单个样本平均数的 u 检验:某罐头厂生产肉类罐头,其自动装罐机在正常工作时每罐净重服从正态分布10由題总知•样本所属总体眼从正态分布•并II 总体尿准鳧严也苻台欄检验的荷用条件 由于当口装罐机的每罐平均净政可能為于或低尸正常匸作状怎下的林准净联.故需作两尼检 其方法步«$aT>① 按出假设.秋,屮=严=500 g.即谏日装雄机毎雄平均净匝与标准净朮一样.HT 产•即谏日装壇机的毎喙平均净It 与标准净載不同、装繰机匚作不正常.② 确定显着水平.e- 0. 05(两址槪率几 ③ 检脸计算.样本平均数 J =为工〃 =(505 4-512 + …+ &I0)/10 = 5(J2. 7W ) 均数标准误 ①二&斥=dg=2・530 统计联 u 值=7-500)/2.53 = 1.067④ 统计推断*由显著水平□= 0.05査附表2得临界“值;%师=!.9亿由于实得| u| = L 067<u a os = 1. 9氛可知表面效应工二严=502. 7 — 500 =2. 7 ffl.由误誥 造成的槪率故不能否定推断该睡薙平所净直与标准浄重苒界不扯著•表明该 日装罐机工作属正常状态*2)单个样本平均数的t 检验: t 检验:在假设检验中利用 t 分布来进行统计量的概率计算的检验方法。