华东师大心理统计笔记第一章绪论&1.随机现象与统计学确定现象随机现象本人性别生男生女光的速度学习成绩种豆得豆(人的)反应速度随机现象:具有以下三个特性的现象称为随机现象(i)一次试验有多种可能结果,其所有可能结果是已知的。
(ii)试验之前不能预料哪一种结果会出现(iii)在相同条件下可以重复试验随机事件:随机现象的每一种结果叫做一个随机事件。
随机变量:把能表示随机现象各种结果的变量称为随机变量统计学的研究对象是随机现象规律性随机变量的分布:(i)正态分布eg:学习成绩图(略)(ii)双峰分布eg::汽车拥挤程度图(略)(iii)另一种分布eg:如下图(略)&2.总体和样本总体:是我们所研究的具有某种共同特性的个体的总和样本:是从总体中抽取的作为观察对象的一部分个体。
(i)总体:有限总体:总体所包含的个体数目有限时无限总体:总体所包含的个体数目无限时→参数:总体上的(ii)总体→抽样→样本:大样本:>30 >50小样本:≤30 ≤50(更精神)(样本容量:样本中包含的个体数目)→统计量:样本上的数字特征根据统计量来估计参数&3.心理统计学的内容1.描述统计:对已获得的数据进行整理,概括,显现其分布特征的统计方法。
集中量平均数#描述差异量标准差S: S大:差异大/不稳定对个别S小:差异小/稳定对个别统计相关量:相关系数(表示两件事情的相互关系)r.r↔[-1,1](r表示从无关道完全相关,相关:正相关,相关,负相关)2.推断统计参数估计:#→µs→σ推断r→р统计假设检验:参数检验非参数检验3.实验设计↓前程:相同符号的一串→非参数检验中的一种第二章数据整理&1.数据种类一.间断变量与连续变量eg:人数~间断二.四种量表。
1.称名量表。
Eg:307室,学好,电话好吗不能进行数学运算(也包括不能大小比较2.顺序量表。
Eg:名次。
能力大小,不能运算3.等距量表。
可以运算(做加减法),不能乘除要求:没有绝对0年龄有绝对0时间(年代,日历。
)位移无绝对0,可能有相对0,即有正负4.等比量表。
可做乘除法。
要有绝对零。
成绩中的,0分不是绝对0(因为并不说明此人一窍不通)分数代表的意义。
Eg:0~10分与90~100分。
每一分的“距离”不一样因为严格来说,成绩是顺序量表。
但为了实际运用中的各种统计,把它作为等距量表&2.次数分布表一.简单次数分布表eg: 组别次数(人次)100 290~99 580~89 1470~79 1560~69 760分以下 31.求全距R=Max – Min(连续变量)(间断变量)——R=Max-Min+12.定组数K(组数)=1.87(N-1)。
→取整N-总数3.定组距I=R/K。
一般,取奇数或5的倍数(此种更多)。
4.定各组限5.求组值X=(上限+下限)/2 上限——指最高值加或取10的倍数等)6.归类划记7.登记次数例题:99 96 92 90 90 (I)R=99-57+1=4387 86 84 83 838282 80 79 78 (II)K=1.87(50-1)。
≈97878 78 77 777776 76 76 767575 74 74 73 (III)I=R/K =43/9≈57272 72 71 717170 70 69 696867 67 67 65 (iu)组别组值次数64 62 62 61 57 95~99 97 290~94 92 385~89 87 280~84 82 675~79 77 1470~74 72 1165~69 67 760~64 62 455~59 57 1总和50 二.相对(比值)次数分布表。
累积次数分布表相对(比值)累积次数:累积次数值/总数N注:一般避免不等距组(“以上”“以下”称为开口组)相对次数累积次数(此处意为“每组上限以下的人次)”小于制“.04 50.06 48.04 45.12 43.28 37.22 23.14 12.08 5.02 11.00&3.次数分布图一.直方图1.标出横轴,纵轴(5:3)标刻度2.直方图的宽度(一个或半个组距)3.编号,题目4.必要时,顶端标数)图二.次数多边图1.画点,组距正中2.连接各点3.向下延伸到左右各自一个组距的中央最大值即y轴最大值相对次数分布图,只需将纵坐标改为比率。
(累积次数,累积百分比也同样改纵坐标即可)‖S形‖曲线是正态分布图的累积次数分布图图(第三章常用统计量数&1.集中量一.算术平均数公式算术平均数的优缺点。
P36~37算术平均数的特征。
Σ(X-#)=0 离(均数)差Σ(X-#)(X-#)取#时,得最小值即:离差平方和是一最小值二.几何平均数#g= 略long#g=1/NσlogXi根据按一定比例变化时,多用几何平均数eg: 91年92 93 94 95 9612%10%11%9%9%8%求平均增长率xg=加权平均数甲:600人#=70分乙:100人#=80分加权平均数:#=(70*600+80*100)/(600+100) (总平均数)eg:600人,100人简单平均数:(70+80)/2三.中(位)数。
(Md)1.原始数据计算法分:奇、偶。
2.频数分布表计算法(不要求)3.优点,缺点,适用情况(p42)四.众数(Mo)1.理论众数粗略众数2.计算方法:Mo=3Md-2#Mo=Lmo+fa/(fa+fb)*I计算不要求3.优缺点平均数,中位数,众数三者关系。
&2.差异量数一.全距R=Max-Min二.平均差(MD或AD)MD={Σ|x-#(或Md)|}/N三.方差总体方差的估计值S2 =Σ(X -#)2 反编样本的方差:σ 2 x有编N很小时,用S2 估计总体N>30时,用S2 或σ 2 x 都可以计算方法:σ 2 x=Σx2 /N -(ΣX/N) 2标准差σx=σ 2 x2/1四.差异系数(CV)CV=σx/# *100% CV↔[5%,35%]3个用途五.偏态量与锋态量(SK)1.偏态量:sk=(#-Mo)/σx动差(一级~四级)a3= Σ(x-#)3 、/ N/σx3 三级动差计算偏态系数)2.峰态量:高狭峰a4>0 (a4=0 ——正态峰)低调峰。
A4<0用四级动差a4=Σ(X - #)4/N/σx4-3&3.地位量数一.百分位数eg:P30=60(分) ―60分以下的还有30%的人‖二.百分等级30→60(在30%的人的位置上,相应分数为60)So→Md第四章概率与分布&1.概率一.概率的定义W(A)=m/n (频率/相对频数)后验概率:P(A)=lim m/n先验概率:不用做试验的二.概率的性质和运算1.性质:o≤P≤1p=1 必然可能事件p=0 不可能事件2.加法。
P(a+b)=P(a)+P(b)“或”:两互不相克事件和。
推广:“有限个”P(A1+A2+…+An)=P(A1)+P(A2)+…+P(An)eg:(1)A=出现点数不超过4(x≤4)P(A)=P(x=1)+P(x=2)+P(x=3)+P(x=4)=1/6+…1/6=4/6=2/3(2)完全凭猜测做判断题,(共2道),做对1题的概率为:A={T.Ti B={F.Ti C={T.Fi D={F.FiP=P(B)+P(C)=1/4+1/4=0.53.乘法:P(A1,A2…An)=P(A1),P(A2)…P(An)Eg:(1)四选1。
(十道)完全凭猜测得满分得概率:(1/4)*(1/4)…*(1/4)=1/410&2.二项分布一.二项分布P(x)=Cn x p x g n-x做对的概率p x :做错的概率g n-x:X:对的数量p x g n-x ——每一分情况的概率。
一种情况:p x g n-x 再乘上系数。
Eg:产品合格率为90%取n=3(个)TTT的情况90 * 90*90=P30.729TFT 90*0.10*90=P2g10.081两个合格的情况→TTFFTT其概率C32P2g1=3p2g1.Cn0P0g n+CnP1g n-1+…+CnP n g0=1注:二项分布可能的结果只有两种。
F 0r T合格Or 不合格选对Or 选错例:(1)10道是非题,凭猜测答对5,6,7,8,9,10题的概率?至少答对5题的概率P(x=5)=C510P5g5=C510(1/2)51/2)5=.24609P(x=6)=C610P6g4=C610(1/2)6(1/2)4=.20508P(x=7)=C710P7g3=C710(1/2)7(1/2)3=.11719=.04395=.00977+P(x=10)=C1010P10g0=(1/2)10=.000098至少答对5题:P(X≥5) = 0.62306(2)四选一,猜中8,9,10题的概率?P(x=8)=C819P8g2=C819(1/4)8(3/4)2=.0039二.二项分布图(P84~85)三.二项分布的平均数与标准差(前提np≥5且ng≥5)平均数——M=np 标准差——r=npg1/2&3.正态分布一.正态分布曲线二.标准正态分布。
(P387附表可查面积P)Z=(x-ц)/r (x:原始分数)标准分数(有正有负)ΣZ=0三.正态分布表的使用查表P(0≤Z≤1)=0.34134——Z的范围中的人数比例(百分数)P(0≤Z≤1.645)=0.45001.64 -.44950=0.451.65 -.45053=0.45之上,标准分数高于2个标准差,则非常聪明。
Eg:1. μ=70(分) σ=10P(70≤x≤80)=p(o≤z≤1)P(60≤x≤70)=P(-1≤z≤0)2.μP(0≤z≤1)=P(μ≤x≤μ+σ)P(-1≤z≤0)=P(μ-σ≤x≤μ)图(略)例:某地区高考,物理成绩μ=57。
08(分)σ=18。
04(分)总共47000人。
(1)成绩在90分以上多少人?(2)成绩在(80,90)多少人?(3)成绩在60分以下多少人?解: X~N(57.08,18.042) ——参数(μ,σ2)Normal 表示符合正态分布令Z= (x-57.08)/18.04),则Z~N(0,12)标准分数平均数一定为0,标准差一定为1。
(1)Z1=(90-57。
08)/18.04=1.82P(Z>1.82)=.0344N1=np=47000*0.0344=1616(人)(2)Zz=(80-57.08)/18.04=1.27P(1.27<Z<1,82)=.46562-.39796=0.677N2=NP=3177(人)(3)Z3=(60-57.08)/18.04=0.16P(Z<0.16)=.56356N3=26487(人)四.正态分布的应用T=KZ+C T~N(C,K2)IQ=15Z+100 IQ=100 一般IQ≥130 ——超常(30=2x*15)IQ<70 ——弱智70几——bndenlineeg:1.某市参加一考试2800人,录取150人,平均分数75分,标准差为8。