从经典案例理统计学中的假设检验
生活中存在大量的非统计应用的假设检验,一个众所周知的例子就是对罪犯的审讯。
当一个人被控告为罪犯时,他将面临审讯。
控告方提出控诉后,陪审团必须根据证据做出决策。
事实上,陪审团就进行了假设检验。
这里有两个要被证明的假设。
第一个称为原假设,用H0表示(发音为H-nought, nought是零的英国表示方法)。
它表示
H0:被告无罪
第二个假设称为备择假设,用H1表示。
在罪犯审讯中,它表示
H1:被告有罪
当然,陪审团不知道哪个假设是正确的,他们根据控辩双方所提供的证据做出判断。
这里只有两种可能:判定被告有罪或无罪释放。
在统计应用中,判定被告有罪就相当于拒绝原假设;而判定被告无罪也就相当于不能拒绝原假设。
应当注意,我们并不能接受原假设。
在罪犯审判中,接受原假设意味着发现被告无罪。
在我们司法系统中,并不允许这样的判定。
当我们进行假设检验时,存在两种可能的错误。
第一类错误是当原假设正确时,我们却拒绝了它。
第二类错误被定义为当原假设有错误时,我们却并没有拒绝。
在上面的例子中,第一类错误就是一个无罪的人被判定有罪。
当一个有罪的被告被判定无罪时,第二类错误就发生了。
我们把发生第一类错误的概率记为a,通常它也被称作显著性水平。
第二类错误发生的概率记为b。
发生错误的概率a 和b是相反的关系,这就意味着任何尝试减少某一类错误的方法都会使另外一类错误发生的概率增加。
在司法系统中,第一类错误被认为是更加严重的。
这样,我们的司法系统的构建就要求第一类错误发生的概率要很小。
要达到这样的结果,往往会对起诉证据进行限制(原告必须证明罪犯有罪,而被告则不需要证明什么),同时要求陪审团只有具有“远非想象的证据”时才能判定被告有罪。
在缺少大量证据的情况下,尽管有一些犯罪证据,陪审团也必须判定其无罪。
这样的安排必然使有罪的人被判无罪的概率比较大。
美国最高法院法官奥利弗·温德尔·霍姆斯(Oliver Wendell Holmes)曾经用下面一段话描述了第一类错误发生的概率与第二类错误发生概率之间的关系。
他说,“判定100个有罪的人无罪,要比判1个无罪的人有罪好得多。
”在霍姆斯看来,发生第一类错误的概率应该是第二类错误的
1/100。
这里一些关键的概念如下:
1、这里有两个假设,一个叫做原假设,另一个叫做备择假设。
2、这个检验过程从假设原假设是正确的开始。
3、这个过程的目的是判定是否有足够的证据判断备择假设是正确的。
4、这里有两个推断:拒绝原假设,赞成备择假设;不拒绝原假设。
5、在任何的检验中,有两类可能的错误。
第一类是原假设正确却拒绝它,第
二类错误是当原假设不正确时却未能拒绝。
P(第一类错误)=a
P(第二类错误)=b
我们把这些概念引申到统计假设检验中。
在罪犯审讯的例子中,“足够的证据”定义为“超越合理怀疑的证据”。
在统计学中,我们需要利用检验统计量的样本分布来定义“足够的证据”。
假设检验基于样本统计量的抽样分布。
一个假设检验的结果是对样本统计量的一个概率表述。
计算检验统计量,并确定当原假设正确时有多大发生的可能性。
如果概率很小,我们可断定原假设为真的假定不成立,应该拒绝它。