各种校验码校验算法分析二进制数据经过传送、存取等环节会发生误码1变成0或0变成1这就有如何发现及纠正误码的问题。
所有解决此类问题的方法就是在原始数据数码位基础上增加几位校验冗余位。
一、码距一个编码系统中任意两个合法编码码字之间不同的二进数位bit数叫这两个码字的码距而整个编码系统中任意两个码字的的最小距离就是该编码系统的码距。
如图1所示的一个编码系统用三个bit来表示八个不同信息中。
在这个系统中两个码字之间不同的bit数从1到3不等但最小值为1故这个系统的码距为1。
如果任何码字中一位或多位被颠倒了结果这个码字就不能与其它有效信息区分开。
例如如果传送信息001而被误收为011因011仍是表中的合法码字接收机仍将认为011是正确的信息。
然而如果用四个二进数字来编8个码字那么在码字间的最小距离可以增加到2如图2的表中所示。
信息序号二进码字 a2 a1 a0 0 0 0 0 1 0 0 1 2 0 1 0 3 0 1 1 4 1 0 0 5 1 0 1 6 1 1 0 7 1 1 1 图 1 信息序号二进码字 a3 a2 a1 a0 0 0 0 0 0 1 1 0 0 1 2 1 0 1 0 3 0 0 1 1 4 1 1 0 0 5 0 1 0 1 6 0 1 1 0 7 1 1 1 1 图 2 注意图8-2的8个码字相互间最少有两bit 的差异。
因此如果任何信息的一个数位被颠倒就成为一个不用的码字接收机能检查出来。
例如信息是1001误收为1011接收机知道发生了一个差错因为1011不是一个码字表中没有。
然而差错不能被纠正。
假定只有一个数位是错的正确码字可以是100111110011或1010。
接收者不能确定原来到底是这4个码字中的那一个。
也可看到在这个系统中偶数个2或4差错也无法发现。
为了使一个系统能检查和纠正一个差错码间最小距离必须至少是“3”。
最小距离为3时或能纠正一个错或能检二个错但不能同时纠一个错和检二个错。
编码信息纠错和检错能力的进一步提高需要进一步增加码字间的最小距离。
图8-3的表概括了最小距离为1至7的码的纠错和检错能力。
码距码能力检错纠错 1 2 3 4 5 6 7 0 0 1 0 2 或 1 2 加 1 2 加 2 3 加 2 3 加 3 图3 码距越大纠错能力越强但数据冗余也越大即编码效率低了。
所以选择码距要取决于特定系统的参数。
数字系统的设计者必须考虑信息发生差错的概率和该系统能容许的最小差错率等因素。
要有专门的研究来解决这些问题。
二、奇偶校验奇偶校验码是一种增加二进制传输系统最小距离的简单和广泛采用的方法。
例如单个的奇偶校验将使码的最小距离由一增加到二。
一个二进制码字如果它的码元有奇数个1就称为具有奇性。
例如码字“10110101”有五个1因此这个码字具有奇性。
同样偶性码字具有偶数个1。
注意奇性检测等效于所有码元的模二加并能够由所有码元的异或运算来确定。
对于一个n位字奇性由下式给出奇性a0⊕a1⊕a2⊕…⊕an 奇偶校验可描述为给每一个码字加一个校验位用它来构成奇性或偶性校验。
例如在图8-2中就是这样做的。
可以看出附加码元d2是简单地用来使每个字成为偶性的。
因此若有一个码元是错的就可以分辨得出因为奇偶校验将成为奇性。
奇偶校验编码通过增加一位校验位来使编码中1个个数为奇数奇校验或者为偶数偶校验从而使码距变为2。
因为其利用的是编码中1的个数的奇偶性作为依据所以不能发现偶数位错误。
再以数字0的七位ASCII码0110000为例如果传送后右边第一位出错0变成1。
接收端还认为是一个合法的代码0110001数字1的ASCII码。
若在最左边加一位奇校验位编码变为10110000如果传送后右边第一位出错则变成101100011的个数变成偶数就不是合法的奇校验码了。
但若有两位假设是第1、2位出错就变成101100111的个数为5还是奇数。
接收端还认为是一个合法的代码数字3的ASCII码。
所以奇偶校验不能发现。
奇偶校验位可由硬件电路异或门或软件产生偶校验位 an a0⊕a1⊕a2⊕…⊕an-1 奇校验位 an NOTa0⊕a1⊕a2⊕…⊕an-1。
在一个典型系统里在传输以前由奇偶发生器把奇偶校验位加到每个字中。
原有信息中的数字在接收机中被检测如果没有出现正确的奇、偶性这个信息标定为错误的这个系统将把错误的字抛掉或者请求重发。
在实际工作中还经常采用纵横都加校验奇偶校验位的编码系统--分组奇偶校验码。
现在考虑一个系统它传输若干个长度为m位的信息。
如果把这些信息都编成每组n个信息的分组则在这些不同的信息间也如对单个信息一样能够作奇偶校验。
图4中n个信息的一个分组排列成矩形式样并以横向奇偶HP及纵向奇偶VP的形式编出奇偶校验位。
m位数字横向奇偶位 n 个码字a1 a2 … am-1 am HP1 b1 b2 … bm-1 bm HP2 c1 c2 … cm-1 c m HP3 … … … … … … n1 n2 … nm-1 nm HPn VP1 VP2 … VPm-1 VPm HPn1 纵向奇偶位图 4 用综横奇偶校验的分组奇偶校验码研究图4可知分组奇偶校验码不仅能检测许多形式的错误。
并且在给定的行或列中产生孤立的错误时还可对该错误进行纠正。
在初级程序员试题中早期也出现在程序员试题中经常有综横奇偶校验的题目。
一般解法应该是这样先找一行或一列已知数据完整的确定出该行或列是奇校验还是偶校验。
并假设行与列都采用同一种校验这个假设是否正确在全部做完后可以得到验证。
然后找只有一个未知数的行或列根据校验性质确定该未知数这样不断做下去就能求出所有未知数。
【例】2001年初级程序员试题由 6 个字符的 7 位 ASCII 编码排列再加上水平垂直奇偶校验位构成下列矩阵最后一列为水平奇偶校验位最后一行为垂直奇偶校验位: 字符 7 位 ASCII 码 HP 3 0 X1 X2 0 0 1 1 0 Y1 1 0 0 1 0 0 X3 1 X4 1 0 1 0 1 1 0 Y2 0 1 X5 X6 1 1 1 1 D 1 0 0 X7 1 0 X8 0 0 X9 1 1 1 X10 1 1 VP 0 0 1 1 1 X11 1 X12 则 X1 X2 X3 X4 处的比特分别为 __36__ X5 X6X7 X8 处的比特分别为 ____ X9 X10 XI1 X12 处的比特分别为 __38__ Y1 和 Y2 处的字符分别为 __39__ 和__40__ 。
解从ASCII码左起第5列可知垂直为偶校验。
则从第1列可知X40从第3行可知水平也是偶校验。
从第2行可知X31从第7列可知X80从第8列可知X121 从第7行可知X111从第6列可知X100从第6行可知X91从第2列可知X11 从第1行可知X21从第3列可知X51从第4行可知X60 从第4列或第5行可知X70整理一下 36 X1X2X3X4 1110 37 X5X6X7X8 1000 38 X9X10X11X12 1011 39 由字符Y1的ASCII码100100149H知道Y1即是“I”由“D”的ASCII码是100010044H推得 40 由字符Y2的ASCII码011011137H知道Y2即是“7”由“3”的ASCII码是011001133H推得假如你能记住“0”的ASCII码是011000030H“A”的ASCII码是100000141H则解起来就更方便了。
三、海明校验我们在前面指出过要能纠正信息字中的单个错误所需的最小距离为3。
实现这种纠正的方法之一是海明码。
海明码是一种多重复式奇偶检错系统。
它将信息用逻辑形式编码以便能够检错和纠错。
用在海明码中的全部传输码字是由原来的信息和附加的奇偶校验位组成的。
每一个这种奇偶位被编在传输码字的特定位置上。
实现得合适时这个系统对于错误的数位无论是原有信息位中的还是附加校验位中的都能把它分离出来。
推导并使用长度为m位的码字的海明码所需步骤如下 1、确定最小的校验位数k将它们记成D1、D2、…、Dk每个校验位符合不同的奇偶测试规定。
2、原有信息和k个校验位一起编成长为mk位的新码字。
选择k 校验位0或1以满足必要的奇偶条件。
3、对所接收的信息作所需的k个奇偶检查。
4、如果所有的奇偶检查结果均为正确的则认为信息无错误。
如果发现有一个或多个错了则错误的位由这些检查的结果来唯一地确定。
校验位数的位数推求海明码时的一项基本考虑是确定所需最少的校验位数k。
考虑长度为m位的信息若附加了k个校验位则所发送的总长度为mk。
在接收器中要进行k个奇偶检查每个检查结果或是真或是伪。
这个奇偶检查的结果可以表示成一个k位的二进字它可以确定最多2k种不同状态。
这些状态中必有一个其所有奇偶测试试都是真的它便是判定信息正确的条件。
于是剩下的2k-1种状态可以用来判定误码的位置。
于是导出下一关系 2k-1≥mk 码字格式从理论上讲校验位可放在任何位置但习惯上校验位被安排在1、2、4、8、…的位置上。
图5列出了m4k3时信息位和校验位的分布情况。
码字位置 B1 B2 B3 B4 B5 B6 B7 校验位 x x x 信息位 x x x x 复合码字 P1 P2 D1 P3 D2 D3 D4 图5 海明码中校验位和信息位的定位校验位的确定 k个校验位是通过对mk位复合码字进行奇偶校验而确定的。
其中P1位负责校验海明码的第1、3、5、7、…P1、D1、D2、D4、…位包括P1自己 P2负责校验海明码的第2、3、6、7、...P2、D1、D3、D4、...位包括P2自己 P3负责校验海明码的第4、5、6、7、 (3)D2、D3、D4、…位包括P3自己对m4k3偶校验的例子只要进行式次偶性测试。
这些测试以A、B、C表示在图6所示各位的位置上进行。
奇偶条件码字位置 1 2 3 4 5 6 7 A B C x x x x x x x x x x x x 图6 奇偶校验位置因此可得到三个校验方程及确定校验位的三个公式 AB1⊕B3⊕B5⊕B70 得P1D1⊕D2⊕D4 BB2⊕B3⊕B6⊕B70 得P2D1⊕D3⊕D4 CB4⊕B5⊕B6⊕B70 得P3D2⊕D3⊕D4 若四位信息码为1001利用这三个公式可求得三个校验位P1、P2、P3值。
和海明码如图7则表示了信息码为1001时的海明码编码的全部情况。
而图8中则列出了全部16种信息D1D2D3D400001111的海明码。
码字位置 B1 B2 B3 B4 B5 B6 B7 码位类型 P1 P2 D1 P3 D2 D3 D4 信息码 - - 1 - 0 0 1 校验位 0 0 - 1 - - - 编码后的海明码 0 0 1 1 0 0 1 图7 四位信息码的海明编码 P1 P2 D1 P3 D2 D3 D4 0 0 0 0 00 0 1 1 0 1 0 0 1 0 1 0 1 0 1 0 1 0 0 0 0 1 1 1 0 0 11 0 0 0 1 0 0 1 0 1 1 1 0 0 1 1 0 0 0 0 1 1 1 1 1 1 10 0 0 0 0 0 1 1 0 0 1 1 0 1 1 0 1 0 0 1 1 0 0 1 1 0 11 1 1 0 0 1 0 1 0 1 0 1 0 0 1 0 1 1 0 1 1 1 1 1 1 1 图8 未编码信息的海明码上面是发送方的处理在接收方也可根据这三个校验方程对接收到的信息进行同样的奇偶测试 AB1⊕B3⊕B5⊕B70 BB2⊕B3⊕B6⊕B70 CB4⊕B5⊕B5⊕B70。