当前位置:文档之家› 信息编码和其在计算机中的运用

信息编码和其在计算机中的运用

第2章信息编码及在计算机中的表示2.1 信息的数字化编码编码:是用来将信息从一种形式转变为另一种形式的符号系统,通常选用少量最简单的基本符号和一定的组合规则,以表示出大量复杂多样的信息。

信息的数字化编码:是指用“0”或“1”这种量最少、最简单的二进制数码,并选用一定的组合规则,来表示数据、文字、声音、图形和图像等各种复杂的信息。

计算机中采用的是二进制数码,为什么?(重点)2.2 进位计数制及其相互转换2.2.1 进位计数制数制中的三个基本名词术语:数码:用不同的数字符号来表示一种数制的数值,这些数字符号称为“数码”。

基:数制所使用的数码个数称为“基”。

权:某数制各位所具有的值称为“权”。

1.十进制数(Decimal System)数码:0、1、…… 8、9基:10(逢十进一,借一当十)权:以10为底的幂任何一个十进制数DnDn-1…D1D0D-1…,可以表示成按权展开的多项式:Dn×10n+Dn-1×10n-1+…+D1×101+D0×100+D-1×10-1+…+D-m×10-m例如:1234.5的按权展开多项为:1234.5=1×103+2×102+3×101+4×100+5×10-1 ⒉二进制数二进制(Binary System)数码: 0和1基:2权:以2为底的幂任何一个二进制数BnBn-1…B1B0B-1…B-m,可以表示成按权展开的多项式:Bn×2n+Bn-1×2n-1+…+B1×21+B0×20+B-1×2-1+…+B(-m+1)×2-(m-1)+B-m ×2-m例如: 1101.01的按权展开多项为:1101.01=1×23+1×22+0×21+1×20+0×2-1+1×2-2⒊八进制数八进制数(Octave System)数码: 0、1、…… 6、7基: 8权:以8为底的幂八进制数的一般式可以表示为:On×8n+On-1×8n-1+…+O1×81+O0×80+O-1×8-1+…+O(-m+1)×8-(m-1) +O-m×8-m⒊十六进制数十六进制(Hexadecimal System)数码: 0、1、…… 8、9、A(1010)、B(1011)、C(1100)、D(1101)、E(1110)、F(1111)基: 16权:以8为底的幂十六进制数的一般式可以表示为:Hn×16n+Hn-1×16n-1+…+H1×161+H0×160+H-1×16-1+…+H(-m+1)×16-(m-1) +H-m×16-m例: 二进制数1011.0101及其对应的八进制数、十进制数和十六进制数可以表示为:1101.0111(2)=15.34(8)=13.4375(10)=E.7(16)或: (1101.0111)2=(15.34)8=(13.4375)10=(E.7)16或: 1101.0111B=15.34O=13.4375D=E.7H2.2.2 常用进位计数制间的相互转换⒈二进制数、八进制数、十六进制数转换为十进制数各种进位计数制可统一表示为下式:式中:R ─某种进位计数制的基数;i ─位序号;Ki─第i位上的一个数码为0~R-1中的任一个;Ri ─则表示第i位上的权;m,n ─最低位和最高位的位序号。

用上式可将任何一个二进制数、八进制数、十六进制数直接转换为十进制数,•这叫做按权展开法。

例:⑴二进制数转换为十进制数(1011.0101)2=1×23+0×22+1×21+1×20+0×2-1+1×2-2+0×2-3+1×2-4=8+0+2+1+0+1/4+0+1/16=(11.3125)10⑵八进制数转换为十进制数(75.21)8=7×81+5×80+2×8-1+1×8-2=56+5+2/8+1/64 =(45.20238)10⑶十六进制数转换为十进制数(175.FB)16=1×162+7×161+5×160+15×16-1+11×16-2=256+112+5+15/16+11/162=(373.98046875)10⒉十进制数转换为二进制数⑴十进制整数转换为二进制数(连除基数、倒取余)方法:除以2取余法。

即逐次除以2,直至商为0,得出的余数即为二进制数各位的数码。

【例2.1】把一个十进制数156转换为二进制数。

结果:(156)10=(10011100)2⑵十进制纯小数转换为二进制数方法:乘2取整法。

即逐次乘以2,从每次乘积的整数部分得到二进制数各位的数码。

【例2.2】把十进制小数 0.34375转换为二进制小数。

结果:(0.34375)10=(0.01011)2连乘基数、正向取整⒊二进制数与八进制数的转换1.二进制数转换成八进制数方法:将二进制数从小数点开始分别向左(对二进制整数)或向右(对二进制小数) 每三位组成一组,每一组有3位二进制数,转换成八进制数码中的1个数字,连接起来即可。

不足3位的补0。

【例2.3】把二进制数(101100011.011100101)2转换为八进制数。

101 100 011. 011 100 1015 4 3 . 3 4 5即有:(101100011.011100101)2=(543.345)8⒊二进制数与八进制数的转换2.八进制数转换成二进制数方法:将每1位八进制数写成相应二进制3位数,顺序写好即成。

【例2.4】把八进制数(7351.65)8 转换为二进制数。

7 3 5 1 . 6 5111 011 101 001. 110 101即有: (7351.65)8=(111011101001.110101)2⒋二进制数与十六进制数的转换⑴二进制数转换成十六进制数方法:把十六进制数每位的数字与二进制数的4位数相对应。

【例2.5】把二进制数(110100110101)2转换为十六进制数。

1101 0011 0101D 3 5即有: (110100110101)2=(D35)16⒋二进制数与十六进制数的转换⑵十六进制数转换成二进制数方法:将每1位十六进制数写成相应的二进制4位数,顺序写好即成。

例如:E 8 B1110 1000 1011即有:(E8B)16=(111010001011)2对于十进制数转换为八进制数或十六进制数的问题,我们可以先把十进制数转换成二进制数,然后再转换为八进制数或十六进制数。

4种数制之间的转换可参照下表进行2.3 非数值数据的表示2.3.1 字符数据的编码非数值数据又叫符号数据或字符数据,包括字母和符号。

目前世界上用ASCII码(American Standard Code for Information Interchange)来表示。

ASCII码有7位ASCII码和8位ASCII 码两种,7位ASCII码称为标准ASCII码,8位ASCII码称为扩充ASCII码。

2.3.2 汉字编码汉字编码:机内码和机外码机内码:是在计算机内部使用的用二进制代码表示的汉字编码,用于在计算机内部存储、交换、处理加工汉字信息机外码:是不在计算机内使用的汉字编码,主要是指汉字输入码。

此外还有供输出的汉字字型点阵码。

⒈国标码(了解)国标码:指我国1981年公布的“中华人民共和国国家标准信息交换汉字编码”,是一种国家标准编码,代号为“GB2312-80”。

它以94个可显示的ASCII码字符为基集,由两个字节构成。

国标码与ASCII码属同一制式,可以认为国标码是扩展的ASCII码。

国家标准(GB2312-80)汉字字符集示意图国标码用两个字节的16进制数表示,例如“文”的国标码是“4E44H”,“中华人民共和国”的国标码分别是“5650H、3B2AH、484BH、4371H、3932H、3A4DH、397AH”。

⒉汉字机内码(实质:汉字的地址)汉字机内码:在计算机系统内部用来表示汉字的编码。

ASCII码是一种西文机内码,在设计汉字机内码时,应遵循如下原则:⑴汉字机内码的编码不能有二义性,否则和其他编码分不清,例如要能和ASCII码严格区分。

⑵代码的长度尽可能短,所能表示的汉字要尽可能多。

⑶应与国标码有相应的对应关系,以便于对汉字库的处理和对汉字的查找。

汉字机内码与国标码的关系汉字机内码高位字节=国标码高位字节+80H汉字机内码低位字节=国标码低位字节+80H例如:“文”的国标码是“4E44H”,要求它的机内码,只要把“文”字国标码两个字节的16进制数4EH和44H分别加80H,即成该汉字的机内码。

4EH+80H=CEH44H+80H=C4H⒊汉字输入码(机外码)汉字输入码:指直接从键盘输入的各种汉字输入方法的编码,属于外码。

按照编码原理,汉字输入码主要分为三类:数字码(区位码和电报码)、拼音码和字形码。

还有以汉字的音和形相结合的音形码和形音码。

⑴数字码数字码:将待编码的汉字集以一定的规则排序以后,依次逐个赋予相应的数字串作为汉字输入代码。

典型的数字码:区位码和电报码优点:无重码缺点:代码难以记忆。

区位码与国标码、机内码的对应关系为:用十进制数输入的区码和位码先分别转换为十六进制数(各一个字节),再分别加上20H,就成了国标码;再在两个字节分别加上80H,就成为机内码。

例如,“文”字的区位码为4636,区码和位码分别用十六进制表示即为“2E24H”,转换成国标码就是“4E44H”,它的机内码为“CEC4H”。

⑵拼音码:汉语拼音方案为基础的输入方法最大优点:简单易学,只要会汉语拼音,就能输入汉字,并且输入时不影响思考,适合于业务人员和专业技术人员使用。

全拼输入法—双拼输入法—增加联想功能—以词为单位的智能拼音输入法⑶字形码:以汉字的形状确定的编码最大特点:能广泛地为国内外不同地区使用汉字方言较重的人们服务缺点:编码规则较复杂。

典型:五笔字型输入法⑷其它输入方法:音形码和形音码⒋汉字字型码——汉字点阵字模库(重点)汉字信息存储在计算机内有两种编码:一种是汉字机内码,另一种是字型点阵码。

点阵字型方式:是把汉字像图形一样置于网状方格上,每格是存储器中的1个位(bit),16×16点阵是在纵向16点、横向16点的网状方格上描绘一个汉字,有笔划的格对应1,无笔划的格对应0。

相关主题