当前位置:
文档之家› 信息编码(ASSCII码表)
信息编码(ASSCII码表)
基本ASCII码又可分为3大块: 0~31(00H~1FH)为控制代码; 32~126(20H~7EH)为可显示字符代码; 127(7FH)为报警符。
控制码在计算机中不作为字符来显示,而是 作为某一特定动作的功能代码。例如,代码7 的功能是使主机中的扬声器鸣声,代码10 (20H)是空格字符,65(41H)是字符 “A”,97(61H)是字符“a”。完整的基本ASCII 码表如下表所示:
1.1.7.2字形编码
计算机显示的字符是从ASCII码转化为字符点阵 来实现的。常用的字符输出有两种手段:屏幕显示 和打印输出。例如,如果要输出字符H,则不应输 出其编码72或对应的二进制数、十六进制数,而 应输出字形H。这种用于输出的、表示字符字形的 数据,称为字形编码。屏幕显示时,字形编码为1 的点则亮,为0的点则不亮;打印机输出时,计算 机控制打印机的打印针,有的打下去,有的不打, 便打出所需的符号和文字。
1、基本ASCII码 在ASCII码中,二进制最高位为0的编码为基本ASCII码,其
编码范围是十进制数0~127(即0000 0000B~01111111B或 00H~7FH),即基本ASCII码有128组编码。可见,基本ASCII码 只需要7位二进制进行编码就可以了,所以又称为7位字符编码。 在实际存储时,由于存储器是按字节作为最小单位来组织的,7 位编码仍然需要占用1个字节的存储空间,必须在编码前补一个 二进制数0,使者成为一个字节。
因而,计算机内部总是存储字符编码,而不存储字
形编码,只在输出时根据字符编码(如ASCII码),在字形 编码库中取出相应的字形码,送到输出设备(屏幕或打印 机)去输出。
1.1.7.3 内码和外码
内码是指电子计算机内部进行存贮、传递和运算所使 用的数字代码。例如,字符“A”的内码是65(41H),外 码是指电子计算机与人进行交换的字形代码,例如,字符 “B”的外码是它的字形编码。
字符编码的长度(字节数)依赖于编码的方法。对于点阵字 符,编码长度是点数除以8。例如,西文字符的点阵可以用5行7 列的二进制位组成,即5X7点阵,如下图所示:
字符I、B、H的5X7点阵图
每个字符由35个点来构成,因而需要35/8≈5个字节;汉 字至少要用16X16点阵(显示),即至少需要32字节。,
信息编码
• 信息是无形的,需要载体来表示。 • 计算机内部运行的符号系统是二进
制码 • 把各种形态的信息转化成二进制形
式的过程就是信息的编码,反之, 就是解码。
手指游戏(凑数法)
• 从小手指开始,在每个手指上分别标注1, 2,4,8,16,然后通过伸手指来表示以下 数值。
• 7 15 23 31 19 11 30
字符编码
一、ASCII码
ASCII码(American Standard Code for Information Interchange)中文名称是“美国信息 交换国家标准代码”,已被国际标准化组织认定为 国际标准。计算机中的英文字符、各种符号都是使 用ASCII码。
ASCII码是一种1字节编码。1个字节编码的范围 是0000 0000B~1111 1111B(十进制数范围为 0~255,十六进制数范围为00H~FFH,B代表二进 制,H代表十六进制),这样ASCII码最多可表示 256个不同的字符。具有256组编码的ASCII码又被 分为两大部分:基本ASCII码和扩充ASCII码。
3、文本文件和非文本文件
只含有基本ASCII码中可显示字符码的文件称为文本文件或 正文文件,它是可以通过操作系统内部命令直接在屏幕上显示 的文件。文本编辑器(如DOS中的EDIT、Windows的“记事 本”)生成的文件都是文本文件,各种计算机语言源程序也是 文本文件。而字处理软件(如WPS、Word2000、Word2003、 Word2007、Word2010、方正排版系统等)生成的文件不是文 本文件,因为这些文件中不但含有文本,还含有很多格式信息 (如字型、字号、行间距、行宽等)。中文文件也不是文本文 件,因为中文文件中的中文字符不是基本ASCII码。凡是含有不 可显示字符或非基本ASCII码字符的文件,统称为非文本文件, 或称为二进制文件。
ASCII字符编码表
2、扩充ASCII码
从上表中可以看出, ASCII码的最大编码值为127(对应的二 进制数为1111 1111B),最小的可显示字符编码为32。因此基本 ASCII码未用到字节的最高位(第8位),可理解为最高位为0。 如果最高位为1,则属于扩充ASCII码。
扩充ASCII码的二进制最高位是1,其范围为128~255。扩充 ASCII码也是128个,虽然这些代码也有国际标准,但它们是可 变字符。各国都利用扩充ASCII码来定义自己国家的文字代码。 例如,日本把其定义为片假名字符,我国则将其定义为中文文字 的代码。韩国、朝鲜、越南、德国、法国、俄罗斯等其它国各有 其定义。
• 9 13 16 20 27 25 10
计算机的存储
• 位bit:存储信息的最小单位 binary digit • 字节Byte(简称B):存储信息的基本单位 • 1Byte=8bit • 1KB=210B=1024B • 1MB=210KB=1024KB • 1GB=210MB=1024MB • 1TB=210GB=1024GB
非文本文件又有文档文件(如汉字文件)、可执行程序 (如在DOS系统中扩展名为EXE、COM的可执行文件)等, 不能以一般的方式在屏幕上显示其内容,因为文件中的不 可显示字符被视为控制代码,可能会使屏幕显示出错(出 现乱码),有时会扰乱系统的显示功能。如果是文档文件, 应该用相应的字处理软件进行显示或处理。一般来说,一 个字处理软件生成的文档,只能在该字处理软体中才能正 确地显示,除非字处理软件具有识别或转换其它字处理软 件生成的文档的能力,如 Word97/2000/2003/XP/2007/2010就能显示和处理其它常 用字处理软件生成的文档。