《计算机硬件》PPT课件
汉字字模和汉字字库
汉字字模和汉字字库
– 字形存储码
• 也称汉字字形码,是指存放在字库中的汉字字形点阵码。不同的 字体和表达能力有不同的字库,如黑体、仿宋体、楷体等是不同 的字体,点阵的点数越多时一个字的表达质量也越高,
• 一个24×24点阵汉字需要的存储空间24×24/8=72字节 • 只有在中文操作系统环境下才能处理汉字,操作系统中有实现各
处理的二进制数字串叫做一个字或单元,每个字中二 进制位数的长度,称为字长。一个字由若干个字节组 成,不同的计算机系统的字长是不同的,常见的有8位、 16位、32位、64位等,字长越长,存放数的范围越大, 精度越高。
2.1.3 计算机中字符的表示
在计算机中以二进制代码的形式来表示每一个字符 ASCII 码 美国标准信息交换码
种汉字代码间转换的模块,在不同场合下调用不同的转换模块工 作。
– 汉字字库
• 一个汉字的点阵字形信息叫做该字的字形。字形也称字模(沿用 铅字印刷中的名词)
– 汉字字库容量的大小
• 一个具有8192个汉字的24×24点阵汉字需要的存储空间 24×24/8×8192=576KB字节
– 矢量字库
• 矢量字库保存的是对每一个汉字的描述信息,比如一个笔划的起 始、终止坐标,半径、弧度等等。
– 每个符号由7位二进制数表示,共可定义128种符号, 常用一个 字节(8位)表示。
基本ASCII码: 最高位为0 扩展ASCII码: 最高位为1 (汉字内码) – 学会查找ASCII码,了解字母、数字在ASCII码表中 的规律 汉字输入码
– 汉字输人码,又称“外部码”,简称“外码”,指用户从键 盘上输入代表汉字的编码。它由拉丁字母(如汉语拼音)、 数字或特殊符号(如王码五笔字型的笔画部件)构成,千变 万化。各种输入方案,就是以不同的符号系统来代表汉字进 行输入的,所以,输入码是不统一的,区位码、五笔字型码、 仓颉码、拼音码、智能ABC、微软拼音等都是其中的代表。
第2章 计算机硬件
佛山科学技术学院信息中心 2008年9月
主要内容
2.1 信息的表示及存储 2.2 计算机的体系结构 2.3 内存储器 2.4 中央处理器(微处理器) 2.5 存储设备 2ቤተ መጻሕፍቲ ባይዱ6 输入和输出设备 2.7微型计算机的引导过程
2.1 信息的表示及存储
2.1.1数制与数制转换
求积:0*0=0; 0*1=1*0=0;1*1=1 逻辑性: 0代表“假”;1代表“真”
数制转换
不同数制的相互转换 基本原则:把整数与小数部分分别进行转换,然后再 组合。 1. 二进制数、八进制数、十六进制数与十进制数之间 的转换
二、八、十六进制数转换成十进制数 十进制数 转换成二、八、十六进制数 十进制小数的转换
位(Bit):每一个能代表0和1的电子线路称为一个二 进制位,是数据的最小单位。
字节(Byte):简写为B,通常每8个二进制位组成一 个字节。字节的容量一般用KB、MB、GB、TB来表示, 它们之间的换算关系如下:
1KB = 1024B 1MB = 1024KB 1GB = 1024MB 1TB = 1024GB 字(Word):在计算机中作为一个整体被存取、传送、
汉字机内码
汉字机内码
– 汉字机内码又称“汉字ASCII码”、“机内码”,简称“内 码”,由扩充ASCII码组成,指计算机内部存储、处理加工和 传输汉字时所用的由0和1符号组成的代码。输入码被接受后 就由汉字操作系统的“输入码转换模块”转换为机内码,与 所采用的键盘输入法(汉字输入码)无关。
我国目前使用的是单/双/四字节混合编码
进位计数制
十进制数:由0~9十个数字组成,基数是10,逢十进一 二进制数:由0和1两个数字组成,基数是2,逢二进一 八进制数:由0~7八个数字组成,基数是八,逢八进一 十六进制数:由0~9以及A、B、C、D、E、F十六个数字 组成,基数是16,逢十六进一。 计算机中使用二进制的原因: 可行性 可靠性 简易性:求和:0+0=0;0+1=1+0=1;1+1=10
2. 二进制、八进制和十六进制数之间的转换
基本方法:掌握十进制数0~15所对应的 二进制、八进制和十 六进制数
每3位二进制数对应1位八进制数 每4位二进制数对应1位十六进制数
二进制数、八进制数和十六进制数之间的对应关系
二进制数 0000 0001 0010 0011 0100 0101 0110 0111 1000 1001 1010 1011 1100 1101 1110 1111 10000
八进制数 00 01 02 03 04 05 06 07 10 11 12 13 14 15 16 17 20
十六进制数 0 1 2 3 4 5 6 7 8 9 A B C D E F 10
十进制数 0 1 2 3 4 5 6 7 8 9
10 11 12 13 14 15 16
2.1.2 数据存储的组织形式
– 英文与阿拉伯数字等采用一个字节编码; – 国家标准GB2312—80《信息交换用汉字编码字符集·基本集》
中的6763个汉字和中文标点符号的二进制编码采用2个字节 (每个字节的最高位置0)对应一个汉字编码,称为“国标 码”,而把每个字节的最高位都置1,作为对应的汉字的机内 码(也称汉字的ASCII码或变形的国标码); – 《信息交换用汉字编码字符集·基本集的扩充部分》中的汉字, 采用4个字节来表示(32位二进制码)。
– 整数可以分为无符号整数和有符号整数两类。 – 不带符号的整数(unsigned integer)一定是正整数,其取值范
围根据二进制位数的不同而不同,8位:0~255(28-1),最 小值是0000 0000(全0),最大值是1111 1111(全1)。 – 带符号的整数(signed integer),既可表示正整数,又可表示 负整数。使用最高位(最左面的一位)作为符号位,“0”表示 “+”(正数),“1”表示“-”(负数),其余各位表示数 的绝对值,取值范围:8位:-127~+127(-27+1~+27-1)
点阵汉字
2.1.4 计算机中整数和实数的表示
实际使用的二进制数可分为二进制整数和二进制实数 两种,在计算机内部,分别用定点数和浮点数表示二 进制整数和二进制实数
整数(定点数)的表示
– 定点数是指小数点的位置固定不变。在计算机中,通常用定 点数表示二进制整数,因此定点数的小数点位置通常固定在 数值的最后。