当前位置：文档之家› 计算机中的信息表示

计算机中的信息表示

1. 进位计数制1. 常见的进位计数制Bi nary 二进制 O ctonary 八进制 D ecimalism 十进制 H exadecimal 十六进制进位计数制：利用固定的数字符号和统一的规则来计数的方法。

有3个基本要素：基数->进位规则->R 位权->2. 1.多项式展开直接求和 2.十进制转换成二进制整数部分：除基到零，反向写余小数部分：乘基到精，正向写整 3. 二进制转成八、十六进制小数点为界，向两边分组。

八进制3个一组，十六进制4个一组，不足添0。

各组二进制转成十进制再转成八（十六）进制即可。

2.计算机中的数据1.二进制与计算机位（bit）：计算机中最基本的单位，一个二进制数字0/1。

字节（Byte）：8个位。

字：字节的集合。

字长：一个字中二进制的位数。

字长是计算机一次能同时进行运算的二进制位数。

现在一般为32bit、64bit。

一般来说，n位的二进制数字能够表示种状态。

2.模拟数据和数字数据模拟数据：一种连续表示法，模拟它表示的真实信息。

数字数据：一种离散表示法，把信息分割成了独立的元素。

阈值：大于阈值的电压看成高电压，小于阈值的电压看成低电压。

计算机不能处理模拟数据，要对模拟数据进行数字化。

3.数据及其分类数值、文本、音频、视频、图像、图形。

4.数值型数据的表示机器数：一个数在计算机中的表示形式。

机器数有位数限制，多余的位数将被截断，少的位数将被填充。

（机器数的）真值：带有正负号的数。

1. 数值型数据的分类根据是否带小数点分为实数和整数。

按照是否带有符号，整数分为带符号和无符号。

对于带符号的整数要对符号进行编码。

数值数据可以用原码和补码表示。

为了表示实数中的小数点的位置，可以表示为定点数或浮点数。

2. 整数的表示无符号整数表示：转成二进制数，对不足机器字长的在前面补0。

最小值全是0，最大值全是1。

带符号整数表示：0表示正，1表示负。

符号位占用一位二进制数位。

原码符号位补码：正数同原码，负数补码除符号位外其他位取反，末尾位加1。

+、-0的补码一致。

3. 实数的表示定点数的表示：定点数就是在运算过程中小数点的位置固定不变。

小数点位置不一定是明确指定的。

由于小数点位置固定，计算时可以直接进行加减运算。

浮点数的表示：任何一个数都可以用科学计数法来表示，这种表示方法称为浮点表示法。

浮点数的一般表示形式：IEEE 754规定单精度浮点数（32b ）双精度浮点数（64b ）。

对于二进制实数，现将其写成尾数是定点小数的科学计数法的形式。

再将其尾数扩充为23位，阶码扩充为8位，再把尾数转换成补码形式。

假想的小数点数值位==单精度（32b ）4. 溢出计算机中n 位有符号数的表示范围（12~2-11---n n ）。

超出范围会产生溢出。

5. 文本表示一个文本是由一系列字符构成的。

要处理一个文本，必须表示和存储每个可能出现的字符。

内码：字符在计算机中存储和处理时的编码。

1. 文本类型1. 简单文本：仅由一串字符代码组成，没有字体字号的变化和其他媒体。

文件扩展名为txt 。

2. 丰富格式文本：允许在文档中设置格式（字体、颜色、页边距、自选图形、公式等）的文本。

3. 超文本（HTML 文本）：有声音、视频等多媒体信息，还有链接。

不管是哪种类型，核心问题是要表示字符本身，格式符号需要单独表示。

最早也是最常用的方法是列出所有字符，给每个字符编一个二进制位串。

要表示的符号数决定了需要多少二进制位数来表示。

西文字符——>ASCII 码汉字字符——>GB 2312-1980 全世界所有字符——>Unicode 码2. 文本内码1. ASCII 码美国标准信息互换标准代码。

最初，ASCII 字符集中每个字符由7个二进制位表示，总共有128个不同字符。

用一个字节存储，第8位用作校验位。

ASCII 码表中特殊的33个字符（0~31和127）是不可显示和打印的控制码。

比如CR （回车）。

2. Unicode 编码表示世界上使用的所有语言的所有字符。

Unicode 使用16位表示每个字符，能够表示162个字符。

Unicode 字符集是ASCII 字符集的超集。

Unicode 常用的两种编码方案如下：1）UTF-8单字节可变长编码：每个字符占1~4个字节。

有单、双、三、四字节。

2）UTF-16双字节可变长编码：每个字符占2或4个字节。

3. 汉字编码汉字内码是计算机内部使用的用二进制表示的汉字编码。

i)区位码94x94个ASCII 字符为基础构成二维平面，行为区，列为位。

每一个汉字/字符都对应唯一一个区（左）位（右）号。

每个汉字用2个字节表示。

ii)汉字内码GB2312标准ASCII 码用1个字节表示，最高位为0。

汉字内码用2个字节来表示，每个字节最高位是1。

为了与ASCII码的可打印字符位置一致，在区号和位号上分别加上20H（32），称为国标码。

区位码转换成机内码的方法是：将十进制的区码和位码转成十六进制的，将他们分别加上20H得到国际码。

再在高低字节上加上80H。

Ex:中国OK! 占2+2+1+1+1=7个字节iii)汉字内码GBK标准编码1995年汉字内码扩充标准。

要求双字节最高位为1。

iv)汉字内码GB18030汉字编码标准国家发布过GB 18030-2000和GB 18030-2005，现已强制贯彻执行。

4.文本输入1．键盘输入2．联机手写输入3．语音输入4．印刷体识别5.文本输出1.字符点阵描述每个字符按照图形符号设计成点阵图，用一位二进制对应屏幕上的一个点，亮为1暗为0，就得到相应的点阵代码（字形码）。

2.字符轮廓描述以字符轮廓的转折点为特征来描述字符，又称矢量字体。

用一组直线和曲线命令以及一些参数来描述字体的轮廓。

3.字库把所有可显示和打印的ASCII字符和汉字的字形信息放在一个文件中，称为字形库。

C：\windows\fonts4.文本压缩数据压缩：又称数据编码。

是为了在存储和传输数据时减小数据所占空间大小的方法。

分为有损/无损。

压缩率：原始数据大小/压缩后大小。

1.关键字编码：用单个字符代替常用单词。

2.行程长度编码：又称迭代编码。

将重复的字符序列替换为标志字符。

后面加重复字符和说明重复次数的数字。

Ex：*A7 就是AAAAAAA。

3.赫夫曼编码用不同长度的二进制位串表示不同字符。

把较少的位串表示经常出现的字符，而较长的位串表示不常出现的字符。

郝夫曼编码的重要特征：用于表示一个字符的位串是表示另一个字符的位串的前缀。

从左到右扫描一个位串事，每当发现一个位串对应一个字符时，他就一定缀。

5.图像和图形的表示1.颜色表示三基色原理：人眼可以觉察到得颜色都能由红、绿、蓝三种颜色按照不同的比例混合而成。

计算机中颜色表示：用RGB指表示。

RGB是3个数（0~255），表示每种颜色占的比例。

对颜色编码：把一种颜色分解为RGB值的过程。

颜色深度：用于表示颜色的数据量。

通常用表示颜色的位数来表示。

现在用24位的真彩色表示（3x8），即RGB值中的每个数字由8位表示，范围是0~255。

能表示1670万种颜色。

2.图像数字化数字化图像：将图像按照行和列的方式均匀地划分为若干个小格子（像素）。

分辨率：水平像素点x垂直像素点。

图像：像素点的集合。

存储一幅图像就是要存储图像上每个像素点的信息。

图像的编码：每个像素呈现一种颜色（灰度层次），对每个像素进行RGB编码，再把所有行列的像素编码连接起来。

图像的获取：是模拟信号数字化的过程。

扫描、分色、取样、量化、编码。

3.数字图像的表示根据图像中每个像素点的信息位数，可将图像分为彩色图像、灰度图像和黑白图像。

1.彩色图像：由RGB 3个彩色分量组成，需要用3个矩阵分别表示每个彩色分量的亮度值。

2.灰度图像：每个像素只有1个灰度分量。

通常8位表示，代表256个灰度。

人眼能识别的灰度大概是100个。

3.黑白图像：每个像素只有1个黑色分量。

只用一个二进制位表示。

取值只有0（黑）1（白）。

二值化：把图像转换成黑白图像的操作。

二值化选定一个阈值，高于它为黑，反之为白。

4.图像的存储和压缩图像数字化后的大小= 水平分辨率x垂直分辨率x颜色深度/81024 x 1024 x 24 / 8 = 3.75MB图像压缩：提高在网络上传输的速度。

流行的图像压缩都遵循静态图像压缩国际标准JPEG。

流行的逐个像素存储图像方法有位图（BMP）、GIF、PNG、JPEG、TIFF、PSD，他们都采用了不同方式的压缩方式。

5.图形的表示图形：由点、线、面体等集合元素和灰度、色彩、线型、线宽等非几何属性组成。

分为平面图形和三维图形。

矢量图形：计算机图形一般用矢量图形格式来描述。

它不适用于描述真实世界的图像，是用于艺术线条和卡通绘画。

图像效果差，但是放大不失真。

常见格式：3DS\DXF\WMF\FLASH\SVG。

6.音频信息表示1.声音数字化采样：周期性测量模拟信号的电压，记录合适的数值。

将模拟信号数字化。

量化：把采样的结果用有限个数字表示出来。

量化精度：量化的二进制数值的位数。

每秒声音的数据量可以用声音的码率来表示（每秒二进制位b/s）声音码率=采样频率x量化精度x声道数声音数据量=声音的码率x时间/8编码：声音经过量化后数据量比较大，需要进行数据压缩，以减小数据量。

失真：采样频率低于每秒40000次，不足以复原原始声音，人耳听到就会失真。

2.音频格式WAV、AU、AIFF、VQF、MP3、MID。

视频表示视频是一系列压缩的静态图像组成的，每一幅镜头图像成为帧。

常用的两种压缩方式：时间压缩和空间压缩。

常见格式：rm、rmvb、wmv、asf、mpeg、dat、avi。

e商务文档

计算机中的信息表示

相关文档推荐：