当前位置：文档之家› 第1章图灵机模型及数据编码

第1章图灵机模型及数据编码

二进制：B（Binary），如 (11101)B；八进制：O（Octal），如 (35)O；十进制：D（Decimal），如 (29)D；十六进制：H（Hexadecimal），如 (1D)H；
二进制与其他数制的转换（1）
二进制与十进制的转换
十进制转换成二进制：将整数部分和小数部分分别转换，然后再拼接起来
1.2 位的存储
如果用0-1作为编码的基本元素的话，那么存储的最小单位为1位（bit），要么是0要么是1。可见只要存储装置有两种不同的稳定状态就能可以表示和存储这两个元素，其中一个状态表示1，则另一种状态就表示0
逻辑运算
门
可以设计出进行逻辑运算的装置，比如用继电器或者齿轮等，把这种能完成逻辑运算的装置称为门（Gate）。现代电子计算机中的门是用电子线路实现的，其中1和0分别用电平的高和低来表示。
二进制与八进制的转换类似
数值的表示（1）
机器数
把在机器内存放的正负号数码化的数称为机器数，把机器外部由正负表示的数称为真值数
若一个数占8位，真值数（－0101100）B 的机器数为10101100
数值的表示（2）
整数和实数
整数
数值的表示（3）
整数和实数
实数
N d 2 p
（4）从根节点P4开始到对应于每个符号的树叶，左分支标上“0”，右分支标上“1”；
（5）从根节点P4开始顺着树枝到每个叶子分别写出每个符号的代码
无损压缩（3）
霍夫曼编码
无损压缩（4）
LZW算法
LZW算法是一种词典编码法，其根据是待编码的数据中总包含有重复代码即词
LZW算法先编制一个基本词典，该词典由待压缩数据当中出现过的每个字符构成，然后，在不断编码的待压缩数据的过程中不断扩充，词典中的每个词都有一个编号即码
0 0 0 0 0 0 0 0 1 1 1 1 1 1 7 7 7……7 7 1 1 1……1 1 1 （8个0）（6个1）（30个7）（50个1） 0 0 0……0 0 8 8 8 8 （30个0）（4个8）可以编码为：
8A0A6A1A30A7A50A1A30A0A4A8
无损压缩（2）
触发器
其他存储技术
磁芯电容磁介质有机玻璃或聚酯树酯等材料制作的介质
1.3 存储器
1 Byte ＝ 8 Bit 1 KB（kilobyte）＝ 1024 Byte 1 MB（megabyte）＝ 1024 KB 1 GB（gigabyte）＝ 1024 MB 1 TB（terabyte）＝ 1024 GB
EBCDIC码，即Extended Binary Coded Decimal Interchange Code（扩展的二-十进制交换码），主要用在大型机器中，采用8位二进制编码，有256个编码状态，但只选用其中一部分
存放和使用数据的软件会以其他方式保存有关类型的信息，指明这个数据是何类型，不致引起混淆
声道数
1.5 数据压缩
在保留原数据表达的信息不变或者在稍有变动但不致于影响使用的同时尽量减少表达这些信息的数据量就是数据压缩
数据压缩有利于节省存储空间，而且可有效提高数据传输效率
无损压缩（熵编码）有损压缩
无损压缩（1）
行程编码法(Run-length Encoding,RLE)
字符的表示（2）
汉字编码
用户用输入码输入汉字，输入码比较容易学习和记忆；系统由输入码找到相应的内码，内码是计算机内部对汉字的表示；要在显示器上显示或在打印机上打印出用户所输入的汉字，需要汉字的字形码，系统由内码找到相应的字形码
字符的表示（3）
汉字编码
汉字国标码
全称是GB2312－80《信息交换用汉字编码字符集——基本集》，1980年发布，是中文信息处理的国家标准，也称汉字交换码，简称GB码。根据统计，把最常用的 6763个汉字分成两级：一级汉字有3755个，按汉语拼音排列；二级汉字有3008个，按偏旁部首排列。为了编码，将汉字分成若干个区，每个区中94个汉字。由区号和位号（区中的位置）构成了区位码。例如，“中”位于第54区48位，区位码为5448。区号和位号各加32就构成了国标码，这是为了与ASCII码兼容，每个字节值大于32（0～32为非图形字符码值）。所以，“中”的国标码为8650。
补码：
对于正数与原码相同；对于负数，数符位为1，其数值部分为绝对值取反最右加1，即为反码加1
可方便地实现正负数的加法运算，符号位如同数值一样参加运算，也允许产生最高位的进位
字符的表示（1）
西文字符
最常用的是ASCII字符编码，即American Standard Code for Information Interchange (美国信息交换标准代码)，用7位二进制编码，它可以表示27 即 128个字符
第1章图灵机模型及数据编码
图灵机模型理论是计算学科最核心的理论之一
图灵机模型为计算机设计指明了方向图灵机模型是算法分析和程序语言设计
的基础理论。
本章主要内容
1.1 图灵机 1.2 位的存储 1.3 存储器 1.4 数据在计算机中的表示 1.5 数据压缩 1.6 数据传输误码及对策
字符的表示（5）
汉字编码
汉字的输入编码
目的：进行汉字的输入要求：编码要尽可能的短，重码要尽量少，容
易学容易上手最常用的输入码：五笔字型、智能拼音等。
字符的表示（6）
汉字编码
汉字字形码
点阵方式矢量方式
图形和图象的表示（1）
基本概念
图形
一般是指通过绘图软件绘制的由直线、圆、圆弧、任意曲线等组成的画面，即图形是由计算机产生的，且以矢量形式存储；
图灵机的直观描述
3个部件：有穷控制器、无穷带和读写头 3个动作：改写当前格、左移或右移一格
存储带
读写头
……
……
有穷控制器图灵机模型
图灵机的形式化描述
图灵机是一个五元组（K，∑，δ，s，H），其中：
K 是有穷个状态的集合； ∑ 是字母表，即符号的集合； s ∈K是初始状态； H∈K 是停机状态的集合，当控制器内部状态
计算“x+1”的图灵机
规则集合δ：
“5＋1”的计算过程（1）
“5＋1”的计算过程（2）
“5＋1”的计算过程（3）
“5＋1”的计算过程（4）
通用图灵机（1）
编码方案：
通用图灵机（2）
通用图灵机蕴含的计算思想
“x+1”图灵机功能是固定的，相当于一个程序
通用的图灵机功能根据输入编码的不同而变化
字符的表示（4）
汉字编码
汉字机内码
一个国标码占两个字节，每个字节最高位仍为 “0”；英文字符的机内码是7位ASCII码，最高位也是“0”。因为西文字符和汉字都是字符，为了在计算机内部能够区分是汉字编码还是ASCII码，将国标码的每个字节的最高位由 “0”变为“1”，变换后的国标码称为汉字机内码。由此可知汉字机内码的每个字节都大于 128，而每个西文字符的ASCII码值均小于128。
图形和图象的表示（3）
一副图像可认为是由若干行和若干列的像素（Pixels）点组成的阵列，每个像素点用若干个二进制进行编码，表示图像的颜色，这就是图像的数字化。
图像分辨率
颜色深度
即每一个像素点表示颜色的二进制位数
音频数据的表示
采样频率
采样频率即每秒钟的采样次数。
采样点精度
即存放每一个采样点振幅值的二进制位数
以离散余弦变换（Discrete Cosine Transform， DCT）为基础的有损压缩算法，
采用以预测技术为基础的无损压缩算法以离散小波变换（Discrete Wavelet Transform，
DWT）为基础的有损压缩算法（JPEG2000）
有损压缩（3）
MPEG：1988年由ISO和IEC成立的联合专家组，负责开发电视图像数据和声音数据的编码、解码和它们的同步等标准
经有损压缩的数据，进行数据重构，重构后的数据与原始数据有所不同，但不影响人对原始数据表达的信息的理解
JPEG：Joint Photographic Experts Group MPEG：Moving Picture Experts Group
有损压缩（2）
JPEG：由国际标准化组织（ISO）和国际电工技术委员会（International Electrotechnical Commission）联合组成的一个专家组，负责制订静态的数字图像数据压缩标准
霍夫曼编码
（1）根据符号出现的概率大小按由小到大的次序排序；
（2）把概率最小的两个符号组成一个节点P1；
（3）重复步骤（2），依次得到节点P2，P3，P4，构成了如图1.17所示的一棵倒立的“树”；其中， P4为树根，称为根节点；P1、P2、P3为树枝，称为枝节点；A、B、C、D和E为树叶；
整数部分，采用除2取余法；小数部分，采用乘2取整法。
二进制转换为十进制：直接按权展开即可
小数点后的权分别为2的-1、-2、-3、……次幂
二进制与其他数制的转换（2）
十进制转换成二进制：
二进制与其他数制的转换（3）
二进制转换为十进制：
二进制与其他数制的转换（4）
二进制与十六进制的转换
图像
是由扫描仪、数字照相机、摄像机等输入的画面，即图像是由真实的场景或现实存在的图片输入计算机产生的，图像以位图形式存储。
图形和图象的表示（2）
基本概念
动画
每一副画面通过一些工具软件对图像素材进行编辑制作而成；动画是用人工合成的方法对真实世界的一种模拟
视频
对视频信号源（如电视机、摄像机等）经过采样和数字化后保存；而视频影像则是对真实世界的记录

e商务文档

第1章图灵机模型及数据编码

相关文档推荐：

e商务文档

第1章 图灵机模型及数据编码

相关文档推荐：

第1章图灵机模型及数据编码