关于信息数字化
数字化就是将许多复杂多变的信息转变为可以度量的数字、数据,再以这些数字、数据建立起适当的数字化模型,把它们转变为一系列二进制代码,引入计算机内部,进行统一处理,这就是数字化的基本过程。
也就是说,数字化将任何连续变化的输入如图画的线条或声音信号转化为一串分离的单元,在计算机中用0和1表示。
通常用模数转换器执行这个转换。
以前学二进制就是粗略的了解,现在懂了许多。
觉得挺有意思的。
计算机是处理0、1的工具,它采用二进制,原因有四:
可行性:电子元件易实现;
可靠性:状态稳定;
简易性:算法简单;
逻辑性:可用进制的0,1直接代表逻辑代数中的“假”和“真”。
我们大致可以将这些非数字化资料归纳成文本、图像、声音和视频等几类,它们要经过数字化的过程才能由计算机处理。
因为计算机是用二进制编码方式工作的、它无法直接理解人们日常接触到的信息,所以计算机需要采用数字化编码的形式对信息进行存储、加工、传送。
二进制表示数据表现:
只有0和1两个数码、逢二进一。
十进制与二进制的转换:
十进制转换为二进制的法则是:除以2反序取余法(以前记不住它的顺序,现在通过老师的授课记住了,象棋中,大将在后面。
);
二进制转换为十进制的法则是:乘权求和法。
信息的数字化过程:
信息的数字化过程:就是利用仪器设备把非数字化资料采集为声光电等物理信号(模拟信号),再经过采样量化和数字编码,转换成用二进制数字表示的数字信息,最后进入计算机存储保存。
采样:是以相等的间隔来测量模拟信号的物理量,完成对连续模拟信号的离散化提取。
量化:是将采样值变换到最接近的数字值,即用有限个数的数值近似表达原来连续变化的值。
编码:是把量化后的值用一组二进制数字代码表示。
数字化信息的特点:易于表示与存储、易于处理和检索、易于传播
和集成、易于获取与共享等。
文字信息的数字化:
1. 字符编码:
ASCII是“美国信息交换标准码”的英文缩写,用来制订计算机中每个符号对应的代码,这也叫做计算机的内码(code)。
8位(占一个字节)二进制数组成的扩展的ASCII,共有2^8=256个字符。
2.汉字的编码:
汉字字符的编码技术相对复杂。
具体有GB2312汉字编码标准(信息交换用汉字编码字符集),简称国标码。
3. OCR技术:
OCR(Optical Character Recongition),叫做光学字符识别技术,它要求首先把要输入的文稿通过扫描仪转化为图形才能识别,一般最好是印刷体的文字。
图像的信息数字化:
图像的信息数字化表示是将图像上每个点的颜色信息按某种规律编成一系列二进制编码,即用0和1表示图像信息的过程就是图像数字化。
主要有两个参数:采样频率:即采样点之间的间隔大小,采样频率越高,获取的样本就细腻逼真,图像的质量越高;图像样本的量化等级:是指图像样本量化后每个采样点用多少位二进制数表示,它反映了采样的质量。
声音的信息表示:对于声波,通用是根据声波在指定点位于0线之上或之下的量,用一个二进制数记录。
视频的信息表示:视频是由一连串相关的静止图象组成,我们将一幅图象称为一个帧。
通过这几天的《计算机导论课》了解了不少,今天查了些资料更加理解了信息数字化到底是怎么回事,我想在以后的专业课学习中会更加用心学习这些有意思的转换。