数据采集与编码
举例:
B574H= 11×163+5×162+7×161+4×160
表1.3.2
十进制、十六进制、二进制之间的关系
十进制
十六进制
二进制
0
0
0
1
1
1
2
2
10
3
3
11
4
4
100
5
5
101
6
6
110
7
7
111
8
8
1000
9
9
1001
10
A
1010
11
B
1011
12
C
1100
13
D
1101
14
E
(1)ASCII码 ASCII码(美国信息交换标准代码)是一套基于拉丁字母的
计算机编码系统,主要用于显示现代英语和其他西欧语言。 基本的ASCII码共有128个,用1个字节中的低7位编码、10
个阿拉伯数字,26个英文大写字母、26个英文小写字母与 一些标点符号、运算符号组成。
拓展链接 —— 数据的存储容量单位
1110
15
F
1111
思考、讨论:
1.3.4 编码
编码是信息按照某种规则或格式,从一种形式转化成另外 一种形式的过程。
解码是编码的逆过程。
数据的表现形式可以是文本、图形、图像、声音、视频等, 但不管哪种形式的数据,最终存储在计算机中的都是经过 一定规则编码后的二进制数字。
1.字符编码
常见的声音文件类型有Wave、MP3、WMA等。 Wave格式音频文件的存储容量计算公式:
存储容量=采样频率(Hz)×量化位数(bit)×声道数× 时长(s)(单位:位)
DVD光盘采用了双声道16位采样,采样频率为44.1KHz, 可达多媒体欣赏水平。
若某音乐剧的长度为5.5分钟,试计算其占用的存储容量 为多少MB?
5.图像编码
数字图像包括矢量图形和位图图形 在计算机图形学中,矢量图形是指用点、直线或者多边形
等基于数学方程的几何图元表示的图像。 矢量图形保存的文件大小一般比位图要小,并且文件大小
与图形的大小无关,在图像处理软件中任意放大矢量图形, 不会丢失细节或影响清晰度,因为矢量图形与清晰度无关。
计算机中存储容量最小的单位是比特(bit),1位二进制 数码表示1个bit,但是由于1bit所能表示的值太小,实际 上计算机中以8bit为一个基本单位,称为字节(Byte)。
常见的单位还有KB、MB等,他们之间换算的关 系是:
1Byte=8bit 1KB=1024B 1MB=1024KB 1GB=1024MB 1TB=1024GB 1PB=1024TB 1EB=1024PB 1ZB=1024EB
算一算:
1个8G的U盘,最多可以保存大小为 512KB的图片多少张?
(8×1024×1024)/512 =16384
(2)汉字编码
汉字编码分为外码、交换码、机内码和字形码。
外码,也叫作输入码,是用来将汉字输入到计算机中的一 组键盘符号。常用的汉字输入码有拼音码、五笔字型码等。
计算机内部的汉字编码都用机内码,1个汉字或者汉语标 点在计算机中占2个字节,英文字母或英文标点占1个字节。
数; 权又叫做权值,是指每一个数位上的1对应的数值,可以表
示为基数的若干次幂。
举例:
十进制数的基数为10,十进制数234中的2权值是 10²,3的权值是10¹,4的权值是10º,所以十进制数 234还可以表示为:
2×10²+3×10¹+4×10º
表1.3.1 进制的标识
进位制 二进制 八进制 十进制 十六进制
2.条形码
条形码是将宽度不等的多个黑条和白条,按照一定的编码 规则排列,用以表达一组信息的图形标识符。
EAN13条形码
国家代码
产商代码
商品代码 校验码
3.二维码
二维码/二维条码是用某种特定的几何图形按一定的规律在 平面上(二维方向)分布的黑白相间的图形记录数据符号 信息。
4.声音编码
1.3数据采集与编码
1.3.1数据采集
早期:观察、实验等人工方式 现在:传感器、网络爬虫等
音频、视频、图片在生活中常用那些方式来采集?
生活中传感器
环境空气颗粒取样 器
地感线圈 GPS追踪设备 现代农业当中的应
用 手机当中的应用 可穿戴设备中的应
用
互联网中获取数据
• 应用程序接口(API) • 专业数据平台
1.3.2数字化
信息可用模拟信号和数字信号来表达。
模拟信号是指用连续变化的物理量所表达的信息,如温度、 湿度、压力、长度、电流、电压等等,我们通常又把模拟信 号称为连续信号,它在一定的时间范围内可以有无限多个不 同的取值。
而数字信号是指在取值上是离散的、不连续的信号,在信息 技术中,这种信号表示的数据是指可被计算机存储、处理的 二进制数据。
标识 B
O
D
H
2.二进制
二进制的特点是: ①有两个基本数码:0,1。 ②采用逢二进一的进位规则。 举例:
1101.01B= 1×23+1×22+0×21+1×20+0×2-1+1×2-2
3.十六进制
十六进制的特点: 由十六个基本数码组成:即0,1,2······9,A,B,C,D,E,F. 采用逢十六进一的进位规则。
1.采样
X(t)
1 11
2 12
3 13
t
4
6
7
8
9
10
X(t)
7
6
5
4
3
2
1
0
1
11
2 12
3 13
2.量化
t
4
6
7
8
9
10
X(t)
7
6
5
4
3
2
1
0
1
11
2 12
3 13
2.量化
t
4
6
7
8
9
10
1.3.3数制
1.数的进制
数制是一种计数方式,亦称进位计数法或位值计数法。 任何一种数制都包含两个要素:基和权。 基又叫做基数,一般来说,K进制的基数就是K,包含K个
数字化就是讲模拟信号转换成数字信号(0、1)的过程。 通常用模数转换器执行这个转换。
自然界中的数字、文字、图像、声音等各种模拟信号, 通过采样定理都可以用0和1来表示,即通过数字化工具 讲模拟信号转换成数字信号,这样才能用计算机来进行 处理。
数字化,是信息社会的技术基础。
图1.3.2 模拟信号的数字化过程