当前位置:文档之家› 第5章 数字媒体及应用

第5章 数字媒体及应用

存在问题:
7位代码空间太小(只能对128个字符编码) 不同国家和地区使用不同的字符集及其编码,互不兼容 东亚地区使用的大字符集无法编码
7
标准ASCII字符集及其码表
b6 b5 b4 b3 b2 b1 b0
1 01 0 01 10 1 01
b3b2b1b0
0 1 2 3 4 5 6 7 8 9 A BC D E F
像素深度,即像素的所有颜色分量的二进位数目之和
图像类型 单色图像 彩色图像
黑白图像 灰度图像 彩色图像
像素的组成 仅1个分量 仅1个分量 3个分量以上
像素深度(位数) 1位 2~12位 8~36位
颜色空间 不使用 不使用 RGB,CMY,YUV等
31
数字图像的数据量
数字图像数据量的计算公式(以字节为单位):


扫描


分色
将画面划分为 M × N个网格,每 个网格称为 一
个取样点
将彩色图像取样
点的颜色分解成 R,G,B三个 基色
25
取样 取样 取样
量化


量化

量化

测量每个取样点 的每个分量(基 色)的亮度值
对取样点每个分
量的亮度值进行 A/D转换,使用 数字整型量表示
5.2.2 图像的表示与压缩编码
Unicode:UTF-8 单字节可变长编码
单字节:ASCII字符 双字节:拉丁、希腊、阿拉伯,··· 三字节:CJK汉字 四字节:其他
应用:Linux,Web网页,电子邮件
Unicode:UTF-16双字节可变长编码
双字节: ASCII字符、拉丁、希腊、阿 拉伯,常用CJK汉字,··· 四字节:CJK汉字
印刷体识别
纸介质 文本
17
扫描仪
文本的 映象
(image)
OCR
数字 文本
文字符号输入计算机的方法
字符信息的输入
人工输入
自动识别输入
键盘输入 联机手写输入 语音输入
印刷体识别
手写体识别
– 技术上非常困难,还无法实用 –目前准备先突破工整的楷书手写体的识别!
18
汉字的键盘输入
汉字与键盘上的键无法一一对应,因此必须使用 几个键来表示一个汉字,这就称为汉字的“键盘输 入编码” 优秀的汉字键盘输入编码应具有的特点:
(3)
文本处理
文本准备
(文字与图表 的输入)
文本编辑
(文本处理软件)
与排版
电子 (文本编辑器)格式化的 文本存储
文本
电子文本 与传输
文本 展现
(存档/通信软件)(文本阅读器)
(1)
(2)
(4)
(5)
4
5.1.1. 字符在计算机中的表示
5
字符、字符集及其码表
文字的基本元素是字母和符号,统称为“字符” (character),它包括:字母、数字、标点、符号等
数据量=水平分辨率×垂直分辨率×像素深度/8
几种常用格式的图像的数据量:
图像大小 8位(256色) 16位(65536色) 24位(真彩色)
640×480
300 KB
600 KB
900 KB
1024×768
768 KB
1.5 MB
2.25 MB
1280×1024 1.25 MB
2.5 MB
3.75 MB
•不足: •对说话人、说话方式、说话内容的适应能力要大 大增强 •识别速度和正确性还需大大提高
16
文字符号输入计算机的方法
键盘输入
人工输入
字符信息的输入
•识别率已达到98%
•功能:
– 简、繁体字混合识别 自动识– 别中输文入、西文混合识别
– 文字、表格混合识别
– 智能校对功能
联机手写输入 语音输入
33
图像文件格式例1:BMP格式
BMP图像格式是Windows操作系统下使用的一种 标准图像格式
支持单色、16色、256色、真彩色图像 一个文件一幅图像,可以进行无损压缩,也可不压
缩 非压缩的BMP文件是一种通用的图像文件格式,
几乎所有Windows 应用软件都能支持
34
图像文件格式例2: GIF 图像
音乐 图像 ···
其中,文字信息处理是涉及面最广的一种计算机 应用,几乎与任何领域任何人都有关。
3
计算机文字处理过程
文字信息在计算机中称为“文本”(text),文本是计算机中最 常用的一种数字媒体
文本由一系列 “字符”(character)组成,每个字符均使用二 进制编码表示
文本在计算机中的处理过程是:
例:数字图像传输时间的计算
假设数据传输速率为56 kb/s(电话上网),则传输一幅分辨 率为640×480的6.5万种颜色的未压缩图像的时间为:
(640x480x16)/56000 = 87.8秒
32
数字图像的数据压缩
图像数据压缩的必要性:
节省存储数字图像所需要的存储器容量 提高图像的传输速度,减少通信费用
西文是表音文字(拼音文字),它由拉丁字母、数字、标点符号 以及一些特殊符号所组成
美国标准信息交换码(American Standard Code for Information Interchange, 简称ASCII码):
ASCII字符集包含96个可打印字符和32个控制字符 采用7个二进位进行编码 计算机中使用1个字节存储1个ASCII 字符
字符集:一组特定字符的集合
不同的字符集包含的字符数目与内容不同,如: 中文字符集、西文字符集、日文字符集等
字符的编码:
字符集中每个字符都使用二进位(code) 表示,称为该字符的 编码
不同的字符其编码各不相同 字符集中所有字符的编码的一览表,称为该字符集的码表
6
西文字符的编码——ASCII码
26
数字(取样)图像的组成
数字取样图像由M(列) × N(行)个取样点组成 取样点是组成数字取样图像的基本单位,称为“像素” 彩色图像的像素通常由3个彩色分量组成 灰度图像和黑白图像的像素只包含1个亮度分量
Red分量 Green分量 Blue分量
像素
27
例1:黑白图象的表示
黑白图像的每个像素只有一个分量,且只用1个二进位表 示,其取值仅“0”(黑)和“1”(白)两种
红 色 分 量 绿 色 分 量 蓝 色 分 量
30
数字(取样)图像的主要参数
图像大小(图像分辨率):
用来表示组成该图像的行列数目,亦即图像所包含的像素数目 使用 水平分辨率x垂直分辨率 表示 对在屏幕上显示出来的大小有影响
颜色空间的类型,指彩色图像所使用的颜色描述方法,如:
RGB(红、绿、蓝)模型,显示器使用 CMYK(青、品红、黄、黑)模型,彩色打印机使用 HSB(色彩、饱和度、亮度)模型,用户界面中使用 YUV(亮度、色度)模型,彩色电视信号传输时使用
图像数据压缩的可能性:
数字图像中有大量的数据冗余 人眼视觉有局限性,允许图像有一些失真
图像数据压缩的两种类型:
无损压缩:用压缩后的数据还原出来的图像没有任何误差 有损压缩:用压缩后的数据还原出来的图像有一定的误差
压缩编码方法的评价 压缩倍数的高低(压缩比)
重建图像的质量(有损压缩时) 压缩算法的复杂程度
JPEG特别适合各种连续色调的彩色或灰度图像, 在计算机和数码相机中已得到广泛应用
JPEG的最新标准是JPEG2000(图像文件扩展名 是 .jp2 ),它采用更先进的技术,可取得更好的 效果
36
5.2.3 数字图像处理与应用
37
数字图象处理:目的与内容
目的: (1) 提高图像的视觉质量 (2) 恢复与重建有失真和畸变的图像 (3) 图像分析,包括:图像的分类、识别和理解等 (4) 图像数据的变换、编码和数据压缩 (5) 图像的存储、管理与检索 (6) 图像内容与知识产权的保护
14
文字符号输入计算机的方法
字符信息的输入
人工输入
自动识别输入
键盘输入 联机手写输入 15
•优点:
–自然,流畅 –小型化,适合移动计算
•不足:
–识别速度和正确性还需提高 –书写要求还要降低
文字符号输入计算机的方法
字符信息的输入
人工输入
自动识别输入
键盘输入 联机手写输入 语音输入
•优点: •自然,方便,适合移动计算
最后将变换得到的字形放置在页面的指定位置处
2种不同的字库:
轮廓点
点阵 描述
轮廓 描述
直线获取 5.2.2 图像的表示与压缩编码 5.2.3 数字图像处理与应用 5.2.4 计算机图形
5.2.1 数字图像的获取
24
图像的获取过程
从现实世界中获得数字图像的过程称为图像的“获取” 常用的图像获取设备:扫描仪、数码相机、摄像头、摄像机等 图像获取过程:
易学习、易记忆 效率高(平均击键次数较少) 重码少 容量大(可输入的汉字字数多)
19
5.1.3 文本的展现(输出)
20
文本的展现(输出)
目的:阅读、浏览或打印文本 使用的软件:文本阅读器/文本浏览器
嵌入在文本编辑(处理)软件中,如微软的Word, 独立的软件:如Adobe公司的Acrobat Reader,
应用:Windows,Mac,Java,···
11
例: IE浏览网页时文字编码的选择
12
5.1.2. 文本准备
——文稿如何输入计算机
13
文字符号输入计算机的方法
字符信息的输入
人工输入
自动识别输入
键盘输入
(1)数字编码, 如电报码、区位码等, (2)字音编码, 如智能ABC等 (3)字形编码,如五笔字形和表形码等, (4)形音编码 发展趋势:基于统计和学习功能的以词语(短语)或句子作为输入单 位的输入方法
相关主题