当前位置：文档之家› 第5章数字媒体及应用

第5章数字媒体及应用

存在问题：
7位代码空间太小（只能对128个字符编码）不同国家和地区使用不同的字符集及其编码，互不兼容东亚地区使用的大字符集无法编码
7
标准ASCII字符集及其码表
b6 b5 b4 b3 b2 b1 b0
1 01 0 01 10 1 01
b3b2b1b0
0 1 2 3 4 5 6 7 8 9 A BC D E F
像素深度，即像素的所有颜色分量的二进位数目之和
图像类型单色图像彩色图像
黑白图像灰度图像彩色图像
像素的组成仅1个分量仅1个分量 3个分量以上
像素深度(位数) 1位 2～12位 8～36位
颜色空间不使用不使用 RGB，CMY，YUV等
31
数字图像的数据量
数字图像数据量的计算公式（以字节为单位）：
模
拟
扫描
图
像
分色
将画面划分为 M × N个网格，每个网格称为一
个取样点
将彩色图像取样
点的颜色分解成 R，G，B三个基色
25
取样取样取样
量化
数
字
量化
图
量化
像
测量每个取样点的每个分量（基色）的亮度值
对取样点每个分
量的亮度值进行 A/D转换，使用数字整型量表示
5.2.2 图像的表示与压缩编码
Unicode:UTF-8 单字节可变长编码
单字节：ASCII字符双字节：拉丁、希腊、阿拉伯，··· 三字节：CJK汉字四字节：其他
应用：Linux，Web网页，电子邮件
Unicode:UTF-16双字节可变长编码
双字节： ASCII字符、拉丁、希腊、阿拉伯，常用CJK汉字，··· 四字节：CJK汉字
印刷体识别
纸介质文本
17
扫描仪
文本的映象
(image)
OCR
数字文本
文字符号输入计算机的方法
字符信息的输入
人工输入
自动识别输入
键盘输入联机手写输入语音输入
印刷体识别
手写体识别
– 技术上非常困难，还无法实用 –目前准备先突破工整的楷书手写体的识别!
18
汉字的键盘输入
汉字与键盘上的键无法一一对应，因此必须使用几个键来表示一个汉字，这就称为汉字的“键盘输入编码” 优秀的汉字键盘输入编码应具有的特点：
（3）
文本处理
文本准备
（文字与图表的输入）
文本编辑
（文本处理软件）
与排版
电子（文本编辑器）格式化的文本存储
文本
电子文本与传输
文本展现
(存档/通信软件)（文本阅读器）
（1）
（2）
（4）
（5）
4
5.1.1. 字符在计算机中的表示
5
字符、字符集及其码表
文字的基本元素是字母和符号，统称为“字符” (character)，它包括：字母、数字、标点、符号等
数据量=水平分辨率×垂直分辨率×像素深度／8
几种常用格式的图像的数据量：
图像大小 8位(256色) 16位(65536色) 24位(真彩色)
640×480
300 KB
600 KB
900 KB
1024×768
768 KB
1.5 MB
2.25 MB
1280×1024 1.25 MB
2.5 MB
3.75 MB
•不足： •对说话人、说话方式、说话内容的适应能力要大大增强 •识别速度和正确性还需大大提高
16
文字符号输入计算机的方法
键盘输入
人工输入
字符信息的输入
•识别率已达到98%
•功能:
– 简、繁体字混合识别自动识– 别中输文入、西文混合识别
– 文字、表格混合识别
– 智能校对功能
联机手写输入语音输入
33
图像文件格式例1：BMP格式
BMP图像格式是Windows操作系统下使用的一种标准图像格式
支持单色、16色、256色、真彩色图像一个文件一幅图像，可以进行无损压缩，也可不压
缩非压缩的BMP文件是一种通用的图像文件格式，
几乎所有Windows 应用软件都能支持
34
图像文件格式例2： GIF 图像
音乐图像 ···
其中，文字信息处理是涉及面最广的一种计算机应用，几乎与任何领域任何人都有关。
3
计算机文字处理过程
文字信息在计算机中称为“文本”（text），文本是计算机中最常用的一种数字媒体
文本由一系列 “字符”（character）组成，每个字符均使用二进制编码表示
文本在计算机中的处理过程是：
例：数字图像传输时间的计算
假设数据传输速率为56 kb/s（电话上网），则传输一幅分辨率为640×480的6.5万种颜色的未压缩图像的时间为：
(640x480x16)/56000 = 87.8秒
32
数字图像的数据压缩
图像数据压缩的必要性：
节省存储数字图像所需要的存储器容量提高图像的传输速度，减少通信费用
西文是表音文字(拼音文字)，它由拉丁字母、数字、标点符号以及一些特殊符号所组成
美国标准信息交换码(American Standard Code for Information Interchange, 简称ASCII码)：
ASCII字符集包含96个可打印字符和32个控制字符采用7个二进位进行编码计算机中使用1个字节存储1个ASCII 字符
字符集：一组特定字符的集合
不同的字符集包含的字符数目与内容不同，如：中文字符集、西文字符集、日文字符集等
字符的编码：
字符集中每个字符都使用二进位(code) 表示，称为该字符的编码
不同的字符其编码各不相同字符集中所有字符的编码的一览表，称为该字符集的码表
6
西文字符的编码——ASCII码
26
数字(取样)图像的组成
数字取样图像由M(列) × N(行)个取样点组成取样点是组成数字取样图像的基本单位，称为“像素” 彩色图像的像素通常由3个彩色分量组成灰度图像和黑白图像的像素只包含1个亮度分量
Red分量 Green分量 Blue分量
像素
27
例1：黑白图象的表示
黑白图像的每个像素只有一个分量，且只用1个二进位表示，其取值仅“0”(黑)和“1”(白)两种
红色分量绿色分量蓝色分量
30
数字(取样)图像的主要参数
图像大小（图像分辨率）：
用来表示组成该图像的行列数目，亦即图像所包含的像素数目使用水平分辨率x垂直分辨率表示对在屏幕上显示出来的大小有影响
颜色空间的类型，指彩色图像所使用的颜色描述方法，如：
RGB(红、绿、蓝)模型，显示器使用 CMYK(青、品红、黄、黑)模型，彩色打印机使用 HSB(色彩、饱和度、亮度)模型，用户界面中使用 YUV(亮度、色度)模型，彩色电视信号传输时使用
图像数据压缩的可能性：
数字图像中有大量的数据冗余人眼视觉有局限性，允许图像有一些失真
图像数据压缩的两种类型：
无损压缩：用压缩后的数据还原出来的图像没有任何误差有损压缩：用压缩后的数据还原出来的图像有一定的误差
压缩编码方法的评价压缩倍数的高低（压缩比）
重建图像的质量（有损压缩时）压缩算法的复杂程度
JPEG特别适合各种连续色调的彩色或灰度图像，在计算机和数码相机中已得到广泛应用
JPEG的最新标准是JPEG2000（图像文件扩展名是 .jp2 ），它采用更先进的技术，可取得更好的效果
36
5.2.3 数字图像处理与应用
37
数字图象处理：目的与内容
目的： (1) 提高图像的视觉质量 (2) 恢复与重建有失真和畸变的图像 (3) 图像分析，包括：图像的分类、识别和理解等 (4) 图像数据的变换、编码和数据压缩 (5) 图像的存储、管理与检索 (6) 图像内容与知识产权的保护
14
文字符号输入计算机的方法
字符信息的输入
人工输入
自动识别输入
键盘输入联机手写输入 15
•优点：
–自然，流畅 –小型化，适合移动计算
•不足：
–识别速度和正确性还需提高 –书写要求还要降低
文字符号输入计算机的方法
字符信息的输入
人工输入
自动识别输入
键盘输入联机手写输入语音输入
•优点： •自然，方便，适合移动计算
最后将变换得到的字形放置在页面的指定位置处
2种不同的字库：
轮廓点
点阵描述
轮廓描述
直线获取 5.2.2 图像的表示与压缩编码 5.2.3 数字图像处理与应用 5.2.4 计算机图形
5.2.1 数字图像的获取
24
图像的获取过程
从现实世界中获得数字图像的过程称为图像的“获取” 常用的图像获取设备：扫描仪、数码相机、摄像头、摄像机等图像获取过程：
易学习、易记忆效率高(平均击键次数较少) 重码少容量大(可输入的汉字字数多)
19
5.1.3 文本的展现(输出)
20
文本的展现(输出)
目的：阅读、浏览或打印文本使用的软件：文本阅读器/文本浏览器
嵌入在文本编辑(处理)软件中，如微软的Word，独立的软件：如Adobe公司的Acrobat Reader，
应用：Windows，Mac，Java，···
11
例: IE浏览网页时文字编码的选择
12
5.1.2. 文本准备
——文稿如何输入计算机
13
文字符号输入计算机的方法
字符信息的输入
人工输入
自动识别输入
键盘输入
(1)数字编码, 如电报码、区位码等, (2)字音编码, 如智能ABC等 (3)字形编码，如五笔字形和表形码等, (4)形音编码发展趋势：基于统计和学习功能的以词语(短语)或句子作为输入单位的输入方法

e商务文档

第5章数字媒体及应用

相关文档推荐：

e商务文档

第5章 数字媒体及应用

相关文档推荐：

第5章数字媒体及应用