《多媒体技术》复习思考题及参考答案第1章引论1.ITU定义了哪五类媒体?通常所说的媒体是指其中的什么媒体?答:感觉(Perception)、表示(Representation)、展现(Presentation)、存储(Storage) 和传输(Transmission)媒体;感觉。
2.目前多媒体所能处理的有哪些具体媒体对象?它们被分为哪两类?答:文本、图形、图像、声音、动画、视频等;静态媒体(文本、图形、图像)、流式媒体(声音、动画、视频)。
3.多媒体技术的特点有哪些?为什么传统电视不是多媒体?举出几种常见的多媒体设备。
答:多样性、集成性、交互性、[实时性];不交互;DVD、计算机、手机、数字电视。
4.多媒体的核心技术是什么?答:数据压缩第2章文字1.计算机对文字的处理,包括哪三个部分?答:文字输入、字符编码、文字输出。
2.文字录入计算机的方法主要有哪几类?答:键盘输入、手写输入、语音输入、扫描输入。
3.汉字有哪三个要素,各对应于什么键盘输入法?答:形、音、义,对应形码(如五笔字形)、音码(如全拼)、基于词汇与整句的智能化输入法(如微软拼音)。
4.语音识别系统可以如何分类?语音识别的目标是开发什么样的语音识别系统?答:小/中/大词汇量、孤立词/连接词/连续语音、特定人(1人)/限定人(n人)/非特定人(任意人);大词汇量、非特定人的连续语音识别系统。
5.ASCII的英文原文和中文译文是什么?ASCII是由什么组织在什么时候制定的?答:American Standard Code for Information Interchange,美国信息交换标准码;ANSI于1963年制定。
6.ASCII所对应的ISO标准号是多少?该ISO标准是什么时候制定的?答:646;1972年。
7.给出标准化组织ANSI、ISO和IEC的含义。
答:ANSI = American National Standards Institute,美国国家标准协会;ISO = International Organization for Standardization,国际标准化组织——是由各国的标准协会联合组成的一个非政府国际组织;IEC = International Electrotechnical Commission,国际电工技术委员会——国际标准化权威组织,属于联合国的甲级咨询机构,负责制定关于电工电子各方面的标准。
8.常用的中文编码的国家标准有哪些?它们各自的特点与适用范围是什么?答:GB 2312—早期、基本、经典、收字少(6千7百多),适用于老式中文软件;GBK/GB 18030—过渡、收字多(2万7千多)、与GB 2312兼容,适用于现在的中文软件;GB 13000—通用、与国际标准Unicoe和ISO/IEC 10646等价、收字多(接近2万1千)、与GB 2312不兼容,适用于现代国际化软件。
9.GB 2312中的汉字分成几级?各级中的汉字按什么顺序排列?答:分成两级,其中:常用的一级汉字按拼音字母顺序排列(同音字再按笔顺的横、竖、撇、捺、点、折序排列);生僻的二级汉字按部首顺序排列(同部首的字按笔画数排列,同笔画数的字再按笔顺排列)。
10.GB 2312中的汉字用几个字节表示?为什么只有94个区/位?答:2个(7位)字节;为了与ASCII码兼容,保留每个(7位)字节中的32个控制符和两个特殊可显字符(Space/Del),所以有128-34=94。
11.给出Big5的含义。
答:Big5内码(大五码)是1984年由台湾财团法人资讯工业策进会与宏碁(Acer)、神通(MiTAC)、佳佳、零壹(Zero One)、大众(FIC)等五大软件公司联合推出的一种用于港澳台及海外的繁体汉字编码方案。
12.GB 13000与ISO/IEC 10646的关系是什么?答:等价(英文译成了中文)。
13.给出UCS和BMP的英文原文、中文译文、含义与关系。
答:UCS = Universal [Multiple-Octet Coded] Character Set,通用[多八位编码]字符集;BMP = Basic Multilingual Plane,基本多文种平面;UCS是ISO/IEC 10646的具体字符编码方案(4字节),BMP是UCS中的第00组的第00平面(2字节)。
14.中日韩统一汉字(CJK)在BMP的哪个区?含有多少个汉字?答:I区;20 992个。
15.UCS的字符编码有哪些表示形式?它们各有什么特点?答:UCS-2—双字节、简单实用(BMP);UCS-4—4字节、复杂通用(整个UCS);UTF-8/16/32—变字节、分别适用于西文/中文/通用。
16.GBK与GB 18030有什么关系?它们与GB 2312和GB 13000又有什么关系?答:GBK为指导性技术规范,GB 18030是对应于GBK的国家标准;GBK/GB 18030收字多(与GB 13000兼容)且码位与GB 2312兼容,是从GB 2312到GB 13000的过渡性标准。
17.Unicode与ISO/IEC 10646有什么关系?比较它们的异同。
答:Unicode与ISO/IEC 10646是由两个组织(统一码协会和ISO/IEC)分别制定的国际通用字符编码标准,早期互不相干,1991年起走向融合,从1993年(Unicode 1.1/10646-1:1993)起Unicode与10646保持两者标准的码表兼容;同——码表兼容;异——10646只是字符集/贵/字体质量好,Unicode还含语义符号和算法/免费/字体质量不太好;所以,Unicode的使用更为广泛些。
18.UTF是什么?它有哪些具体编码方式?这些方式各有什么特点?答:UTF = Unicode/UCS Transformation Format 统一码/通用字符集转换格式,是一类具体的字符编码方式;UTF-8——每个字符1~6个字节的变长编码,与CPU的字节顺序无关,主要适用于西文ASCII编码;UTF-16——每个字符2或4个字节的变长编码,与CPU的字节顺序有关,无法相容于ASCII编码,主要适用于中文编码;UTF-32—4个字节的通用编码,适用于整个Unicode/ UCS。
19.文字输出方式包括哪两大类?答:图形(图符)、声音(语音)。
20.字形技术含哪三个方面?答:字型、字体、字库。
21.有哪三种字型?它们各有什么特点?答:点阵字——位图、显示快、占空间(字库大)、放大后有马赛克效应,已被淘汰;矢量字——单线条、字库小、算法简单、难看、只用于笔式绘图仪(少见);轮廓字——用曲线描绘字的轮廓、输出效果好、所见即所得、可无级放大、易实现空心/阴影/填充/变形等各种特效功能,是现代的主流字型。
轮廓曲线一般采用二、三次B样条或Bezier曲线。
22.常用的汉字字体是哪几种?它们各用于哪些方面?答:宋体/正文;仿宋体/正文及摘要等;黑体/标题及工艺美术;楷体/中小学教材的正文及工艺美术等。
23.语音输入与语音输出的核心技术各是什么?答:语音识别技术、语音合成技术。
24.给出TTS的英文原文和中文译文,并描述其系统的构成。
答:Text-To-Speech,文语转换;文本分析(通过对输入文本进行词法分析、语法分析,甚至语义分析,从文本中抽取音素和韵律等发音信息)+ 语音合成(使用从文本分析得到的发音信息去控制合成单元的谱特征(音色)和韵律特征(基频、时长和幅度),送入声音合成器(软件或硬件)产生相应的语音输出)。
第3章音频1.音频的英文是什么?它与声音有什么区别?音频一般分为哪三类?答:audio;音频指人能听到的声音(20Hz~20kHz),不包括次声和超声;话音、音乐、其他(环境声、音效声、自然声)。
2.室温下空气中的声速是多少?答:340 m/s。
3.声音是一种什么样的波?与水波有何区别?一般用哪两个物理量来描述?答:纵向压力波(纵波或疏密波);水波为横波;振幅和频率。
4.什么叫纯音?什么叫复音?怎样确定复音的音高?答:具有单一频率的声音;具有多种频率成分的声音;基频。
5.什么叫基音和谐音?它们之间有什么关系?答:和谐复音中具有基频的声音(其频率是和谐复音中的最低频,且通常具有最大振幅)、频率是基频整数倍(谐频)的声音(也叫泛音);谐音的频率是基音的整数倍。
6.声音有哪三个要素?它们的含义是什么?答:音调(tone)——人耳对声音高低的感觉,主要与声音的频率有关、响度(loudness)——对声音强弱的主观感知,一般用无量纲的声级(soundlevel)表示(单位为dB分贝)、音色(timbre)——人们区别不同发声体的主观感觉,每个人和每种乐器都有各自的音色。
音色主要是由复音中不同谐音的分布和组成所决定的,其他影响因素还有声音的时间过程。
7.人类听觉的频率范围是什么?语音的频率范围又是什么?答:20Hz~20kHz;300Hz~3000 Hz。
8.人耳有哪些部分构成?它们各有什么功能?答:人耳分为外耳、中耳和内耳三个部分。
外耳由耳廓(用于区分声源位置)和耳道(谐振腔)构成;鼓膜处在外耳和中耳之间(用于传导声音);中耳包含三根听骨及通向咽腔的耳咽管(平衡气压、保护内耳、匹配阻抗);内耳则包括耳蜗(柯蒂器负责听觉)、前庭和三半规管(平衡觉感受器)和听神经等部分。
9.听觉有哪些有用的感知特性?答:听阈曲线(不能感知弱低音)、(频域、时域和中枢)掩蔽效应。
10.模拟信号与数字信号的区别在哪里?如何将音频信号数字化?答:模拟信号在时间和幅度上都是连续,数字信号在时间和幅度都用离散的数字表示;采样+量化。
11.如何确定无损数字化的采样频率?按Nyquist采样定理语音和音乐之无损数字化的采样频率各是多少?答:按Nyquist采样定理——采样频率不低于声音信号最高频率的两倍;2*3kHz = 6kHz、2*20kHz = 40kHz。
12.MIDI的英文原文与中文译文各是什么?与波形数据相比MIDI有哪些优缺点?答: Musical Instrument Digital Interface,乐器数字接口;优点——文件小、容易编辑、常用作背景音乐;缺点——不能表示人声。
13.与MIDI相关的标准还有哪些?答:GM(General MIDI,通用MIDI)、XMF (eXtensible Music Format,可扩展音乐格式)、MIDI XML。
14.音乐生成方法有哪两种?它们各有什么特点?答:调频和波表;调频——将数字表示的简单乐音波形用计算机组合起来,通过数模转换器DAC 来生成乐音,简单便宜,有些失真;波表——把真实乐器发出的声音以数字的形式记录下来,播放时改变播放速度和音量,从而生成各种音阶和大小的音符,比调频法所产生乐音更逼真,但较贵。