当前位置：文档之家› 多媒体素材采集与处理实验教学指导书

多媒体素材采集与处理实验教学指导书

多媒体素材采集与处理实验教学指导书一、实验目的：学会使用扫描仪获取书页影像并将之转换为电子文档；掌握图像、音频多媒体素材的采集与编辑方法。

二、实验内容：1．学会使用扫描仪扫描影像的方法。

2．掌握扫描软件Scanwizard 5、OCR软件尚书七号的使用3．掌握在Windows环境下录制、播放与编辑声音文件的方法。

4. 掌握Goldwav音频录制与编辑技巧。

三、实验仪器设备：Microteck ScanMaker 3860扫描仪、计算机、耳麦。

四、实验原理：扫描仪是一种获取影像的装置,并将之转换为计算机能够显示、编辑、储存与输出的数字格式。

这里所说的影像是指照片、文字页、图形与插画等,甚至如硬币或者纺织品等三维物件都算是影像的一种。

实际上,这意味着扫描仪能够完成下列工作:●在文件中结合美术图形与照片。

●将印刷文字扫描输入到文书处理软体中,免去重新打字。

●将传真文件扫描输入到数据库或者文书处理软体中储存。

●在多媒体中加入影像。

●在摘要中结合影像资料使其能更有效的表达主题。

扫描仪可区分为两种类型:●平台式扫描仪,用来扫描照片与印刷品.平台式扫描仪都具有一个玻璃面,用来摆放扫描稿件。

●透射式扫描仪,用来扫描幻灯片与底片。

在我们实验中使用的中晶Microteck ScanMaker 3860是一种典型的平台式扫描仪。

在扫描系统中,扫瞄仪仅是构成整个系统的其中一部份,除了扫描仪以外,还需要其它的组件: ①一条特定的连接线,连接扫描仪与电脑。

②操纵扫描仪工作的扫描软件。

③用影像编辑软件将扫描影像结合到您的工作中;或者用文字辨识软件将扫描文字结合到您的工作中。

④一个合适的屏幕用来显示彩色或者灰阶影像。

⑤用来输出您工作成果的输出设备,如印打印机。

工作原理：对原稿进行光学扫描，然后将光学图像传送到光电转换器中变为模拟电信号，又将模拟电信号变换成为数字电信号，最后通过计算机接口送至计算机中。

扫描仪扫描图像的步骤是:首先将欲扫描的原稿正面朝下铺在扫描仪的玻璃板上，原稿能够是文字稿件或者者图纸照片；然后启动扫描仪驱动程序后，安装在扫描仪内部的可移动光源开始扫描原稿。

为了均匀照亮稿件，扫描仪光源为长条形，并沿y方向扫过整个原稿；照射到原稿上的光线经反射后穿过一个很窄的缝隙，形成沿x方向的光带，又通过一组反光镜，由光学透镜聚焦并进入分光镜，通过棱镜与红绿蓝三色滤色镜得到的RGB三条彩色光带分别照到各自的CCD上，CCD将RGB光带转变为模拟电子信号，此信号又被A/D变换器转变为数字电子信号。

至此，反映原稿图像的光信号转变为计算机能够同意的二进制数字电子信号，最后通过串行或者者并行等接口送至计算机。

扫描仪每扫一行就得到原稿x 方向一行的图像信息，随着沿y方向的移动，在计算机内部逐步形成原稿的全图。

人耳的听觉特性涉及生理声学与心理声学方面的问题。

人耳可听的声音频率范围为20Hz至20KHz，但人耳对不一致频率的声音敏感程度是不一样的，中频段（3 kHz～5 kHz）最敏感，幅度很低的信号都能被人耳听到。

低频区与高频区较不敏感，能被人耳听到的信号幅度比中频段要高得多。

话音信号是典型的连续信号，不仅在时间上是连续的，而且在幅度上也是连续的。

在时间上“连续”是指在一个指定的时间范围里声音信号的幅值有无穷多个，在幅度上“连续”是指幅度的数值有无穷多个。

我们把在时间与幅度上都是连续的信号称之模拟信号。

声音数字化就是将模拟的(连续的)声音波形数字化(离散化)，以便利用数字计算机进行处理，要紧包含采样与量化两个方面。

数字化音频的质量取决于采样频率与量化位数这两个重要参数。

采样频率是对声音波形每秒钟进行采样的次数。

人耳听觉的频率上限在2OkHz左右，根据采样理论，为了保证声音不失真，采样频率应在40kHz左右。

经常使用的采样频率有11.025kHz、22.05kHz与44.lkHz等。

采样频率越高，声音失真越小、音频数据量也越大。

量化数据位数(也称量化级)是能够用来表示每个采样点的数据范围，经常使用的有8位、12位与16位。

比如，8位量化级表示每个采样点能够表示成256个(0-255)不一致量化值，而16位量化级则是指每个采样点可表示成65536个不一致量化值。

量化位数越高，表示区别声音的差别更细致，因此音质越好，数据量也越大。

声音数字化信息量= 采样频率（Hz/s)×量化位数（bit)×声道数五、实验步骤第一部分：扫描仪的使用步骤 1. 安装 ScanWizard 5 驱动程序关于初次使用的扫描仪，请首先打开镜头锁，关于Scanmaker 3860来说，镜头锁在扫描仪的底面右下角，首先使用镊子或者尖嘴钳把阻挡物拔出，然后把镜头锁开关向外拨动到“ON”的位置。

(注：实验用扫描仪均已打开镜头锁，此步可跳过)如下图所示：按照扫描仪所附的安装指南与光盘片上的安装界面,将ScanWizard 5 扫描仪驱动程序安装到Windows系统中。

（注：本实验所用计算机系统已安装扫描仪驱动，此步可跳过。

）步骤 2. 将扫描稿件放到适当位置把扫描槁件（照片、书页等）面朝下,放到扫描仪的玻璃面板上，摆放稿件时，尽量靠齐扫描玻璃的一个侧条，可确保稿件的摆入端正。

由于扫描仪会生成一个倒立的像，因此放入待扫描材料时，应倒放在玻璃面板上。

步骤 3. 执行 ScanWizard 5 扫描软件直接在桌面的 ScanWizard Easy 图示上点两下执行,或者从“开始”->“程序”->“ScanWinzard 5”开始执行扫描程序。

扫描程序的默认界面如下图所示：预览：当你一开始进入标准操纵模式,程序预设会自动预览你的稿件。

假如你想取消此功能,能够从属性中取消即可。

到Web按钮：扫描到按钮能够切换为到Web 按钮, 只要按住按钮两秒钟即会出现副选单.原稿：选择待扫描材料的材质扫描类型：输出的色彩位数输出目的：图片输出到何处，本实验选择输出到文件输出比例：选择输出影像输出尺寸的比例大小. (50%, 75%,100%, 150%, 或者 200 %)调整：调整对比度、锐度等属性：扫描仪的参数设定.界面上的各按钮的功能如下表所示：图标功能移动/ 缩放（放大/缩小）信息按钮改变窗口尺寸切换到高级模式扫描仪信息帮助说明最小化关闭程序点击按钮后ScanWizard切换到高级模式，界面如图所示：可根据具体扫描要求选择不一致的扫描参数，选用参数时，请注意下列几点：①关于照片，选用300ppi的分辨率即可达到良好的效果，不必选择最高的1200ppi，否则会使扫描出的图像文件过于庞大，甚至会达到上百光兆的大小。

②关于大头贴等较小的等扫描材料，能够把缩放比设为大于100%，以使输出图像足够大。

③假如待扫描的材料非常多，单张面积又比较小，能够把多张待扫描材料一块放到玻璃面板上，摆放时，注意待扫描材料间留出一定的间距，以便于后期裁切，一次扫描输出，再使用图像处理软件（比如PhotoShop）进行裁切。

比如能够玻璃面板上摆放多张照片，然后一次扫描到一张图像上，然后进行裁切。

步骤 4. 扫描稿件进入ScanWizard 5 后,先预览你的稿件, 假如发现摆入的稿件不端正，打开盖板，把稿件放正后，再进行预览，直到摆放端正为止。

步骤 5. 储存稿件根据稿件的材质类型，设定扫描参数。

设定完毕后，能够点击“扫描到”按钮直接存档,或者是把影像传送到别的地方做其它的应用,如打印机、电子邮件、OCR及Web。

步骤 6. 离开 ScanWizard 5 扫描软件只要点击窗口右上角的离开按钮即可。

第二部分：OCR软件的使用一、获取图像：有两种方式获取图像，扫描图像或者打开计算机中已经存在的图像文件。

扫描图像之前应设置好储存扫描图像文件的路径、图像文件名、图像文件名后缀。

设置图像路径，能够直接在窗口中键入路径名，或者单击按钮，在浏览路径窗口中选定路径。

图像名的命名规则为: 若干位字母前缀+3位数字，3位数字的范围从000到999，每扫描一幅图像后系统会自动在数字尾数加1，如图像名前缀取“hw”，图像名数字尾数取“003”，图像名后缀取tif，则当前图像名为hw003.tif，下一幅图像名自动改为hw004.tif；假如当前图像名尾数达到最大值，如hw999.tif，则下一幅图像名自动改回为hw000.tif，因此相同路径下相同文件名前缀的文件数最多为1000幅。

假如扫描过程中弹出“此文件已经存在，是否替换该文件？”提示框，说明该路径下已经存在同名的旧图像文件，假如旧图像文件不再需要，择选择“是”，以新扫描的图像替换旧图像；假如还需要旧图像文件，则选择“否”，并在“另存到”窗口中重新设定路径或者图像文件名。

不一致批次的扫描图像最好分别储存于不一致的路径之下，或者者在相同路径下而选取不一致的图像名前缀，以防止相同路径下相同文件名前缀的文件数超过1000幅。

图像文件名后缀只能取bmp，tif，jpg 三种图像格式，通常情况下，黑白二值图像储存为tif格式，灰度彩色图像储存为jpg格式将占用较少的硬盘空间。

比如，C:\hwocr\image\hw003.tif是一个完整合法的图像文件名。

单击工具栏上的按钮或者单击“文件”菜单中的“扫描”命令，通过扫描仪开始批量扫描文件；单击工具栏上的按钮或者单击“文件”菜单中的“打开图像”命令，打开计算机中已经扫描好的图像文件。

二、图像处理：为提高识别率，对图像进行图像反白，自动倾斜校正，调整边框，去噪音（如麻点、下划线等），表格画线等处理。

三、版面分析：单击工具栏中的按钮，或者单击“识别”菜单中的“版面分析”命令，自动对图像的版面布局、内容进行分析懂得，切分图像页，判别图像框的版面属性（横栏、竖栏、表格、图像），并以不一致颜色的线框标识图像框属性。

对分析错误的版面能够手动调整，方法为，先以鼠标选中需要调整的版面块，再调整版面块的边框改变大小，或者单击工具栏上的属性按钮（横栏、竖栏、表格、图像）改变该版面块属性。

四、识别图像：单击按钮或者单击“识别”菜单中的“开始识别”命令，按照版面属性（横栏、竖栏、表格、图像），自动对图像文件管理器选择的图像进行批量识别。

五、校对：通过对比识别结果文本与原图像，以发现识别错误的文字。

用户可按Ctrl+Tab、Shift+Tab组合健直接查找系统用醒目的颜色标出的可信度不高的文字，进行校对。

六、版面还原：单击“输出”菜单中的“到指定格式文件”命令，将识别并修改好的文本输出、还原成可供计算机阅读与查询检索的RTF、HTML、XLS、TXT格式的电子文档。

七、删除不再需要的数据文件：系统在识别处理过程中生成一些数据文件，这些文件与有关的图像文件放在同一文件夹之下，这些文件以对应的图像文件名字命名而分别加上不一致的后缀，包含 *.bki，*.pst，*.tmp。

e商务文档

多媒体素材采集与处理实验教学指导书

相关文档推荐：