当前位置:文档之家› 使用Office 2003自带的OCR程序进行文字识别

使用Office 2003自带的OCR程序进行文字识别

使用Office 2003自带的OCR程序进行文字识别
用途:我们经常从期刊网下载的PDF文件或CAJ文件的文本都是不能直接复制出来的,遇到这种情况,我们可以使用Office 2003所自带的OCR程序进行识别。

操作步骤:
1. 用CAJViewer打开准备要进行文字识别的文件,按“文件→打印”按钮打开打印选项对话框。

2. 在“打印”对话框中,首先在“名称”选择栏中必须选中“Microsoft Office Document Image
2选择打印的范围
3. 然后按确定选择保存的位置,保存在那里都不要紧,因为打印生成的文件只是一个暂时使用的文件,我们在使用完后可以把他删除了。

4. 打印成功后,系统会自动打开“Microsoft Office Document Imaging”软件打开刚才打印成功的文件。

5. “Microsoft Office Document Imaging”打开后,选择工具栏中的眼睛图标进行文字识别。

6. 等待识别完成后,在文档区拉动鼠标选择需要复制的文字,当文字出现亮蓝显示时,证明文字是可以复制出来的,然后按键盘的ctrl+c,或者按鼠标右键复制都可以把文字复制出来。


如果你在第二步操作选择打印机时没有看到“Microsoft Office Document Image Writer”出现,表明你还没有按照Office 2003中的这个工具,我们可以按照以下的步骤安装。

1. 打开“控制面板”——“添加删除程序”。

2. 在“添加删除程序”列表框中选中Office 2003安装项目,选中它,然后点击“更改”按钮。

3. 在新打开的“Office 2003”安装对话框中,选择“添加删除功能”,然后按下一步。

4. 然后必须选择“选择应用程序的高级自定义”选项,再点击下一步按钮。

5. 拖动新开窗口的右侧滚动条,打开“office 工具”子菜单,选择“Microsoft Office Document Imaging”工具,然后点击鼠标左键,在弹出的选项框中选择“从本机运行”,然后按“更新”按钮。

6. 然后插入Office 2003安装光盘进行安装。

相关主题