当前位置:文档之家› 如何将扫描文件转换成可编辑的Word文档

如何将扫描文件转换成可编辑的Word文档

如何将扫描文件转换成可编辑的Word文档?
豫竹千里草
汉王ocr文字识别软件V8.1免费中文版,是一个带有PDF 文件处理功能的OCR 软件;具有识别正确率高,识别速度快的特点。

有批量处理功能,避免了单页处理的麻烦;支持处理灰度、彩色、黑白三种色彩的BMP、TIF、JPG、PDF多种格式的图像文件;可识别简体、繁体和英文三种语言;具有简单易用的表格识别功能;具有TXT、RTF、HTM和XLS多种输出格式,并有所见即所得的版面还原功能。

新增打开与识别PDF文件功能,支持文字型PDF的直接转换和图像型PDF的OCR识别,既可以采用OCR的方式将PDF文件转换为可编辑文档,也可以采用格式转换的方式直接转换文字型PDF 文件为RTF文件或文本文件。

下载地址:/baike/335364.shtml
一、PDF文件转换为RTF文件
操作步骤:
1.打开汉王PDF OCR,单击工具栏内左边第二个图标或按Ctrl+O 快捷键打开图像文件,然后找到并点选要识别的扫描文件。

2.单击对话框下方“PDF转换为RTF文件”或“PDF转换为TXT 文件”按钮,弹出如下对话框。

3.按提示设置完成后,单击“确定”即可直接将PDF文件转换为可编辑文件。

【注】:PDF文件转换为RTF文件时也可以选择下列操作方法:点击“输出”菜单中“PDF转换为RTF文件”和“PDF转换为TXT文件”选项,或点击工具栏中“PDF转换为RTF文件”
按钮(左边第三个按钮)和“PDF转换为TXT文件”按钮(左边第四个按钮),弹出下图对话框,您可以根据需要选择转换的图像页范围,点击“确定”,系统自动导出文件。

特别提示:
如果勾选“转换后打开RTF文件”,在转换后自动打开,如果不勾选则只转换保存文件,不打开。

如果未安装Word,导出后不能正确打开浏览,只能生成文件。

二、快捷键与工具按钮
1.快捷键
扫描文件:按下“Ctrl+N”调出扫描程序,扫描图像文件。

打开文件:按下“Ctrl+O”打开图像文件,追加图像文件。

保存图像:按下“Ctrl+S”键保存图像。

图像反白:按下“Ctrl+I”将图像反白。

自动倾斜校正:按下“Ctrl+D”进行自动倾斜校正。

手动倾斜校正:按下“Ctrl+M”进行手动倾斜校正。

版面分析:按下“F5”键,对选中的文件进行版面分析。

取消版面分析:按下“Ctrl+Del”键,取消当前页的版面分析。

取消当前栏:按下“Del”键或“Esc”键,取消当前栏属性标识。

版面识别:按下“F8”键,对选中的文件进行识别。

光标切换:按下“F9”键,光标在剪刀、画线笔、鼠标三种状态间切换。

左转图像:按下“Ctrl+L”将图像左转90度。

右转图像:按下“Ctrl+R”将图像右转90度。

向后翻页:按下“Page down”向后翻页。

向前翻页:按下“Page up”向前翻页。

撤消:按下“Ctrl+Z”键取消上一步操作。

剪切:按下“Ctrl+X”键剪切选中的内容。

复制:按下“Ctrl+C”键复制选中的内容。

粘贴:按下“Ctrl+V”键粘贴选中的内容。

向后找可疑字:按下“Ctrl+Tab”键。

向前找可疑字:按下“Shift+Tab”键。

2.工具按钮
:扫描图像。

:打开扫描好的图像文件。

:将PDF文件转换为RTF文件。

:将PDF文件转换为TXT文件。

:图像放大。

:图像缩小。

:选中全部图像文件。

:对所选图像进行分析识别。

:对所选图像版面分析。

:取消选中图像页的版面分析。

:标记/修改当前图像框的属性。

:取消当前图像框属性。

:将光标切换成鼠标状态。

:去除版面噪音,如黑点、黑框等。

:在图像页上画线,弥补断线处或将表格填补成标准表格。

:向前/向后翻页。

三、图像文件识别
1.打开要识别的扫描文件。

根据要求选择,一般情况下分辨率DPI选择默认300即可。

单击“确定”。

2.按F8快捷键或单击“开始识别”图标,弹出如下对话框:
可以对图像文字进行识别、编辑(不再赘述)。

四、PDF文件转换为TXT文件
选择PDF转换成TXT文件,有太多不便。

一是TXT格式只保存文字、表格部分,不保存图片;二是要转换成Word文档时尚需进行“复制”、新建Word文档、“粘贴”等操作后,才能保存为Word 文档格式。

一句话,太麻烦了!
【附】
TXT是纯文本格式只保存文字、表格部分,不保存图片;
RTF是通用格式可以用WORD、WPS等文字处理软件编辑;
HTML是网页格式可以输出到IE等网络浏览器;
XLS格式可以用Excel 等软件编辑。

相关主题