当前位置：文档之家› PDF进行OCR识别

PDF进行OCR识别

OCR （Optical Character Recognition，光学字符识别）是指电子设备（例如扫描仪或数码相机）检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程。

我们很多人都于OCR并不太熟悉，对于PDF文件进行OCR是识别，说得再通俗一些就类似于PDF文件转Word文件，将PDF文件中的文件和图片以文档的形式识别出来，然后可以进行编辑操作等
进行OCR识别，需要安装能够进行识别的软件，在浏览器上下载安装“迅捷caj转换器”
完成安装后，进入软件页面，在页面中可以看到有各种文件格式转换的类型，可以根据自己的需求进行转换，OCR并不属于其中的所展现的类型，所以，选择“更多操作”
在“更多操作”中我们可以看到最上面的就是有关OCR的，我们选择第二个“PDFOCR识别”
点击后，将需要进行识别的PDF文件添加道右侧页面中
文件添加后，下面有一些选项设置，你过你需要识别的是整个PDF 文件，那么就选择“全部”，如果是识别指定的某一页，那么根据自己的需求去设置
最后就是点击开始转换，完成转换后我们可以直接打开文件，利用OCR识别后的PDF文件会直接转换成Word可编辑文档，所以说就有点类似于将PDF文件转换成Word形式。

e商务文档

PDF进行OCR识别

相关文档推荐：