OCR (Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。
我们很多人都于OCR并不太熟悉,对于PDF文件进行OCR是识别,说得再通俗一些就类似于PDF文件转Word文件,将PDF文件中的文件和图片以文档的形式识别出来,然后可以进行编辑操作等
进行OCR识别,需要安装能够进行识别的软件,在浏览器上下载安装“迅捷caj转换器”
完成安装后,进入软件页面,在页面中可以看到有各种文件格式转换的类型,可以根据自己的需求进行转换,OCR并不属于其中的所展现的类型,所以,选择“更多操作”
在“更多操作”中我们可以看到最上面的就是有关OCR的,我们选择第二个“PDFOCR识别”
点击后,将需要进行识别的PDF文件添加道右侧页面中
文件添加后,下面有一些选项设置,你过你需要识别的是整个PDF 文件,那么就选择“全部”,如果是识别指定的某一页,那么根据自己的需求去设置
最后就是点击开始转换,完成转换后我们可以直接打开文件,利用OCR识别后的PDF文件会直接转换成Word可编辑文档,所以说就有点类似于将PDF文件转换成Word形式。