利用百度AI OCR图片识别，Java实现PDF中的图片转换成文字

AdolphLWQ 发布于2019-08-16 18:40 / 3225人阅读

摘要：二方案实现百度平台获取该平台限制调用次数，作为个人开发者来说，基本上是够用了。代码实现逻辑思路读取文件，然后读取中包含的图片，将图片传给百度平台去进行识别，返回结果解析。

序言：我们在读一些PDF版书籍的时候，如果PDF中不是图片，做起读书笔记的还好；如果PDF中的是图片的话，根本无法编辑，做起笔记来，还是很痛苦的。我是遇到过了。我们搞技术的，当然得自己学着解决现在的痛点。

一. 现状

为了不重复造轮子，当然得看看现在市面上是否有已经实现过的，如果有，那自然是拿来即用。

首先，说说一些在线版的PDF图片转文字，对文件大小有限制为2M(似乎有很多的文件处理都是限制在这个数)，超过了便要收费了。

第二，那就是WPS的PDF图片转文字了。别说大小限制了，直接是收费。

二. 方案实现 2.1 百度AI平台获取AppID, API Key, Secret Key

该平台限制调用次数，作为个人开发者来说，基本上是够用了。

Java SDK文档使用说明: https://ai.baidu.com/docs#/OCR-Java-SDK/top

不清楚的，可以去看文档。

2.2 代码实现

逻辑思路：读取PDF文件，然后读取PDF中包含的图片，将图片传给百度AI平台去进行识别，返回结果解析。

第一步：新建一个Demo的Maven工程

省略....（相信大家都会哈）

GPU云服务器云服务器 java图片文字识别ocr ocr图片识别api 免费语音识别成文字在线语音识别成文字

文章版权归作者所有，未经允许请勿转载,若此文章存在违规行为，您可以联系管理员删除。

转载请注明本文地址：https://www.ucloud.cn/yun/75536.html

iOS利用OpenCV 实现文字行区域提取的尝试

摘要：这是坐标百度，好像没啥好研究的了，不过出于好奇还是想知道使用是如何做到把文字区域进行框选的，所以接下来我们就看看如何在上使用实现图片中的文字框选。一些探索最近下了几个OCR的App（比如白描），发现可以选中图片中的文字行逐行转成文字，觉得很有意思(当然想用要花钱啦)，想着自己研究一下实现原理，google之后，发现了两个库，一个是OpenCV，在机器视觉方面应用广泛，图像分析必备利器。另一...

番茄西红柿 2019-05-23 15:18 评论0 收藏0
Python图像处理之图片文字识别（OCR）

摘要：与介绍将图片翻译成文字一般被称为光学文字识别，。是目前公认最优秀最精确的开源系统。我们以图片为例输入命令识别结果如下只识别错了一个字，识别率还是不错的。最后加一句，对于彩色图片的识别效果没有黑白图片的效果好。 OCR与Tesseract介绍将图片翻译成文字一般被称为光学文字识别（Optical Character Recognition，OCR）。可以实现OCR 的底层库并不多，...

W4n9Hu1 2019-07-30 16:48 评论0 收藏0