The Best Image Ocr SDK For BAT.

OBKoro1 发布于2019-06-28 13:55 / 2116人阅读

摘要：默认为是否返回识别结果中每一行的置信度通用文字识别含生僻字版中英文混合默认为是否检测图像朝向是否返回文字外接多边形顶点位置，不支持单字位置。

The Best Image Ocr SDK For BAT.

百度 OCR

通用文字识别

通用文字识别（高精度版）

通用文字识别（含位置信息版）

通用文字识别（含位置高精度版）

通用文字识别（含生僻字版）

网络图片文字识别

银行卡识别

身份证识别

驾驶证识别

行驶证识别

车牌识别

营业执照识别

通用票据识别

Aliyun OCR

身份证识别

行驶证识别

驾驶证识别

门店识别

英文识别

营业执照识别

银行卡识别

名片识别

火车票识别

车牌识别

通用文字识别

Tencent OCR

名片识别

身份证识别

行驶证驾驶证识别

通用印刷体识别

项目地址 https://github.com/godruoyi/ocr

Feature

自定义缓存支持；

符合 PSR 标准，可以很方便的与你的框架结合；

命名不那么乱七八糟；

支持目前市面多家服务商

Support

百度 OCR

腾讯万象优图

阿里 OCR

Requirement

PHP > 5.6

composer

Installation

composer require godruoyi/ocr

Laravel 5 拓展包

Usage

基本使用（以百度OCR为例）

use GodruoyiOCRApplication;

$app = new Application([
    "ocrs" => [
        "baidu" => [
            "app_key" => "app_key",
            "secret_key" => "secret_key"
        ],
    ]
]);

//身份证识别
$result = $app->baidu->idcard($filePath);

返回结果

{
    "log_id": 530427582,
    "image_status": "normal",
    "words_result_num": 6,
    "words_result": {
        "住址": {
            "words": "上海市闵行区华漕镇红卫村宗家巷1号"
        },
        "出生": {
            "words": "19870723"
        },
        "姓名": {
            "words": "鹿晗"
        },
        "公民身份号码": {
            "words": "123456789123456132X"
        },
        "性别": {
            "words": "男"
        },
        "民族": {
            "words": "汉"
        }
    }
}

各平台支持的方法

详情请参考官方文档

所有平台支持的方法中，都满足以下结构：

$app->platform->$method($files, $options = [])

$files 的值可以为

文件路径（完整）

SplFileInfo 对象

Resource

在线图片地址（部分服务商不支持）

Array

注：options 的值都是可选的

百度OCR

目前采用 AccessToken 作为 API 认证方式，查看鉴权认证机制

通用文字识别

$app->baidu->generalBasic($file, [
    "language_type"         => "CHN_ENG",  //支持的语言，默认为CHN_ENG（中英文混合）
    "detect_direction"      => false,      //是否检测图像朝向
    "detect_language"       => false,      //是否检测语言，默认不检测
    "probability"           => false,      //是否返回识别结果中每一行的置信度
]);

通用文字识别（高精度版）

$app->baidu->accurateBasic($file, [
    "detect_direction"      => false,      //是否检测图像朝向
    "probability"           => false,      //是否返回识别结果中每一行的置信度
]);

通用文字识别（含位置信息版）

$app->baidu->general($file, [
    "recognize_granularity" => "big",      //是否定位单字符位置
    "language_type"         => "CHN_ENG",  //CHN_ENG：中英文混合；默认为CHN_ENG
    "detect_direction"      => false,      //是否检测图像朝向
    "detect_language"       => false,      //是否检测语言，默认不检测
    "vertexes_location"     => false,      //是否返回文字外接多边形顶点位置，不支持单字位置。默认为false
    "probability"           => false,      //是否返回识别结果中每一行的置信度
]);

通用文字识别（含位置高精度版）

$app->baidu->accurate($file, [
    "recognize_granularity" => "big",      //是否定位单字符位置
    "detect_direction"      => false,      //是否检测图像朝向
    "vertexes_location"     => false,      //是否返回文字外接多边形顶点位置，不支持单字位置。默认为false
    "probability"           => false,      //是否返回识别结果中每一行的置信度
]);

通用文字识别（含生僻字版）

$app->baidu->generalEnhanced($file, [
    "language_type"         => "CHN_ENG",  //CHN_ENG：中英文混合；默认为CHN_ENG
    "detect_direction"      => false,      //是否检测图像朝向
    "vertexes_location"     => false,      //是否返回文字外接多边形顶点位置，不支持单字位置。默认为false
    "probability"           => false,      //是否返回识别结果中每一行的置信度
]);

网络图片文字识别

$app->baidu->webimage($file, [
    "detect_direction"      => false,      //是否检测图像朝向
    "detect_language"       => false,      //是否检测语言，默认不检测
]);

身份证识别

$app->baidu->idcard($file, [
    "detect_direction"      => false,      //是否检测图像朝向
    "id_card_side"          => "front",    //front：身份证正面；back：身份证背面 （注意，该参数必选）
    "detect_risk"           => false,      //是否开启身份证风险类型功能，默认false
]);

银行卡识别

$app->baidu->bankcard($file, [
]);

驾驶证识别

$app->baidu->drivingLicense($file, [
    "detect_direction"      => false,      //是否检测图像朝向
]);

行驶证识别

$app->baidu->vehicleLicense($file, [
    "detect_direction"      => false,      //是否检测图像朝向
    "accuracy"              => "normal"    // normal 使用快速服务，1200ms左右时延,缺省或其它值使用高精度服务，1600ms左右时延
]);

车牌识别

$app->baidu->licensePlate($file, [
    "multi_detect"          => false,      //是否检测多张车牌，默认为false
]);

营业执照识别

$app->baidu->businessLicense($file, [
]);

通用票据识别

$app->baidu->receipt($file, [
    "recognize_granularity" => "big",      //是否定位单字符位置
    "probability"           => false,      //是否返回识别结果中每一行的置信度
    "accuracy"              => "normal"    // normal 使用快速服务，1200ms左右时延,缺省或其它值使用高精度服务，1600ms左右时延
    "detect_direction"      => false,      //是否检测图像朝向
]);

Aliyun OCR

目前采用 APPCODE 作为 API 认证方式，查看我的APPCODE

use GodruoyiOCRApplication;

$app = new Application([
    "ocrs" => [
        "aliyun" => [
            "appcode" => "40bc103c7fe6417b87152f6f68bead2f",
        ]
    ]
]);

阿里云OCR不支持在线图片地址

身份证识别

$app->aliyun->idcard($file, [
    "side"                  => "face",     //身份证正反面类型:face/back
]);

行驶证识别

$app->aliyun->vehicle($file, [
]);

驾驶证识别

$app->aliyun->driverLicense($file, [
    "side"                  => "face",     //驾驶证首页/副页:face/back
]);

门店识别

$app->aliyun->shopSign($file, [
]);

英文识别

$app->aliyun->english($file, [
]);

营业执照识别

$app->aliyun->businessLicense($file, [
]);

银行卡识别

$app->aliyun->bankCard($file, [
]);

名片识别

$app->aliyun->businessCard($file, [
]);

火车票识别

$app->aliyun->trainTicket($file, [
]);

车牌识别

$app->aliyun->vehiclePlate($file, [
    "multi_crop"            => false,     //当设成true时,会做多crop预测，只有当多crop返回的结果一致，并且置信度>0.9时，才返回结果
]);

通用文字识别

$app->aliyun->general($file, [
    "min_size"              => 16,       //图片中文字的最小高度，
    "output_prob"           => false,    //是否输出文字框的概率，
]);

Tencent OCR

可登录云API密钥控制台查看你的个人 API 密钥

use GodruoyiOCRApplication;

$app = new Application([
    "ocrs" => [
        "tencent" => [
            "app_id" => "1254032478",
            "secret_id" => "AKIDzODdB1nOELz0T8CEjTEkgKJOob3t2Tso",
            "secret_key" => "6aHHkz236LOYu0nRuBwn5PwT0x3km7EL",
            "bucket" => "test1"
        ],
    ]
]);

Tencent OCR 暂不支持在线图片地址

名片识别

$app->tencent->namecard($file, [
    "ret_image"             => 0,        //0 不返回图片，1 返回图片，
]);

身份证识别

$app->tencent->idcard($file, [
    "card_type"             => 0,        //0 为身份证有照片的一面，1为身份证有国徽的一面
]);

行驶证驾驶证识别

$app->tencent->drivingLicence($file, [
    "type"                  => 0,        //识别类型，0表示行驶证，1表示驾驶证，
]);

通用印刷体识别

$app->tencent->general($file, [
]);

文章版权归作者所有，未经允许请勿转载,若此文章存在违规行为，您可以联系管理员删除。

转载请注明本文地址：https://www.ucloud.cn/yun/25959.html

[译]OpenCV OCR and text recognition with Tesseract

摘要：纳入深度学习模型来进一步提升准确率只是时间问题，事实上，这个时间已经到来。最新版本支持基于深度学习的，准确率显著提高。该函数使用基于深度学习的文本检测器来检测不是识别图像中的文本区域。高效使用概率最高的文本区域，删除其他重叠区域。 By Adrian Rosebrock on September 17, 2018 in Deep Learning, Optical Character ...

gnehc 2019-07-31 10:11 评论0 收藏0
识别图片中的文字 - Tesseract 和百度云OCR的对比

摘要：一个简单的图片转文字的函数实现如下。百度云这是偶然的发现，百度云提供了一定额度的免费的，目前是每日次，做做研究或者小应用还勉强够用，本文主要为了测试其效果。论中文，还是百度比谷歌更懂一点。当今时代人工智能都已经是烂大街的词了，OCR应该也很多人都知道。 OCR （Optical Character Recognition，光学字符识别）是指电子设备（例如扫描仪或数码相机）检查纸上打印...

mushang 2019-07-30 15:26 评论0 收藏0
Tesseract 进行图像识别

摘要：目前已作为开源项目发布在，其最新版本已经支持中文，并提供了一个命令行工具。他能够用来识别英文，但是不能识别中文。所以要下载中文的识别包这样就能识别中文。至少对印刷的中文字识别效果是很好的。 1. Tesseract 介绍 Tesseract的OCR引擎最先由HP实验室于1985年开始研发，至1995年时已经成为OCR业内最准确的三款识别引擎之一。然而，HP不久便决定放弃OCR业务，Te...

Tecode 2019-08-15 12:27 评论0 收藏0