大家好,我是Echa。
光学字符识别(Optical Character Recognition, OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。亦即将图像中的文字进行识别,并以文本的形式返回。
光学字符识(OCR)别技术应用
提高效率:OCR技术相比传统的人工方式,能够更快实现信息录入。
降低成本:以机器代替人工,能够节省人力成本的开销。
适用性强:OCR技术能够实现多场景和多语言的识别,还能通过提取图像中的文本分析其所包含的语义信息,为机器理解图像提供高层语义线索。
OCR技术的特点
OCR的应用场景
OCR的应用场景
借此机会,小编今天又给大家好物分享17个超级实用OCR开源项目,涉及各个应用场景,覆盖人、车、OCR等9大经典识别场景、在CPU上可3毫秒实现急速识别、一行代码就可实现迭代训练的项目。希望对大家对OCR有新的认识和帮助。同时祝愿每一个粉丝都能拥有一份健康的身体,每天都能有充沛的精力去实现自己的梦想。
Gitee:https://gitee.com/admin_yu/yx-image-recognition
基于spring boot + maven + opencv 实现的图像深度学习Demo项目,包含车牌识别、人脸识别、证件识别等功能,贯穿样本处理、模型训练、图像处理、对象检测、对象识别等技术点
Gitee:https://gitee.com/liuruoze/EasyPR
EasyPR是一个开源的中文车牌识别系统,其目标是成为一个简单、高效、准确的非限制场景(unconstrained situation)下的车牌识别库。
相比于其他的车牌识别系统,EasyPR有如下特点:
假设我们有如下的原始图片,需要识别出中间的车牌字符与颜色:
经过EasyPR的第一步处理车牌检测(PlateDetect)以后,我们获得了原始图片中仅包含车牌的图块:
接着,我们对图块进行OCR过程,在EasyPR中,叫做字符识别(CharsRecognize)。我们得到了一个包含车牌颜色与字符的字符串:
“蓝牌:苏EUK722”
Gitee:https://gitee.com/MeiHuSDK/meihu-meiyan
美狐美颜sdk,满足客户在直播平台实现美颜效果、短视频系统自带美颜特效等众多音视频软件业务场景的美化需求的第三方美颜api,是以人脸识别、人脸关键点技术为核心,提供专业级实时美颜、大眼瘦脸、美颜滤镜、动态贴纸、美白磨皮、美型、萌颜等特效的接口,以打造多功能视频美颜软件为目标。
Gitee:https://gitee.com/kuaikuaikim/dface
基于多任务卷积网络(MTCNN)和Center-Loss的多人实时人脸检测和人脸识别系统。
DFace 是个开源的深度学习人脸检测和人脸识别系统。所有功能都采用 pytorch 框架开发。pytorch是一个由facebook开发的深度学习框架,它包含了一些比较有趣的高级特性,例如自动求导,动态构图等。DFace天然的继承了这些优点,使得它的训练过程可以更加简单方便,并且实现的代码可以更加清晰易懂。 DFace可以利用CUDA来支持GPU加速模式。
Gitee:https://gitee.com/zeusees/HyperLPR
HyperLRP是一个开源的、基于深度学习高性能中文车牌识别库,支持PHP、C/C++、Python语言,Windows/Mac/Linux/Android/IOS 平台。
Gitee:https://gitee.com/endlesshh/idCardCv
idCardCv 身份证号码识别,适用于web端身份证识别服务器,前端进行身份证号码定位,后端精准处理识别,准确率在96左右,对于自治区的身份证前面有其他文字的一样可以识别。
Gitee:https://gitee.com/kdldbq/verification-decoder
通过训练CNN(卷积神经网络)对4位验证码识别,其中字符有0-9a-zA-Z共计62种,但是预测结果不区分大小写,所以最终预测结果为36种。验证码由多个字体、颜色、干扰线随机生成。
使用TensorFlow,CNN识别4位字符验证码,60万次训练,90.02%正确率
以下是对100万张训练验证码进行训练,20万张不参与训练的测试验证码测试出的结果
一般的验证码系统都会去掉类似的字符(例如:i, l, o, 1, 0...),为了更全面的测试,所以我选择将这些难以识别的字符也添加进去测试,可以看出有这些难以辨别的字符时,连人类也很难去完全预测正确(下图,第一行为预测值,第二行为真实值)
训练60万次时的结果:
Gitee:https://gitee.com/xiaohaoo/medicine-identification
中药识别系统主要采用APP端拍照上传的方式,构建卷积神经网络(CNN)对图像进行识别,具有识别效率高,准确度高的特点。APP端的功能包括但不限于拍照识别、中药问答(付费咨询)、检索查询、中药性状以及功效查看、方剂智能推荐【开发中】等;本系统包含APP端以及服务器端。
Gitee:https://gitee.com/open-visual/face-search
本项目是阿里云视觉智能开放平台的人脸搜索M:N的开源替代,项目中使用的模型均为开源模型,项目支持opensearch、milvus和proxima向量存储库,并具有较高的自定义能力。
Gitee:https://gitee.com/paddlepaddle/PaddleDetection
PaddleDetection是一个基于PaddlePaddle的目标检测端到端开发套件,在提供丰富的模型组件和测试基准的同时,注重端到端的产业落地应用,通过打造产业级特色模型|工具、建设产业应用范例等手段,帮助开发者实现数据准备、模型选型、模型训练、模型部署的全流程打通,快速进行落地应用。
Gitee:https://gitee.com/endlesshh/red5-rtmp-push
天网人脸识别系统,获取视频流 进行人脸识别后推送到流媒体服务器实时展示
整个系统共有两个项目组成
系统截图
Gitee:https://gitee.com/open-visual/open-anpr
Gitee:https://gitee.com/microic/tr
一款针对扫描文档的离线文本识别SDK,核心代码全部采用C++开发,并提供Python接口
Gitee: https://gitee.com/jiang_maowei/car
基于pytorch深度学习框架,使用开源模型yolov4实现模板检测与yolov5实现车牌检测与LPRNet实现车牌检测
基于win10系统,使用anaconda配置python环境,在anaconda里面下载vscode对项目进行编辑,
Gitee:https://gitee.com/rockyzheng/document-ocr
一个相对完整的文档分析和识别项目含以下五部分:
数据从网络抓取的公开上市公司年报数据 PDF 文件解析生成,有图片和文本的位置信息
Gitee:https://gitee.com/CV_Lab/gradio_yolov5_det
基于Gradio的YOLOv5通用目标检测演示系统,可自定义检测模型、演示便捷、安装简单
Gitee:https://gitee.com/damone/mobile-lpr
Mobile-LPR 是一个面向移动端的准商业级车牌识别库,以NCNN作为推理后端,使用DNN作为算法核心,支持多种车牌检测算法,支持车牌识别和车牌颜色识别。
流程图
一行代码,可能会创造出下一个让人惊叹的产品;一个创新,可能会开启一个全新的科技时代;一份初心,可能会影响到无数人的生活;无论是在大公司工作,还是在小团队奋斗;无论是资深的程序员,还是刚刚入行的新手;每个人的代码,都有力量改变世界。
网页名称:17个超级实用OCR开源项目
链接分享:http://www.shufengxianlan.com/qtweb/news43/469993.html
网站建设、网络推广公司-创新互联,是专注品牌与效果的网站制作,网络营销seo公司;服务项目有等
声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 创新互联