ocr基础入门到毕业

1 篇文章 0 订阅
订阅专栏

ocr基础入门到毕业

1.背景

最近为了实现读取图片文字,在网上也是各种查询资料,下载软件,遇到各种坑,总结一下

相关资源下载:
https://download.csdn.net/download/u011376439/11460005

2.安装

tesseract下载地址: https://digi.bib.uni-mannheim.de/tesseract/

注意: 安装版本推荐3.05。
路过的坑1:tesseract-ocr-setup-3.02.02:在文字库合并的时候,会导致合并后字库识别出来都是空的。

1.双击运行“tesseract-ocr-setup-3.02.02.exe”tesseract ocr 中文版开始安装软件,点击“是”。

在这里插入图片描述

2.根据下面图片上的教程,连续点击“next”。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

3.目录结构:

在这里插入图片描述

4.配置环境变量:

第一步:在环境变量界面的系统变量中找到Path,点击编辑,新建一个D:\Tesseract\tesseract-ocr–4.00.00dev\Tesseract-OCR(你的安装目录),然后确定。
第二步:在系统变量下面新建一个变量,然后确定。
变量名:TESSDATA_PREFIX
变量值:D:\Tesseract\tesseract-ocr–4.00.00dev\Tesseract-OCR\tessdata(安装目录下的tessdata文件夹)

在这里插入图片描述
在这里插入图片描述

5.检验环境变量是否配置成功:打开cmd命令行,在任意路径,输入“tesseract”,出现下面信息则表示配置成功。

在这里插入图片描述

3.tesseract-OCR初认识

-l lang
使用的语言。如果没有指定,则采用英文。可以指定多种语言,由加号字符分隔。Tesseract使用3个字符的ISO 639-2语言代码。(请参阅语言)

–psm N将Tesseract设置为只运行布局分析的一个子集并假定某种形式的图像。N的选项是:

0 =只有方向和脚本检测(OSD)。
1 =使用OSD自动分页。
2 =自动分页,但没有OSD或OCR。
3 =全自动页面分割,但没有OSD。(默认)
4 =假设一列可变大小的文本。
5 =假设一个统一的垂直排列文本块。
6 =假设一个统一的文本块。
7 =将图像作为单个文本行处理。
8 =将图像视为一个单词。
9 =将图像视为一个圆圈中的单个单词。
10 =将图像视为单个字符。

3.1 开始操作

识别图片:fw.png
在这里插入图片描述

tesseract imagename outputbase [-l lang] [-psm pagesegmode] [configfile…]

tesseract 图片名 输出文件名 -l 字库文件 -psm pagesegmode 配置文件

tesseract .\fw.png result -l chi_sim

运行成功:
在这里插入图片描述
打开result.txt 结果为:寮叉果命中 +10%
显然只是识别一部分而已。。。。
顺便把-psm 0-10都试了一遍,也是没有一个正确的结果。。。

3.2 开始训练自己的字库

直接看这文章就可以实现

Tesseract-OCR-04-使用 jTessBoxEditor 提高文字识别准确率

4.tesseract-OCR字库合并

训练完一个box,后续又发现新的需要训练,要是在把原来的图片在弄一遍,那就要崩溃了,幸好tesseract-OCR提供字库合并(别安装3.02的版本,会合并不了)
1.准备
先准备以下的文件,要合并的.box和.tif文件,命名规则
chi.font.exp[x].box 和 chi.font.exp[x].tif
[x]可以按序号来,方便以后合并字库
.box和.tif文件的由来,请看上一个步骤
在这里插入图片描述
这里的font文件内容为

fout 0 0 0 0 0

这里的box.bat内容为

tesseract chi.font.exp0.tif chi.font.exp0 nobatch box.train  
tesseract chi.font.exp1.tif chi.font.exp1 nobatch box.train

unicharset_extractor chi.font.exp0.box chi.font.exp1.box

mftraining -F font -U unicharset -O unicharset chi.font.exp0.tr chi.font.exp1.tr 
cntraining chi.font.exp0.tr chi.font.exp1.tr 


echo Rename Files..
rename normproto mlzh.normproto
rename inttemp mlzh.inttemp
rename pffmtable mlzh.pffmtable
rename shapetable mlzh.shapetable
rename unicharset mlzh.unicharset

combine_tessdata mlzh.    

pause

上面都准备好了,就可以运行box.bat文件了,结果如下
在这里插入图片描述
在这里插入图片描述
生成mlzh.traineddata 字库,就是合并后的字库了,复制到Tesseract-OCR\tessdata ,就可以试试看,新字库是否好用。。。

tesseract .\fw.png result -l chi_sim+mlzh

结果如下,合并成功
在这里插入图片描述

OCR文字识别基础
m0_47405013的博客
01-25 1532
ocr文字识别
综述:OCR简单入门
热门推荐
MrCharles在CSDN
12-18 1万+
简介 OCR或光学字符识别是最早解决的计算机视觉任务之一,因为在某些方面它不需要深度学习。因此,即使在2012年深度学习热潮之前,就有不同的OCR实现方式,有些甚至可以追溯到1914年。 这使许多人认为OCR挑战已“解决 ”,不再是挑战。另一种类似信念是,OCR不需要深度学习,换句话说,将深度学习用于OCR实在是太大材小用了。 任何从事计算机视觉或一般机器学习的人都知道,没有什么挑战现在可以确定是...
OCR(基础学习)
dayday学习的博客
07-16 793
OCR竞赛实践1.基础环境下载2.下载预测模型3.测试预测4. finetue OCR (Optical Character Recognition,光学字符识别)是最早的计算机视觉任务之一。人类使用电子设备(图像采集装置)采集现实场景中打印的字符,然后通过检测字符的形状,用字符识别的方法将其翻译成计算机文字。 1.基础环境下载 python -m pip install paddlepaddle-gpu -i https://mirror.baidu.com/pypi/simple 2.下载预测模型 m
OCR基础
l15201的博客
07-17 3518
1、什么是OCROCR英文全称是Optical Character Recognition,中文叫做光学字符识别。它是利用光学技术和计算机技术把印在或写在纸上的文字读取出来,并转换成一种计算机能够接受、人又可以理解的格式。文字是不可或缺的视觉信息来源。相对于图像/视频中的其他内容,文字往往包含更强的语义信息,因此对图像中的文字提取和识别具有重大意义。 文字识别是计算机视觉研究领域的分支之一,而且这个课题已经是比较成熟了,并且在商业中已经有很多落地项目了。虽然很多企业都有能力开始从事OCR的各种任务,
OCR识别系列之一-----基础介绍
wangmengmeng99的博客
04-03 1536
OCR中文又叫光学字符识别,它是利用光学技术和计算机技术将目标上的文字信息提取出来。
SpringBoot项目(百度AI整合)——如何在Springboot中使用文字识别OCR入门_springboot ocr
2401_84263262的博客
04-18 809
/ 注意这里仅为了简化编码每一次请求都去获取access_token,线上环境access_token有过期时间, 客户端可自行缓存,过期后重新获取。2.如何阅读官网的说明文档,小经验分享;* “words”:“爱我中华”}],* 以下为官网的案例,token的方式。* 读取文件内容,作为字符串返回。* 读取文件内容,作为字符串返回。BaiduOcrPro实体类。* 图像相关的 AipOcr。// 可选:设置网络连接参数。// 传入可选参数调用接口。* 百度相关的配置文件。* OCR相关的配置。
基于OCR和搜索技术实现医学文献智能识别检索系统Java源码+数据库sql.zip
05-30
基于OCR和搜索技术实现医学文献智能识别检索系统Java源码+数据库sql.zip基于OCR和搜索技术实现医学文献智能识别检索系统Java源码+数据库sql.zip基于OCR和搜索技术实现医学文献智能识别检索系统Java源码+数据库sql....
OCR样本生成器python源码+项目说明(可自动生成用于训练OCR检测和识别模型的图片样本和标注).zip
最新发布
10-09
【3】项目具有较高的学习借鉴价值,不仅适用于小白学习入门进阶。也可作为毕设项目、课程设计、大作业、初期项目立项演示等。 【4】如果基础还行,或热爱钻研,可基于此项目进行二次开发,DIY其他不同功能,欢迎交流...
此项目完成了关于 NLP-Beginner自然语言处理入门练习 的所有任务.zip
03-17
自然语言处理入门练习 的所有任务(文本分类、信息抽取、知识图谱、机器翻译、问答系统、文本生成、Text-to-SQL、文本纠错、文本挖掘、知识蒸馏、模型加速、OCR、TTS、Prompt、embedding等),所有代码都经过测试… ...
CUDA从入门到放弃(九):CUDA错误处理(Error Handling)
2401_84009773的博客
04-20 474
cudaSuccess:表示操作成功,其值为0。cudaErrorInvalidValue:表示函数接收到了一个无效的值,其值为1。cudaErrorMemoryAllocation:表示内存分配失败,其值为2。cudaErrorInitializationError:表示初始化错误,其值为3。cudaErrorCudartUnloading:表示CUDA运行时正在卸载,其值为4。……
文字识别OCR开发包
08-09
文字识别OCR开发包,并且有例子和文档,供大家学习,包括文字识别OCR开发包和Demo两个文件夹
tesseract-ocr-setup-4.0.0
09-29
esseract-ocr-setup-4.0.0,经过测试可以正常使用。 esseract-ocr-setup-4.0.0,经过测试可以正常使用。
Halocn OCR识别入门学习
JiYuee Note
05-06 323
一、建立OCR库 dev_close_window() read_image(Image,'OCR') get_image_size(Image,Width,Hight) dev_open_window(0,0,Width,Hight,'black',Window) dev_display(Image) *字符处理 rgb1_to_gray(Image,ImageGray) *鼠标画你要找的...
三步即可完成的OCR入门 | Python版
Warmer_Sweeter
10-25 604
点击关注我哦一篇文章带你了解三步即可完成的OCR入门在《这篇文章》中,我们有简单提到“Optical Character Recognition(OCR)”的相关内容,本文将对OCR进行...
OCR程序开发也可以如此简单
qiedabeng8686的博客
09-15 2044
OCR程序开发也可以如此简单 作者:程序媛Danny 最近工作中涉及到一部分文档和纸质文档的校验工作,就想把纸质文件拍下来,用文字来互相校验。想到之前调用有道智云接口做了文档翻译。看了下OCR文字识别的API接口,有道提供了多种OCR识别的不同接口,有手写体、印刷体、表格、整题识别、购物小票识别、身份证、名片等。干脆这次就继续用有道智云接口做个小demo,把这些功能都试了试,当练手,也当为以后的可能用到的功能做准备了。 调用API接口的准备工作 首先,是需要在有道智云的个人页面上创建实例、创建应用、绑定应
OCR文字识别怎么使用?几个步骤教会你
LiChenglee的博客
01-28 1926
相信很多小伙伴平时接触过文字识别但是并没有了解过OCR功能。接着在图片上拉取需要识别的范围,不用提前进行裁剪区域了,如果图片中的顺序方向有误还可以进行旋转图片操作,设置完成后点击底部的“立即识别”按钮完成操作。第二步:进入文字识别功能后,应用会调用移动设备储存空间的图片文件,在这里可以勾选需要进行识别文字内容的图片,单次最多可导入30张图片,点击右上角的【导入】按钮即可。第一步:首先我们在移动设备中打开这款识别应用,进入应用首页后可以看到热门功能下有一个【相册识别】功能,点击该功能即可进入文字识别操作。
前端(二十五)——前端实现 OCR 图文识别的详细步骤与示例代码
杜永康的博客
10-26 9809
什么是OCR?它是一种将印刷体和手体文字转换为可编辑和可搜索的电子文本的技术。OCR通过将图像或扫描文件中的文字识别并转录成机器可读的文本格式,从而实现自动化的文字识别和提取。OCR技术可以应用于各种场景,包括文字文档的扫描与转录、数字化图书馆、自动化数据录入、机器翻译、自动化表单填写等。OCR技术可以极大地提高处理文档和数据的效率,使得文字信息更容易访问和利用。在现代应用程序中,OCR(Optical Character Recognition)技术被广泛应用于将图像转换为可编辑的文本数据。
OCR框架整理
Jason 的专栏
08-16 2274
  泰比ABBYY OCR SDK开发包   Asprise OCR     1. OCR简介 OCR(Optical Character Recognition)——是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。...
从零写CRNN文字识别 —— (3)数据加载器
qq_37668436的博客
02-04 1471
简介 上一节实现了加载配置,加载配置文件可以方便的进行参数的修改,这一节实现加载数据。 DataLoader 我使用的数据是MLT2017的数据集,在其中把法语的分割出来了,数据集下载地址:法语OCR识别数据集 其中解压后包含训练集图片文件夹、测试集图片文件夹、训练集标签文件和测试集标签文件以及字典文件。 数据可以放置在工程的data文件夹下或者你喜欢的位置,加载数据的代码自然就放在data文件夹下,命名dataset.py: import torch.utils.data as data # 加载torc
毕业设计项目:中文票据OCR识别系统源码解析
毕业设计项目是一个利用计算机视觉和光学字符识别(OCR)技术对中文票据进行扫描识别的实践应用。项目基于Python语言,采用了OpenCV库进行图像预处理,以及Tesseract OCR引擎进行文字识别。项目成果包括完整的源...
写文章

热门文章

  • ocr基础入门到毕业 870
  • spark与elasticsearch整合netty冲突 714

分类专栏

  • spark 1篇
  • ocr 1篇

大家在看

  • 基于OpenMV与STM32的数据通信项目
  • 深度学习个人笔记
  • QFile 使用详解 174

最新文章

  • spark与elasticsearch整合netty冲突
2019年2篇

目录

目录

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

玻璃钢生产厂家玻璃钢鹿动物雕塑价格北海承接玻璃钢雕塑厂家台州景区玻璃钢雕塑嘉峪关动物玻璃钢雕塑价格梅州玻璃钢卡通雕塑尺寸玻璃钢卡通雕塑定做玻璃钢雕塑海豚玻璃钢动物马模型雕塑江西南昌玻璃钢卡通雕塑公司玻璃钢雕塑 鹿白山玻璃钢雕塑雕花玻璃钢仿铜雕塑工艺手法唐山玻璃钢雕塑找哪家山东酒店玻璃钢卡通形象雕塑送儿当红军玻璃钢群雕塑多少钱泰安校园玻璃钢雕塑玻璃钢佛像雕塑培训公司武汉玻璃钢五金艺术品雕塑上海哪里有卖玻璃钢花盆店门口玻璃钢玩偶雕塑专业定制玻璃钢彩绘雕塑电话福建玻璃钢雕塑订做深圳卡通玻璃钢雕塑施工哪家好浮雕玻璃钢人物雕塑福建常用商场美陈采购阜新玻璃钢雕塑设计商场美陈新年淮南玻璃钢雕塑市场合肥玻璃钢龙雕塑设计商场街道美陈香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声单亲妈妈陷入热恋 14岁儿子报警汪小菲曝离婚始末遭遇山火的松茸之乡雅江山火三名扑火人员牺牲系谣言何赛飞追着代拍打萧美琴窜访捷克 外交部回应卫健委通报少年有偿捐血浆16次猝死手机成瘾是影响睡眠质量重要因素高校汽车撞人致3死16伤 司机系学生315晚会后胖东来又人满为患了小米汽车超级工厂正式揭幕中国拥有亿元资产的家庭达13.3万户周杰伦一审败诉网易男孩8年未见母亲被告知被遗忘许家印被限制高消费饲养员用铁锨驱打大熊猫被辞退男子被猫抓伤后确诊“猫抓病”特朗普无法缴纳4.54亿美元罚金倪萍分享减重40斤方法联合利华开始重组张家界的山上“长”满了韩国人?张立群任西安交通大学校长杨倩无缘巴黎奥运“重生之我在北大当嫡校长”黑马情侣提车了专访95后高颜值猪保姆考生莫言也上北大硕士复试名单了网友洛杉矶偶遇贾玲专家建议不必谈骨泥色变沉迷短剧的人就像掉进了杀猪盘奥巴马现身唐宁街 黑色着装引猜测七年后宇文玥被薅头发捞上岸事业单位女子向同事水杯投不明物质凯特王妃现身!外出购物视频曝光河南驻马店通报西平中学跳楼事件王树国卸任西安交大校长 师生送别恒大被罚41.75亿到底怎么缴男子被流浪猫绊倒 投喂者赔24万房客欠租失踪 房东直发愁西双版纳热带植物园回应蜉蝣大爆发钱人豪晒法院裁定实锤抄袭外国人感慨凌晨的中国很安全胖东来员工每周单休无小长假白宫:哈马斯三号人物被杀测试车高速逃费 小米:已补缴老人退休金被冒领16年 金额超20万

玻璃钢生产厂家 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化