《深入浅出OCR》第一章:OCR技术导论

《深入浅出OCR》第一章介绍了OCR技术的基本概念、发展历程、应用场景和技术流程。OCR,即光学字符识别,是计算机视觉的重要组成部分,应用于金融、交通、教育等领域。文章详细阐述了OCR的识别难点,如自然场景识别和文档文字识别,并提出了解决办法,如数据增强和多任务学习。同时,提到了常见OCR数据集和识别模型的评估,以及主流OCR应用平台。未来,OCR大模型的发展将带来新的机遇与挑战。
摘要由CSDN通过智能技术生成

在这里插入图片描述

专栏介绍: 经过几个月的精心筹备,本作者推出全新系列《深入浅出OCR》专栏,对标最全OCR教程,具体章节如导图所示,将分别从OCR技术发展、方向、概念、算法、论文、数据集等各种角度展开详细介绍。

👨‍💻面向对象: 本篇前言知识主要介绍深度学习知识,全面总结知知识点,方便小白或AI爱好者学习基础知识。

💚友情提醒: 本文内容可能未能含概深度学习所有知识点,其他内容可以访问本人主页其他文章或个人博客,同时因本人水平有限,文中如有错误恳请指出,欢迎互相学习交流!

💙个人主页: GoAI |💚 公众号: GoAI的学习小屋 | 💛交流群: 704932595 |💜个人简介 : 掘金签约作者、百度飞桨PPDE、领航团团长、开源特训营导师、CSDN、阿里云社区人工智能领域博客专家、新星计划计算机视觉方向导师等,专注大数据与人工智能知识分享。

💻文章目录

在这里插入图片描述

💻文章目录

《深入浅出OCR》前言知识(二):深度学习基础总结 (✨文末有深度学习总结导图福利!)

《深入浅出OCR》前言知识(一):机器学习基础总结 (✨文末有机器学习总结导图福利!)

《深入浅出OCR》第一章:OCR技术导论 (本篇)


👨‍💻本篇导读: 本篇为《深入浅出OCR》第一章:OCR技术导论主要介绍OCR的概念、分类、应用场景、技术流程、数据集等基础知识进行介绍,方便小白或AI爱好者快速了解OCR方向知识。第二章将对OCR技术展开进一步详细介绍,欢迎大家关注!

《深入浅出OCR》第一章:OCR技术导论

一、OCR概念介绍

OCR是计算机视觉研究领域的分支之一,是计算机科学的重要组成部分。OCR (Optical Character Recognition,光学字符识别)是指电子设备检查纸上打印的字符,经过检测暗、亮的模式肯定其形状,而后用字符识别方法将形状翻译成计算机文字的过程。

简单来说,OCR识别是指通过图像处理和模式识别技术对光学的字符进行识别成我们可以处理的文字信息。 比如日常生活中,我们使用微信长按图片进行识别以提取文字信息用于生活交流,就是用到OCR技术,接下来我将跟大家介绍下OCR的发展历程。

image.png

二、OCR发展历程

image.png

关于OCR技术发展历程,本人大致将其分为以下几类:

  1. 概念提出: OCR的概念是在1929年由德国科学家Tausheck最早提出来的,后来美国科学家Handel也提出利用技术对文字进行识别想法。最先对印刷体汉字识别进行研究的是IBM公司,于1966年发表第一篇关于汉字识别的文章,采用模板匹配法识别印刷体汉字。

  2. 发展研究: 早在60、70年代,世界各国就开始有OCR的研究,而研究的初期,多以文字的识别方法研究为主,且识别的文字仅为0至9的数字。以日本为例,1960年左右开始研究OCR的基本识别理论,初期以数字为对象,直至1965至1970年之间开始有一些简单的产品,如印刷文字的邮政编码识别系统。

  3. 形成产品: 在70年代,中国开始对数字、英文字母及符号识别进行研究,1986年,我国提出“863”高新科技研究计划,汉字识别的研究进入一个实质性阶段,相继推出中文OCR产品。早期OCR软件,因为识别率、硬件设备成本高及产品化等多方面的因素,未能达到实际要求。

  4. 百花齐放: 进入20世纪90年代之后,随着信息自动化普及,大大推进了OCR技术的进一步发展,使OCR的识别正确率和速度满足广大用户需求。随着人工智能技术不断发展,OCR软件产品已趋于成熟,可以识别各类语言、各类场景下识别,代表有全能扫描王、天若OCR等。

三、OCR的应用场景

3.1 OCR产品应用

衡量一个OCR系统性能好坏的主要指标有:拒识率、误识率、识别速度、用户界面的友好性,产品的稳定性,易用性及可行性等。

image.png

OCR产品在商业价值上具有广泛的应用场景,打造一款成熟的OCR产品需要考虑从基础资源到设备接入各个环节,因此各大互联网公司纷纷推出相关技术支持或应用,覆盖金融、交通、教育、医疗等多个行业领域。具体应用场景包括但不限于:

  1. 金融领域: OCR技术可以用于银行卡识别、身份证识别、发票和收据识别,以加快客户开户、贷款申请和账单处理等金融服务流程。
  2. 物流和交通领域: OCR技术可用于快递单和车牌识别,以提高物流运营效率和交通管理效率。
  3. 教育领域: OCR可用于试卷批改和答题卡识别,自动化评分和统计学生成绩。
  4. 医疗领域: OCR技术可以用于医疗记录和处方识别,帮助医疗机构提高信息管理效率。
  5. 商业和广告领域: OCR可以用于广告牌、商品包装袋、营业证等文本的识别,帮助企业更好地进行广告推广和品牌管理。
  6. 名片扫描: OCR技术可用于扫描名片并将其转换为联系人信息,方便用户管理和整理。

3.2 OCR识别分类

根据OCR的应用场景而言,OCR可以大致分成识别特定场景下的专用识别和多种(自然和复杂)场景下的通用识别。其中证件识别以及车牌识别是专用OCR的典型案例。

image.png

按照识别场景划分,可分为:

  • 文档文字识别:可以将图书馆、报社、博物馆、档案馆等的纸质版图书、报纸、杂志、历史文献档案资料等进行电子化管理,实现精准地保存文献资料。

  • 自然场景文字识别:识别自然场景图像中的文字信息如车牌、广告干词、路牌等信息。对车辆进行识别可以实现停车场收费管理、交通流量控制指标测量、车辆定位、防盗、高速公路超速自动化监管等功能。

  • 票据文字识别:可以对增值税发票、报销单、车票等不同格式的票据进行文字识别,可以避免财务人员手动输入大量票据信息,如今已广泛应用于财务管理、银行、金融等众多领域。。

  • 证件识别:可以快速识别身份证、银行卡、驾驶证等卡证类信息,将证件文字信息直接转换为可编辑文本,可以大大提高工作效率、减少人工成本、还可以实时进行相关人员的身份核验,以便安全管理。

按照文字形成方式划分,可分为:

  • 标准印刷体文字的识别(包括印刷体数字、汉字、英文);

  • 手写文字的识别(包括手写数字、汉字、英文);

  • 即存在印刷体又存在手写体的文字识别

  • 艺术体、合成文字等复杂字体识别

image.png

总结:经过上述分类,我们可以了解到不同文字的应用场景可能包含了多种文字的形成方式,文字的形成方式又包含了文字的字体,最终形成一张包含文本的图像来让我们识别,因此识别起来会有不同的难度,因此。接下来我们将对OCR难点进行讨论。

3.3 OCR识别难点

OCR识别场景包括传统文档图像识别与场景文本识别技术。针对特定场景进行设计、优化以达到最好的特定场景下的效果展示。而通用OCR则使用在更多、更复杂的场景下,拥有比较好的泛性。由于场景的不确定性,比如:图片背景极其丰富、亮度不均衡、光照不均衡、残缺遮挡、文字扭曲、字体多样等等问题,会给识别效果带来极大的挑战。
在这里插入图片描述

3.3.1 自然场景识别难点:

自然场景下的文本通常出现在复杂的背景中,且文本的字体、颜色、大小和方向都可能不同。例如路标、广告牌和商品包装等。
不同于传统的扫描图像文本,自然场景文本因表现形式丰富,图像背景复杂,以及图像拍摄引入的干扰因素等的影响,其识别的难点包括但不限于以下几个方面:

  • 图片背景多变: 经常面临低亮度、低对比度、光照不均、透视变形和残缺遮挡等问题,还可能会受到噪声的影响,例如风沙、雨雪等天气条件,以及拍摄设备本身的噪声等,使得对其的分析与处理难度远高于传统的扫描文档图像。

  • 文字弯曲: 文本的布局可能存在扭曲、褶皱、换向等问题,其中的文字也可能字体多样、字号字重颜色不一的问题。

  • 文本格式: 自然场景中的文字数量较多,且分布较为分散,这使得算法的训练难度加大。针对长文本,需要处理文本行之间的连续性和上下文关系。针对多行文本,需要进行有效的文本区域分割和识别。

  • 数据规模与资源 为训练和优化深度学习OCR模型,需要大规模的数据集和充足的计算资源。然而,自然场景OCR数据集往往比较难以获取和标注,同时深度学习模型的训练也需要较大的计算开销。

3.3.2 文档文字识别难点

尽管普通文档识别相较于场景文本识别来说通常难度较小,但在特定领域中仍存在许多挑战。例如,针对票据扫描的目标检测,由于扫描仪分辨率低、纸张和油墨质量差等因素的影响,导致所扫描的票据质量低下。此外,字体过小以及干扰文本也是需要考虑的问题。

此外,针对复杂场景(复杂版面、数学公式、表格、结构化符号/图形等)的识别效果仍存在一定提升空间。

3.4 识别难点解决办法

关于上述不同场景OCR技术面临许多挑战,需要更强大算法来应对文本的多样性和背景的复杂性。那么我们从那些角度入手解决上述问题呢?

以下为作者简单列出几点通用的解决方法,:

  1. 数据增强: 通过对训练数据进行增强,如随机旋转、缩放、裁剪、变换和加噪声等,可以使OCR模型更好地适应不同的图像条件和多样性。
  2. 多尺度检测: 设计多尺度的检测模型可以在不同大小和分辨率的文本实例中进行检测,从而提高对不同文本大小和形状的适应性。
  3. 背景抑制: 采用背景抑制技术,通过将注意力集中在文本区域,忽略或减弱背景干扰,从而提高文本检测的准确性。
  4. 多任务学习: 将文本检测和识别任务结合起来进行多任务学习,可以更好地处理复杂场景中的文本实例,并提高整体性能。
  5. 引入先验知识: 利用先验知识,如字符形状、文本的统计信息等,对文本进行建模,可以提高对复杂文本实例的理解和识别。
  6. 迁移学习|强化学习: 使用迁移学习或强化学习技术来优化OCR模型,使其能够在不同场景下进行更好的适应和调整。

四、OCR技术流程

上述介绍完OCR识别难点及对应解决办法,接下来我们将着重对OCR技术流程进行介绍。典型的OCR技术pipline如下图所示:

其中,文本检测和识别是OCR技术的两个重要核心技术。

4.1 图像预处理:

图像预处理是OCR流程的第一步,用于提高字符识别的准确性。常见的预处理操作包括灰度化、二值化和去噪。

  • 灰度化将彩色图像转换为灰度图像,将每个像素的RGB值转换为相应的灰度值。在灰度图像中每个像素只有一个灰度值,简化后续的处理步骤。

  • 二值化将灰度图像转换为二值图像,将灰度值高于某个阈值的像素设为白色,低于阈值的像素设为黑色。这将图像转换为黑白二值图像,方便后续的文本定位和字符分割。

  • 去噪是为了减少图像中的噪声和干扰,以提高后续处理的准确性。常用的去噪方法包括中值滤波、高斯滤波和形态学操作。

此外,针对不规则文本识别,在预处理阶段可以先进行校正操作再进行识别。

4.2 文字检测

文本检测的任务是定位出输入图像中的文字区域。

image.png

近年来,使用深度学习进行文本检测成为主流技术,一类方法将文本检测视为目标检测中的一个特定场景,基于通用目标检测算法进行改进适配,如TextBoxes 基于一阶段目标检测器SSD 算法,调整目标框使之适合极端长宽比的文本行,CTPN则是基于Faster RCNN架构改进而来。但是文本检测与目标检测在目标信息以及任务本身上仍存在一些区别,如文本一般长宽比较大,往往呈“条状”,文本行之间可能比较密集,弯曲文本等,因此又衍生了很多专用于文本检测的算法,如EAST、PSENet、DBNet 等等。

注:文字检测具体介绍将在后续章节更新。

4.3 文字识别

文本识别的任务是识别出图像中的文字内容。

文本识别一般输入来自于文本检测得到的文本框截取出的图像文字区域。文本识别一般可以根据待识别文本形状分为规则文本识别和不规则文本识别两大类。不规则文本场景具有很大的挑战性,也是目前文本识别领域的主要研究方向。

  • 规则文本主要指印刷字体、扫描文本等,文本大致处在水平线位置,如下图左半部分;

  • 不规则文本往往不在水平位置,存在弯曲、遮挡、模糊等问题,如下图右半部分。

image.png

注:文字识别具体介绍将在后续章节更新。

五、OCR常见数据集

5.1 数据集介绍

image.png

5.1.1 规则数据集
  • IIIT5K-Words (IIIT) 2000 for Train; 3000 for Test
  • Street View Text (SVT) 257 for Train; 647 for Test
  • ICDAR 2003(IC03) 、ICDAR2013 (IC13)

以ICDAR2013为例:

该数据集由500张左右英文标注的自然场景图片构成,标注形式为两点水平标注,坐标格式为左上角,和右下角,
image.png

5.1.2 不规则数据集
  • ICDAR2015 (IC15) 4468 for Train; 2077 for Test;
  • SVT Perspective (SP) 645 for Test
  • CUTE80 (CT) 288 for Test

以ICDAR2015为例:

该数据集由1500张(训练1000,测试500)英文标注的自然场景图片构成,标注形式为四点标注,坐标格式依次为为左上角,右上角,右下角和左下角。如下图所示:

image.png

5.1.3 合成数据集

SynthText(ST) 5.5million个图像,样例图如下:

image.png

5.1.4中文场景数据集

Chinese Text in the Wild (CTW):

image.png

CTW数据集是一个针对中文场景文本的数据集,用于文本检测和识别任务。CTW数据集包含了超过40,000张高分辨率的中文场景图像,这些图像从不同来源和环境中获取,具有广泛的多样性。

注:以上仅简单列举部分数据集,具体介绍将在后续章节更新。

六、常见OCR识别模型评估对比

注:评价指标为准确率。

Regular DatasetIrregular dataset
ModelYearIIITSVTIC13(857)IC13(1015)IC15(1811)IC15(2077)SVTPCUTE
CRNN201578.280.8-86.7----
ASTER(L2R)201592.6791.16-90.7476.1-78.7676.39
CombBest201987.987.593.692.377.671.879.274
ESIR201993.390.2-91.3-76.979.683.3
SE-ASTER202093.889.6-92.88081.483.6
DAN202094.389.2-93.9-74.58084.4
RobustScanner202095.388.1-94.8-77.179.590.3
AutoSTR202094.790.9-94.281.8-81.7-
Yang et al.202094.788.9-93.279.577.180.985.4
SATRN202092.891.3-94.1-7986.587.8
SRN202094.891.595.5-82.7-85.187.8
GA-SPIN202195.290.9-94.882.879.583.287.5
PREN2D202195.69496.4-83-87.691.7
Bhunia et al.202195.292.2-95.5-8485.789.7
Luo et al.202195.690.6-96.083.981.485.191.3
VisionLAN202195.891.795.7-83.7-8688.5
ABINet202196.293.597.4-86.0-89.389.2
MATRN202196.794.997.995.886.682.990.594.1

七、主流OCR识别应用平台

  • 百度开放平台: PaddleOCR
  • 商汤科技OpenMMLab : MMOCR
  • 谷歌开源OCR引擎: Tesseract

后续系列将依次继续详细介绍,并包括使用上述框架进行OCR项目实战!

八、OCR资源推荐

作者整理了以下OCR方面的资源:

优秀OCR资源推荐:

  • OCR专栏: 《深度浅出OCR》
  • OCR合集: handong1587
  • Awesome-Scene-Text-Recognition

论文相关:

  • OCR论文更新 : 链接
  • 顶会会议文章:ICDAR、CVPR、ECCV、ICCV等
  • Arxiv搜索引擎: http://www.arxiv-sanity.com/

九、国内OCR领域优秀学者

白翔, 黄伟林, 金连文, 刘成林, 殷绪成
注:不分先后顺序

十、 OCR大模型未来发展

如今,大模型的爆火给OCR领域带来的挑战与机遇,在运用大模型前,我们要知道大模型是如何阅读文档的。因此,针对OCR的模型的设计仍然很重要。

发展与机遇

  • 将大模型运用到OCR领域,其识别精度可能不高,还没有大规模验证

  • 大模型仍有很多不足,不适用所有领域

  • 充分利用大模型:特征表示、语言能力

  • 不同任务的专用模型和学习算法:仍然大有可为

十一、OCR资料整理分享:

本篇文章最后,免费分享博主本人参考开源资料整理的OCR相关论文汇总,将其按年份、数据集、所属方法及论文关键词等信息进行全面分类总结,最近几年论文正在整理中,欢迎大家持续关注和学习交流!另外,文中如有错误,欢迎指正!

关注文章开头公众号: GoAI的学习小屋,回复“OCR论文” 获取以下表格。

image.png

总结:本篇《深入浅出OCR》第一章:OCR技术导论主要介绍OCR的概念、分类、应用场景、技术流程、数据集及资源等进行介绍。第二章将对OCR技术展开详细介绍,方便学习者快速了解OCR方向知识。

深入浅出OCR》实战:基于DBNet的文字检测
专注大数据与人工智能技术分享,欢迎私信加群互相学习!
10-20 1848
本篇导读:在上一章【《深入浅出OCR》第三章:OCR文字检测】,本人着重介绍文字检测算法的发展、分类及各自领域经典算法,为了进一步熟悉文字检测流程,本次作者将以基于DBNet的文字检测实战为例,全面对文字检测技术流程进行解读,方便学习者快速上手实战。
深入浅出OCR》第三章:OCR文字检测
专注大数据与人工智能技术分享,欢迎私信加群互相学习!
10-17 2169
上一章我们介绍到OCR流程包括两阶段算法和端到端算法,目前在通用场景识别效果下,两阶段OCR相比端到端OCR技术更成熟,所以工业界大多采用两阶段OCR。本篇为 【《深入浅出OCR》第三章:OCR文字检测】,主要对深度学习OCR文字检测方法进行介绍,本人将从经典算法结构、代码、论文解读等角度展开,配合作者总结的思维导图,深入浅出OCR知识。
OCR是什么,主要应用和未来发展趋势
最新发布
Daylighte的博客
07-01 1503
OCR,即光学字符识别(Optical Character Recognition),是一种能够将图像文件中的文字资料转化为电子文本技术。它广泛应用于多个领域,涉及的主要技术包括。
业内领先的OCR技术核心
ZsHua_18519103264的博客
08-22 304
悦保科技OCR识别引擎,基于机器视觉、自然语言处理等前沿AI技术,覆盖率,识别率,精准率处于行业领先地位 寿险保单识别支持76家,车险保单识别支持36家,均在持续增加中 ...
【独家】一文读懂文字识别OCR
weixin_34082789的博客
05-01 7432
前言 文字识别计算机视觉研究领域的分支之一,归属于模式识别人工智能,是计算机科学的重要组成部分 本文将以上图为主要线索,简要阐述在文字识别领域中的各个组成部分。 一 ,文字识别简介 计算机文字识别,俗称光学字符识别,英文全称是Optical Character Recognition(简称OCR),它是利用光学技术和计算机技术...
OCR文字检测与识别系统:融合文字检测、文字识别和方向分类器的综合解决方案
丨汀、的博客
08-31 5616
OCR文字检测与识别系统:融合文字检测、文字识别和方向分类器的综合解决方案
深入浅出OCR》第二章:OCR技术发展与分类
专注大数据与人工智能技术分享,欢迎私信加群互相学习!
10-01 2143
本篇为《深入浅出OCR第一章OCR技术导论主要介绍OCR的概念、分类、应用场景技术流程、数据集等基础知识进行介绍,方便小白或AI爱好者快速了解OCR方向知识。第二章将对OCR技术展开进一步详细介绍,欢迎大家关注!
深入浅出OCR》第五章:OCR端到端识别
专注大数据与人工智能技术分享,欢迎私信加群互相学习!
11-14 1517
上一章我们介绍到OCR流程包括两阶段算法和端到端算法,本篇为 **【《深入浅出OCR》第五章:端到端识别】,主要对深度学习端到端识别方法进行介绍**,本人将从经典算法结构、代码、论文解读等角度展开,配合作者总结的思维导图,深入浅出OCR知识。
OCR入门教程系列(一):OCR基础导论
热门推荐
专注大数据与人工智能技术分享,欢迎私信加群互相学习!
04-01 8万+
📝导读:本系列主要介绍计算机视觉领域OCR文字识别领域技术发展方向,面向深度学习同学,内容总计五章,每章将从OCR技术发展、概念、方法等各种角度展开详细介绍。第一篇介绍OCR概念及发展以及相关数据集,其次列出几种常见的OCR文本检测与文本识别技术,文章最后分享几种开源的OCR平台,后续系列文章将继续介绍OCR相关技术及实战演练。
OCR识别
如果没有最优解,那就找到可行解
07-22 251
1:识别处特定区域(这个步骤可以在特定的屏幕,车牌等场景下先用) 2:CTPN 用来对区域内的所有文件进行检测(自然场景下的)https://my.oschina.net/u/876354/blog/3047851 3:CRNN 用来对检测的的文本进行识别 ...
OCR人脸识别技术
06-14
该代码主要运用到现在主流的OCR识别技术,该技术运用到各个领域,想金融,政府机关部门身份检测,还有就是视频监控等多项各个领域。
c# OCR识别
10-30
可以识别英文 数字 中文。变形字体 要先进行图片处理后 OCR效果才会更好 。 TessactOcr.dll Sample) using OCR.TesseractWrapper; using TessactOcr; Bitmap bitmap = new Bitmap(text); //text:Image path TessNet ocr = new TessNet(); ocr.ePageSegMode = (int)ePageSegMode.PSM_SINGLE_WORD; ocr.eOcrEngineMode = (int)eOcrEngineMode.OEM_TESSERACT_CUBE_COMBINED; ocr.lang ="eng"; //"chi_sim" Chinese (Simplified) language ocr.SetTessractData(Environment.GetFolderPath(Environment.SpecialFolder.ProgramFiles)+ @"\tessdata\tessdata"); ocr.SetVariable("tessedit_char_whitelist","abcdefghijklmnopqrstuvwxyz"); string iden = ocr.ToCR(bitmap);
OCR识别源码
04-22
E语言环境下编写的OCR图文识别,还有中英文翻译功能,源码对于初学OCR的新手来说是个很好借鉴,上机编译可直接运行!
ocr识别
best_go_to_success的博客
06-05 1324
abc OCR在线识别 abc OCR在线识别 abc OCR在线识别 abc OCR在线识别 abc OCR在线识别 abc OCR在线识别 abc OCR在线识别 abc OCR在线识别 abc OCR在线识别 abc OCR在线识别 abc OCR在线识别
一文读懂什么是 OCR 识别
finovycloud的博客
02-27 2121
OCR 识别,即光学字符识别,是一种通过扫描和识别纸质文档上的文字,将其转换成计算机可编辑和处理的数字文本格式的技术。简单来说,OCR 识别就是将纸质文档上的文字“翻译”成电脑能读懂的文字。OCR 识别技术主要依赖于图像处理和模式识别算法,通过捕捉文档中的字符特征,如笔画、形状、大小、间距等,与预设的字符库进行比对,从而识别出相应的文字信息。
小白综述:深度学习 OCR 图片文字识别
qq_43799400的博客
01-03 8164
深度学习 OCR 图片文字识别简述
光学文字识别(OCR)
python伊甸园的博客
11-27 5074
一、什么是光学文字识别? 简单来说,就是将图片上的文字给识别出来,称为光学文字识别(Optical Character Recognition),简写为OCR。目前市面上这种库并不多,因为做这个需要很强的深度学习功底,而大多数人又不懂这个方面的内容,所以开源的库就更少了,公认的最优秀的开源的OCR库为谷歌赞助开发的Tesseract。 Tesseract是一个开源的OCR引擎,大家均可以免费使...
OCR入门教程系列(四):文字识别技术总结
专注大数据与人工智能技术分享,欢迎私信加群互相学习!
04-09 1万+
导读:在上一篇文章中我们对文字检测各类算法进行总结,本篇将继续介绍OCR领域文字识别理论部分的研究,将从规则文本及不规则文本文字识别进行展开,主要介绍主流文字识别相关算法。
自动化测试中的图像识别OCR技术
AI天才研究院
01-21 1182
1.背景介绍 在自动化测试中,图像识别OCR技术起着至关重要的作用。这篇文章将深入探讨这两种技术的核心概念、算法原理、最佳实践、应用场景和工具推荐。 1. 背景介绍 自动化测试是软件开发过程中不可或缺的一部分,它旨在确保软件的质量和可靠性。在现代软件开发中,自动化测试通常涉及到大量的图像数据处理,例如用户界面的截图、条形码、二维码等。为了有效地处理这些图像数据,我们需要利用图像识别OCR...
写文章

热门文章

  • 深度学习知识点全面总结 266287
  • 机器学习知识点全面总结 138269
  • OCR入门教程系列(一):OCR基础导论 88248
  • Pytorch入门教程 39368
  • 大数据电影可视化系统 30530

分类专栏

  • 深入浅出AI 付费 113篇
  • 计算机视觉CV 付费 50篇
  • 深入浅出OCR 付费 54篇
  • 深入浅出多模态 付费 13篇
  • 深入浅出LLM 28篇
  • AI面经总结 19篇
  • 机器学习 39篇
  • 推荐系统 23篇
  • 自然语言处理NLP 15篇
  • AIGC 5篇
  • 图像分类 2篇
  • 目标检测 3篇
  • 图像分割 3篇
  • Pytorch 16篇
  • 论文笔记 4篇
  • 数据分析与数据挖掘 24篇
  • 大数据笔记 34篇
  • Hadoop相关 9篇
  • 大数据项目 10篇
  • Zookeeper 4篇
  • Hive 10篇
  • Spark 9篇
  • Flink 3篇
  • Flume 2篇
  • Kafka 2篇
  • Hbase 4篇
  • 数据结构与算法 3篇
  • 数据库 3篇
  • 面试 5篇
  • 程序人生 12篇
  • 编程语言 17篇
  • IDE使用教程 3篇
  • Linux 1篇

最新评论

  • AI面试指南:AI工具总结评测,助力求职季

    cc_cloud: 学习到了,比较有用的推荐,适合我找工作!

  • 助力求职!AI领域知识星球:GoAI的学习社区

    news_hhu: 感觉对找工作很有用,支持一下!

  • 最全AI领域专栏来啦,《深入浅出AI》重磅更新!

    My_namec: 试读文章不错,内容丰富,先支持一波。

  • 《深入浅出OCR》实战:基于PGNet的端到端识别

    爱思考的小朋友: 介绍的太浅显,

  • 机器学习笔记-LightGBM

    CSDN-Ada助手: 哇, 你的文章质量真不错,值得学习!不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性。

最新文章

  • 《深入浅出LLM基础篇》(五):Propmt工程优化(上)
  • AI面试指南:AI工具总结评测,助力求职季
  • 面经总结系列(十一): 吉利汽车大模型算法工程师
2024
10月 1篇
09月 9篇
08月 3篇
07月 2篇
06月 5篇
05月 10篇
04月 13篇
03月 5篇
02月 6篇
01月 1篇
2023年67篇
2022年45篇
2021年116篇
2020年52篇

目录

目录

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

GoAI

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或 充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

玻璃钢生产厂家肇庆定制玻璃钢雕塑贵州公园玻璃钢雕塑定做香坊玻璃钢雕塑定做衢州步行街玻璃钢雕塑销售电话南京定制玻璃钢雕塑品牌企业广州玻璃钢雕塑摆件采购SMC玻璃钢雕塑手绘菏泽城市玻璃钢雕塑订做南宁景区玻璃钢雕塑设计新绛玻璃钢花盆花器福建玻璃钢雕塑公司深圳节庆商场美陈销售企业玻璃钢人物雕塑订制绍兴玻璃钢马雕塑开封水景玻璃钢卡通雕塑武汉玻璃钢雕塑售价温州玻璃钢海豚雕塑定制湖南卡通玻璃钢雕塑景观装饰湖南现代人物玻璃钢雕塑山东步行街玻璃钢雕塑订做价格闵行区玻璃钢雕塑叶县玻璃钢雕塑加工厂家玻璃钢墙体雕塑图片玻璃钢大型不锈钢雕塑价格动物玻璃钢雕塑厂家哪家好玻璃钢园林雕塑哪家买玻璃钢雕塑定制杭州河源树脂玻璃钢雕塑制作上海主题商场美陈价钱榆林卡通玻璃钢雕塑公司香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声单亲妈妈陷入热恋 14岁儿子报警汪小菲曝离婚始末遭遇山火的松茸之乡雅江山火三名扑火人员牺牲系谣言何赛飞追着代拍打萧美琴窜访捷克 外交部回应卫健委通报少年有偿捐血浆16次猝死手机成瘾是影响睡眠质量重要因素高校汽车撞人致3死16伤 司机系学生315晚会后胖东来又人满为患了小米汽车超级工厂正式揭幕中国拥有亿元资产的家庭达13.3万户周杰伦一审败诉网易男孩8年未见母亲被告知被遗忘许家印被限制高消费饲养员用铁锨驱打大熊猫被辞退男子被猫抓伤后确诊“猫抓病”特朗普无法缴纳4.54亿美元罚金倪萍分享减重40斤方法联合利华开始重组张家界的山上“长”满了韩国人?张立群任西安交通大学校长杨倩无缘巴黎奥运“重生之我在北大当嫡校长”黑马情侣提车了专访95后高颜值猪保姆考生莫言也上北大硕士复试名单了网友洛杉矶偶遇贾玲专家建议不必谈骨泥色变沉迷短剧的人就像掉进了杀猪盘奥巴马现身唐宁街 黑色着装引猜测七年后宇文玥被薅头发捞上岸事业单位女子向同事水杯投不明物质凯特王妃现身!外出购物视频曝光河南驻马店通报西平中学跳楼事件王树国卸任西安交大校长 师生送别恒大被罚41.75亿到底怎么缴男子被流浪猫绊倒 投喂者赔24万房客欠租失踪 房东直发愁西双版纳热带植物园回应蜉蝣大爆发钱人豪晒法院裁定实锤抄袭外国人感慨凌晨的中国很安全胖东来员工每周单休无小长假白宫:哈马斯三号人物被杀测试车高速逃费 小米:已补缴老人退休金被冒领16年 金额超20万

玻璃钢生产厂家 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化