Skip to content
/ Captcha-Recognition Public
  • Notifications You must be signed in to change notification settings
  • Fork 48
  • Star 152

基于深度学习和TensorFlow的英文和汉字验证码识别

152 stars 48 forks Branches Tags Activity
Star
Notifications You must be signed in to change notification settings

czczup/Captcha-Recognition

Branches Tags

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

28 Commits
docs
docs
 
 
level1
level1
 
 
level2
level2
 
 
level3
level3
 
 
level4
level4
 
 
level5
level5
 
 
.gitattributes
.gitattributes
 
 
.gitignore
.gitignore
 
 
README.md
README.md
 
 

Repository files navigation

深度学习识别各类验证码

背景介绍

  • 来源:第九届中国大学生服务外包创新创业大赛赛题A16-验证码识别
  • 整体背景:验证码识别是计算机与大数据领域一个非常重要的应用领域,其中包含了图像处理、机器视觉、模式识别以及人工智能等诸多前沿技术,这些同样也是大数据未来发展所必须的核心技术。本赛题以互联网中常见的验证码图片为样本,旨在通过此次竞赛,检验参赛者的图像识别能力,提高对计算机技术、算法模型的认识和应用能力,激发在图像处理、机器学习等领域的创新能力。
  • 公司背景:浪潮卓数大数据产业发展有限公司作为浪潮集团旗下的大数据板块,致力于成为数据资源提供商、数据资产运营商和数据交易服务商,以大数据时代的“数商”为发展目标,促进政府、企业和个人实现从互联网化向社会化,乃至数据社会化的转变。

项目说明

问题说明

提供 5 类验证码图片,难度依次递增,每一类验证码提供 1 万个训练样本,最后通过另外 5000 个测试样本的识别率评分。

第 1 类

数字四则运算,有噪点干扰,输出计算结果。

captcha1

第 2 类

英文字母+数字验证码,包含 5 个字符,有噪点干扰,文字无旋转形变,验证方法为要求用户输出验证码中的字符,大小写不限( 为验证方便可统一转为大写 )。

captcha2

第 3 类

英文字母+数字验证码,包含 4 个字符,有噪点干扰,文字有旋转形变,验证方法为要求用户输出验证码中的字符。

captcha3

第 4 类

中文验证码,包含 4 个中文汉字,有噪点干扰,验证方法为要求用户选出 4 个汉字中被旋转 90 度的那一个 (四个汉字从左到右序号为 0,1,2,3,输出被旋转的汉字序号即可) 。

captcha4

第 5 类

中文验证码,包含 4 个中文汉字和 9 个中文单字,有噪点干扰,文字有旋转形变,验证方法为要求用户从 9 个单字中从左到右按顺序选出验证码中的汉字,输出汉字编号。

captcha5

快速开始

  • 步骤一:环境准备

    Python 3.6、TensorFlow、Pillow、OpenCV

    pip install tensorflow-gpu==1.8
    pip install opencv-python
    pip install pillow
    
  • 步骤二:准备数据集

    下载地址: 百度网盘

    提取码:e6zy

    放置位置:

    • 训练集:level_/image/train
    • 测试集:level_/image/test
  • 步骤三:选择验证码类型

    • 第一类:数字四则运算,有噪点干扰,输出计算结果

    • 第二类:数字、英文,有噪点干扰,文字无旋转形变,输出数字、英文

    • 第三类:数字、英文,有噪点干扰,文字有旋转形变,输出数字、英文

    • 第四类:汉字,有噪点干扰,文字无旋转形变,输出汉字

    • 第五类:汉字,有噪点干扰,文字有旋转形变,输出汉字

最后

当时做这个项目的时候是第一次接触深度学习,看着吴恩达和炼数成金的视频课边学边做,真是特别有意思的一段时光。现在回头来看,当时设计的每类验证码识别模型都不同,准确率主要靠调参,确实挺ugly的。还记得答辩的时候评委问我,能不能做一个万能验证码识别模型,可惜当时学识浅陋,我答的“不行”,哈哈。

通过这次竞赛,成功让我入门了深度学习,特别感谢浪潮集团出的题和提供的奖金。当年这题获奖的名额超多的,浪潮真的财大气粗,若要参加服务外包竞赛,浪潮的题目超级推荐。验证码识别是特别好的深度学习入门案例,希望本仓库能给刚入门的你提供一些帮助。

About

基于深度学习和TensorFlow的英文和汉字验证码识别

Topics

tensorflow captcha-recognition chinese-captcha english-captcha

Resources

Readme
Activity

Stars

152 stars

Watchers

3 watching

Forks

48 forks
Report repository

Releases

No releases published

Packages

No packages published

Languages

  • Python 100.0%

Footer

© 2024 GitHub, Inc.

玻璃钢生产厂家江西玻璃钢雕塑品石家庄时尚玻璃钢面包雕塑三门峡玻璃钢彩绘雕塑制作厂家昌邑玻璃钢关公雕塑平顶山玻璃钢商场美陈厂家东城区商场美陈图纸泡沫雕塑玻璃钢怎么做通道商场美陈有哪些上海拉丝玻璃钢雕塑免费咨询南宁户外玻璃钢雕塑贵州玻璃钢雕塑作品四川玻璃钢花盆厂家兰州商场开业美陈芜湖佛像玻璃钢雕塑销售厂家深圳欧式玻璃钢雕塑厂家哪家好鹤壁学校校园玻璃钢雕塑饶阳人物玻璃钢雕塑洪江玻璃钢胸像雕塑徐州玻璃钢雕塑定制沈阳玻璃钢雕塑工程报价菏泽校园玻璃钢雕塑定制玻璃钢佛像雕塑定做玻璃钢雕塑价格厂家电话广东仿铜玻璃钢雕塑哪家便宜山东商场主题创意商业美陈费用马村玻璃钢雕塑加工厂家日照玻璃钢牌匾雕塑玻璃钢雕塑报价一览表商场美陈灯饰画德阳商场美陈花器香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声单亲妈妈陷入热恋 14岁儿子报警汪小菲曝离婚始末遭遇山火的松茸之乡雅江山火三名扑火人员牺牲系谣言何赛飞追着代拍打萧美琴窜访捷克 外交部回应卫健委通报少年有偿捐血浆16次猝死手机成瘾是影响睡眠质量重要因素高校汽车撞人致3死16伤 司机系学生315晚会后胖东来又人满为患了小米汽车超级工厂正式揭幕中国拥有亿元资产的家庭达13.3万户周杰伦一审败诉网易男孩8年未见母亲被告知被遗忘许家印被限制高消费饲养员用铁锨驱打大熊猫被辞退男子被猫抓伤后确诊“猫抓病”特朗普无法缴纳4.54亿美元罚金倪萍分享减重40斤方法联合利华开始重组张家界的山上“长”满了韩国人?张立群任西安交通大学校长杨倩无缘巴黎奥运“重生之我在北大当嫡校长”黑马情侣提车了专访95后高颜值猪保姆考生莫言也上北大硕士复试名单了网友洛杉矶偶遇贾玲专家建议不必谈骨泥色变沉迷短剧的人就像掉进了杀猪盘奥巴马现身唐宁街 黑色着装引猜测七年后宇文玥被薅头发捞上岸事业单位女子向同事水杯投不明物质凯特王妃现身!外出购物视频曝光河南驻马店通报西平中学跳楼事件王树国卸任西安交大校长 师生送别恒大被罚41.75亿到底怎么缴男子被流浪猫绊倒 投喂者赔24万房客欠租失踪 房东直发愁西双版纳热带植物园回应蜉蝣大爆发钱人豪晒法院裁定实锤抄袭外国人感慨凌晨的中国很安全胖东来员工每周单休无小长假白宫:哈马斯三号人物被杀测试车高速逃费 小米:已补缴老人退休金被冒领16年 金额超20万

玻璃钢生产厂家 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化