博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
python实现中文验证码识别方法(亲测通过)
阅读量:6235 次
发布时间:2019-06-22

本文共 1263 字,大约阅读时间需要 4 分钟。

验证码截图如下:

 

# coding:utf-8 from PIL import Image,ImageEnhance import pytesseract #上面都是导包,只需要下面这一行就能实现图片文字识别 im = Image.open('merge_source.jpg') #下面为增强部分 enh_con = ImageEnhance.Contrast(im) contrast = 1.5 image_contrasted = enh_con.enhance(contrast) #image_contrasted.show() #增强亮度 enh_bri = ImageEnhance.Brightness(image_contrasted) brightness = 1.5 image_brightened = enh_bri.enhance(brightness) #image_brightened.show() #增强对比度 enh_col = ImageEnhance.Color(image_brightened) color = 1.5 image_colored = enh_col.enhance(color) #image_colored.show() #增强锐度 enh_sha = ImageEnhance.Sharpness(image_colored) sharpness = 3.0 image_sharped = enh_sha.enhance(sharpness) #image_sharped.show() #灰度处理部分 im2=image_sharped.convert("L") im2.show() text=pytesseract.image_to_string(im2,lang='chi_sim').strip() #使用image_to_string识别验证码 print(text) 打印结果:

 

 知识扩展:

1.需要安装的库Pillow 库(PIL)和pytesseract ,安装方式直接通过pip安装

2.需要安装windows版本的TesseractOCRiOS(光学字符识别)程序,下载地址:http://xza.198424.com/tesserract.zip

   特别注意,ocr安装完成后需要配置环境变量

 ① 在安装位置时,需要在语言选择

  

    展开,找到简体中文进行勾选,如果有其他字体需要也可以勾选安装,语言会安装到安装目录下的tessdata文件夹中

  

 

 ① tesseract的环境变量 C:\Program Files (x86)\Tesseract-OCR ,根据实际安装位置填写

 ②C:\Program Files (x86)\Tesseract-OCR\tessdata

 

#打码的路上还很长

转载于:https://www.cnblogs.com/VseYoung/p/python_verifycode.html

你可能感兴趣的文章
一键源码安装Ansible
查看>>
Raid磁盘阵列
查看>>
复分析学习10——Liouville定理及其应用
查看>>
【HDOJ】1348 Wall【计算几何-凸包】
查看>>
Activating Browser Modes with Doctype
查看>>
个人作业-Alpha项目测试
查看>>
日志分析软件
查看>>
wamp集成环境开启虚拟主机多站点功能
查看>>
leetcode462
查看>>
java web学习总结(二十二) -------------------简单模拟SpringMVC
查看>>
前端框架——Jquery——基础篇6__动画效果
查看>>
物资管理
查看>>
Linux用户权限指令, 定时任务等指令
查看>>
自定义Activity漂亮跳转效果
查看>>
SQL 批量更新
查看>>
flex属性值flex-grow/flex-shrink/flex-basis
查看>>
深入理解计算机操作系统(十一)
查看>>
2016年总结
查看>>
leecode---39---数组,dfs,回溯法---求所有的组合为target,数字无重复
查看>>
oracle 学习摘记
查看>>