真实场景下的Tesseract4.0神经网络训练识别图片验证码

何谓“真实场景”,意即图片验证码来源于实际的数据采集过程中遇到的网站,对图片验证码的识别训练工作也是出自于真实的环境,而非像很多文章用一个验证码库生成好几万个验…

廖雪峰历时3个月打磨出价值1980的数据分析课程,终终终于免费啦!

从各大招聘网站中可以看到,今年招聘信息少了很多,但数据分析相关岗位有一定增加,而数据分析能力几乎已成为每个岗位的必备技能。 是什么原因让企业如此重视“数据人才”…

如何用Python实现一个全链路的舆情监控系统

舆情监控系统在过去几年曾是一个比较热门的话题,一般多被应用在政务领域、企业领域等,用于让企业、部门等单位及时获取和了解到网络上舆情的出现和发展,以便及时采取相应…

小巧、快速、稳定!我为什么选择使用Sqlite?

州的先生(https://zmister.com)在很多项目中都有使用到SQLite数据库作为数据存储的工具,其中包括一些桌面图形界面程序和线上的Web应用程序…

办公自动化|使用Python对Excel表格文件进行批处理

在工作中经过会遇到大量格式一致,内容不同的Excel表格文件,需要将这里面的内容整理到一个Excel文件中的情形。一般情况下,都是将这些Excel表格文件一个一…

借助Turtle库在Python中绘制一个鼠年福鼠

turtle库是一个很经典的绘图库,其最初来自于1967年创造的logo编程语言,之后被Python编写放到了Python的内置模块中。网络上有很多借助于tur…

利用Python内置方法实现字符串的秘钥加解密

在实际编程开发中,我们会使用到各类的加密算法来对数据和信息进行加密。比如密码中比较常见的MD5加密,以及AES加密等等。 对于密码认证来说,MD5加密是比较适合…

观点|我为什么支持中文编程?

2019年11月18号知乎热榜上有一个问题:“为什么有这么多人执著于中文编程?”,当时正在地铁上看到,百无聊赖就在手机上回答的几句: 中世纪的欧洲信教民众要购买…

使用loguru进行高效的Python控制台输出和日志记录

是否每次调试输出还在使用print(),是否每次想为程序配置一个日志记录器,却被自带的logging模块中各种处理器、过滤器、格式化器折腾得没有兴趣。 今天,介…

APScheduler定时任务中调用keras模型异常报错的解决方法

最近借助Keras训练了一个用于识别图片验证码的模型,后期需要使用APScheduler模块来实现定时任务,在任务中会调用训练好的Keras模型。 在正常情况下…

MrDoc更新发布v0.2版,优化修复一大波功能

MrDoc在三个月前发布了第一版,得到了很多小伙伴的支持和鼓励 最近州的先生针对一些反馈的Bug和规划,更新优化了一波功能,具体如下所述: 一、首页样式优化 之…

Python图片验证码降噪处理实例

图片验证码算是网络数据采集上的一道拦路虎,虽然有诸多公开的ORC接口、云打码平台,一旦大规模应用起来,还是内部写程序进行识别处理比较好。 而自己写代码进行识别的…

开放下载《Python爬虫实战与机器学习应用》电子书

一、目录大纲 第1章、开始之前 5 1.1、这本书说了什么 5 1.2、这本书适合谁 6 1.3、这本书的代码运行环境 6 1.5、读者应当具备以下基础知识: …

使用Python对数据进行AES加密和解密

随着网络上爬虫的横行和猖獗,各大网站为了最大限度地限制自家数据被采集,纷纷加入了各种反爬手段,比如: 生成浏览器UA指纹识别; 用各种验证方式(短信、滑块、点选…