开放下载《Python爬虫实战与机器学习应用》电子书

一、目录大纲 第1章、开始之前 5 1.1、这本书说了什么 5 1.2、这本书适合谁 6 1.3、这本书的代码运行环境 6 1.5、读者应当具备以下基础知识: …

开源一个Python文档写作系统:MrDoc

一、为什么写MrDoc 从2016年底到今天,州的先生在博客上写了一百来篇文章,其中有不少的都是连载类型的系列教程。在积累了一定数量的文章之后,就打算将其整理为…

使用loguru进行高效的Python控制台输出和日志记录

是否每次调试输出还在使用print(),是否每次想为程序配置一个日志记录器,却被自带的logging模块中各种处理器、过滤器、格式化器折腾得没有兴趣。 今天,介…

3分钟Pandas实战之拼接数据

拼接数据在数据处理分析中是一个很常见的操作,使用Pandas同样可以很方便地进行数据拼接,直接使用其concat()方法,将数据帧用列表包裹起来,就可以得到一个…

Python编写一个验证码图片数据标注GUI程序

做验证码图片的识别,不论是使用传统的ORC技术,还是使用统计机器学习或者是使用深度学习神经网络,都少不了从网络上采集大量相关的验证码图片做数据集样本来进行训练。…

APScheduler定时任务中调用keras模型异常报错的解决方法

最近借助Keras训练了一个用于识别图片验证码的模型,后期需要使用APScheduler模块来实现定时任务,在任务中会调用训练好的Keras模型。 在正常情况下…

MrDoc更新发布v0.2版,优化修复一大波功能

MrDoc在三个月前发布了第一版,得到了很多小伙伴的支持和鼓励 最近州的先生针对一些反馈的Bug和规划,更新优化了一波功能,具体如下所述: 一、首页样式优化 之…

Python图片验证码降噪处理实例

图片验证码算是网络数据采集上的一道拦路虎,虽然有诸多公开的ORC接口、云打码平台,一旦大规模应用起来,还是内部写程序进行识别处理比较好。 而自己写代码进行识别的…

扒源码看透Google投放的超实惠电话卡广告猫腻

州的先生最近在网上面向搜索引擎编程,无意中在一个问答网站上看到一个诱惑力极大的Google广告,经不住诱惑的我,兴奋地点了进去…… 性价比极高的电话卡 12元一…

3分钟Pandas实战之加载MongoDB数据

MongoDB作为一个NoSQL型的数据库,在很多场景下都有广泛的应用。Pandas中提供了诸如read_sql()的数据库数据读取方法,但是其只适用于关系型数…

3分钟Pandas实战之加载Excel文件数据

3分钟Pandas实战系列,每个3分钟左右的视频,带来一个Pandas方法的实例演示,今天是加载Excel文件数据到pandas中。 现实场景下,我们很多零散的…

使用Python对数据进行AES加密和解密

随着网络上爬虫的横行和猖獗,各大网站为了最大限度地限制自家数据被采集,纷纷加入了各种反爬手段,比如: 生成浏览器UA指纹识别; 用各种验证方式(短信、滑块、点选…

PyQt5/PySide2的按钮控件使用实例

在之前的文章中,我们介绍了PyQt5和PySide2中主窗口控件MainWindow的使用、窗口控件的4中基础布局管理。从本篇开始,我们来了解一下PyQt5和P…

Django自定义模板过滤器演示实例

Django本身附带的模板系统提供了大量的内建标签和过滤器供我们在开发的时候使用。这些标签和过滤器涵盖了Django Web开发过程中常见的各种模板处理场景,但…

PySide2/PyQt5的4种基础布局管理

在上一篇文章中,我们介绍了Qt for Python中主窗口控件MainWindow()的基本使用。 主窗口控件就像是房屋中的户型和结构,是一个图形界面程序最原…