开放下载《Python爬虫实战与机器学习应用》电子书

一、目录大纲 第1章、开始之前 5 1.1、这本书说了什么 5 1.2、这本书适合谁 6 1.3、这本书的代码运行环境 6 1.5、读者应当具备以下基础知识: …

开源一个Python文档写作系统:MrDoc

一、为什么写MrDoc 从2016年底到今天,州的先生在博客上写了一百来篇文章,其中有不少的都是连载类型的系列教程。在积累了一定数量的文章之后,就打算将其整理为…

利用Python内置方法实现字符串的秘钥加解密

在实际编程开发中,我们会使用到各类的加密算法来对数据和信息进行加密。比如密码中比较常见的MD5加密,以及AES加密等等。 对于密码认证来说,MD5加密是比较适合…

观点|我为什么支持中文编程?

2019年11月18号知乎热榜上有一个问题:“为什么有这么多人执著于中文编程?”,当时正在地铁上看到,百无聊赖就在手机上回答的几句: 中世纪的欧洲信教民众要购买…

借助Djongo模块在Django中使用MongoDB数据库

Django框架为我们提供了简洁方便的ORM模型供我们对数据库进行各种操作,但是这个“数据库”却并不包括NoSQL的典型——MongoDB。随着互联网产业的发展…

使用loguru进行高效的Python控制台输出和日志记录

是否每次调试输出还在使用print(),是否每次想为程序配置一个日志记录器,却被自带的logging模块中各种处理器、过滤器、格式化器折腾得没有兴趣。 今天,介…

3分钟Pandas实战之拼接数据

拼接数据在数据处理分析中是一个很常见的操作,使用Pandas同样可以很方便地进行数据拼接,直接使用其concat()方法,将数据帧用列表包裹起来,就可以得到一个…

Python编写一个验证码图片数据标注GUI程序

做验证码图片的识别,不论是使用传统的ORC技术,还是使用统计机器学习或者是使用深度学习神经网络,都少不了从网络上采集大量相关的验证码图片做数据集样本来进行训练。…

APScheduler定时任务中调用keras模型异常报错的解决方法

最近借助Keras训练了一个用于识别图片验证码的模型,后期需要使用APScheduler模块来实现定时任务,在任务中会调用训练好的Keras模型。 在正常情况下…

MrDoc更新发布v0.2版,优化修复一大波功能

MrDoc在三个月前发布了第一版,得到了很多小伙伴的支持和鼓励 最近州的先生针对一些反馈的Bug和规划,更新优化了一波功能,具体如下所述: 一、首页样式优化 之…

Python图片验证码降噪处理实例

图片验证码算是网络数据采集上的一道拦路虎,虽然有诸多公开的ORC接口、云打码平台,一旦大规模应用起来,还是内部写程序进行识别处理比较好。 而自己写代码进行识别的…

扒源码看透Google投放的超实惠电话卡广告猫腻

州的先生最近在网上面向搜索引擎编程,无意中在一个问答网站上看到一个诱惑力极大的Google广告,经不住诱惑的我,兴奋地点了进去…… 性价比极高的电话卡 12元一…

3分钟Pandas实战之加载MongoDB数据

MongoDB作为一个NoSQL型的数据库,在很多场景下都有广泛的应用。Pandas中提供了诸如read_sql()的数据库数据读取方法,但是其只适用于关系型数…

3分钟Pandas实战之加载Excel文件数据

3分钟Pandas实战系列,每个3分钟左右的视频,带来一个Pandas方法的实例演示,今天是加载Excel文件数据到pandas中。 现实场景下,我们很多零散的…

使用Python对数据进行AES加密和解密

随着网络上爬虫的横行和猖獗,各大网站为了最大限度地限制自家数据被采集,纷纷加入了各种反爬手段,比如: 生成浏览器UA指纹识别; 用各种验证方式(短信、滑块、点选…