开放下载《Python爬虫实战与机器学习应用》电子书

一、目录大纲 第1章、开始之前 5 1.1、这本书说了什么 5 1.2、这本书适合谁 6 1.3、这本书的代码运行环境 6 1.5、读者应当具备以下基础知识: …

开源一个Python文档写作系统:MrDoc

一、为什么写MrDoc 从2016年底到今天,州的先生在博客上写了一百来篇文章,其中有不少的都是连载类型的系列教程。在积累了一定数量的文章之后,就打算将其整理为…

小巧、快速、稳定!我为什么选择使用Sqlite?

州的先生(https://zmister.com)在很多项目中都有使用到SQLite数据库作为数据存储的工具,其中包括一些桌面图形界面程序和线上的Web应用程序…

MrDoc v0.2.10,新增注册邀请码功能

不知不觉,MrDoc的更新已经走过了十几版。虽然更新不是很频繁,但是每次的更新都有功能的新增或是使用体验上的优化。 在本次v0.2.10的更新中,州的先生(zm…

办公自动化|使用Python对Excel表格文件进行批处理

在工作中经过会遇到大量格式一致,内容不同的Excel表格文件,需要将这里面的内容整理到一个Excel文件中的情形。一般情况下,都是将这些Excel表格文件一个一…

借助Turtle库在Python中绘制一个鼠年福鼠

turtle库是一个很经典的绘图库,其最初来自于1967年创造的logo编程语言,之后被Python编写放到了Python的内置模块中。网络上有很多借助于tur…

使用PyQt5/PySide2编写一个极简的音乐播放器

疫情肆虐,憋在家实在无聊,索性写点东西,于是就有了这个极极极极极简的音乐播放器。 这个极极极简的音乐播放器类似于“阅后即焚”的软件,播放器可以随机播放歌曲,获取…

利用Python内置方法实现字符串的秘钥加解密

在实际编程开发中,我们会使用到各类的加密算法来对数据和信息进行加密。比如密码中比较常见的MD5加密,以及AES加密等等。 对于密码认证来说,MD5加密是比较适合…

观点|我为什么支持中文编程?

2019年11月18号知乎热榜上有一个问题:“为什么有这么多人执著于中文编程?”,当时正在地铁上看到,百无聊赖就在手机上回答的几句: 中世纪的欧洲信教民众要购买…

借助Djongo模块在Django中使用MongoDB数据库

Django框架为我们提供了简洁方便的ORM模型供我们对数据库进行各种操作,但是这个“数据库”却并不包括NoSQL的典型——MongoDB。随着互联网产业的发展…

使用loguru进行高效的Python控制台输出和日志记录

是否每次调试输出还在使用print(),是否每次想为程序配置一个日志记录器,却被自带的logging模块中各种处理器、过滤器、格式化器折腾得没有兴趣。 今天,介…

3分钟Pandas实战之拼接数据

拼接数据在数据处理分析中是一个很常见的操作,使用Pandas同样可以很方便地进行数据拼接,直接使用其concat()方法,将数据帧用列表包裹起来,就可以得到一个…

Python编写一个验证码图片数据标注GUI程序

做验证码图片的识别,不论是使用传统的ORC技术,还是使用统计机器学习或者是使用深度学习神经网络,都少不了从网络上采集大量相关的验证码图片做数据集样本来进行训练。…

APScheduler定时任务中调用keras模型异常报错的解决方法

最近借助Keras训练了一个用于识别图片验证码的模型,后期需要使用APScheduler模块来实现定时任务,在任务中会调用训练好的Keras模型。 在正常情况下…

MrDoc更新发布v0.2版,优化修复一大波功能

MrDoc在三个月前发布了第一版,得到了很多小伙伴的支持和鼓励 最近州的先生针对一些反馈的Bug和规划,更新优化了一波功能,具体如下所述: 一、首页样式优化 之…

Python图片验证码降噪处理实例

图片验证码算是网络数据采集上的一道拦路虎,虽然有诸多公开的ORC接口、云打码平台,一旦大规模应用起来,还是内部写程序进行识别处理比较好。 而自己写代码进行识别的…