开源一个Python文档写作系统:MrDoc

一、为什么写MrDoc 从2016年底到今天,州的先生在博客上写了一百来篇文章,其中有不少的都是连载类型的系列教程。在积累了一定数量的文章之后,就打算将其整理为一个文集,方便读者朋友的连贯性阅读和学习。但是博客使用的WordPress在进行文集管理方面并不是很好,于是就在市面上找各种文档文集系统。在...

分类目录: 编程

标签: djangomrdoc开源

我就想些个爬虫,怎么要学那么多东西?

一开始,老板给了一个任务,需要从网页上复制几百页的数据到本地。一遍一遍的复制粘贴,贴得我身心憔悴。听说有一种爬虫技术,可以自动采集数据,省去了人肉取数的痛苦。 我一听,「诶,这不错,学了就不用再废这双老手了」。 于是网上一搜索,都说 Python 适合写爬虫,而且简单易学,最适合非计算机专业的普通人...

分类目录: 数据采集

标签: 爬虫

「爬虫实战」采集高校历史录取分数线

高考过后,这几天各省份都陆续放榜。 又到了一年一度的高考志愿填报时间,不管考得好,还是考得不好,基本上,都会有学校就读。 大多数时候,我们只能通过过去的高效录取分数线,来做一个参考,筛选出自己的分数能够报考的学校和专业。 家里人最近让州的先生给查查资料,看家里的小朋友大概能报什么学校。 网上一搜,打...

分类目录: 数据采集

标签: Python爬虫

使用 Python 全栈实现桌面图形程序的用户 Mac 地址绑定

在上一篇文档,我们介绍了使用 Python 的 PyQt5 框架构建一个支持用户登录的桌面图形程序,然后使用 Django 框架构建了一个用户认证的后端服务,使得 使用 PyQt5 写的用户登录程序可以通过这个后端服务进行用户的认证,只有认证通过,才会显示程序的主界面。 除了简单的用户登录认证,还有...

分类目录: Web开发

标签: django

在 Python 桌面图形程序中实现用户认证系统

使用 Python 编写桌面图形界面程序之后,我们一般是直接使用 Pyinstaller 之类的工具打包成二进制文件,然后提供下载供用户使用。 这样做很方便,用户直接下载打开就可以使用了。但是同时也带来了一个风险,也就是软件传播的风险(如果程序涉及到一定的权限私密性的话)。 如何避免这种情况呢,一般...

分类目录: Web开发

标签: djangoPythonweb开发

从 0 到 1 使用 Python 开发一个钉钉群应答机器人

很多时候,我们都希望计算机程序能够为我们自动化的处理一些学习、工作和生活上的任务,毕竟「偷懒」可是促进科技进步和社会发展的一大动力。基于这种需求,诞生了很多种自动化的工具,比如爬虫,自动地帮我们采集数据;比如智能问答机器人,自动地回答客户提出的问题。 在聊天工具大肆侵入我们生活各个方面的今天,各种消...

分类目录: Web开发

标签: django钉钉机器人

使用Selenium实现HTML转PDF

在之前,州的先生为了在觅道文档中实现 markdown 转 pdf 的功能,考察和调研的市面上的一些通行解决方案,详见https://zmister.com/archives/1607.html。 在那之后,觅道稳定选择了 Chromium + pyppeteer 的方案作为 HTML 转换 PDF...

分类目录: 编程

标签: htmlpdfselenium

Kivy 5种常用图形界面布局大赏

对于任何图形界面的框架而言,布局都是非常重要的一个组成部分。它就像人体的骨骼、房屋的钢筋混凝土梁架,支撑起整个图形界面、条理好各个小部件的位置。 在 Web 开发的前端 CSS 中,最常见的有栅格布局、绝对布局和相对布局。 在 Python 的 PyQt5 中,州的先生比较常使用的时网格布局、垂直布...

分类目录: 图形用户界面

标签: GUIkivy

Kivy 图形界面开发初体验

本文是觅道文档连载教程《使用Kivy构建现代桌面GUI应用》 的第一个实例,如需细致的介绍,可点击此处进行阅读 Kivy 是一个开源的 Python 第三方库,可以用来快速开发应用程序。 它有如下三个特点: 跨平台 Kivy 编写的程序可在 Linux,Windows,OS X,Android,iO...

分类目录: 图形用户界面

Python转换HTML为PDF方案合集

将 HTML 网页转换为 PDF 是很多人常见的一个需求,在浏览器上,我们可以通过浏览器的“打印”功能直接将网页打印输出为 PDF。 但是如果有多个网页就不好办了。 二进制软件 网络上存在很多将 HTML 转换为 PDF 的软件和工具。比较著名的有 Carelib、wkhtmltopdf。 whtm...

分类目录: 编程

如何揪出网站上的网络爬虫:指纹识别

网络上的爬虫日益猖獗,疯狂地采集网站上的内容,不仅没有带来一丝好处,反而导致内容的流失、增大服务器的压力。 在众多的访问者中识别出网络爬虫并限制其访问一直是各个网站运营者所关心和头疼的事情。 州的先生一直以来持有的观点就是,网络爬虫的反爬与反反爬,会像网络安全的黑客攻防一样,在你强化一步,我突破一步...

分类目录: 数据采集

Python实现Word文档转换Markdown

随着SaaS服务的流行,越来越多的人选择在各个平台上编写文档,制作表格并进行分享。 同时,随着Markdown语法的破圈,很多平台开始集成支持这种简洁的书写标记语言,这样可以保证平台上用户文档样式的统一性。 但是在一些场景下,我们还是会在本地的Office软件上写有很多文档,或者历史遗留了很多本地文...

分类目录: 编程

【源码放送】Python制作TIM登录界面完整源码

本源码来自于州的先生基于 Python 的 PyQt5 库制作的新版 TIM 登录界面。 有关具体的代码实现思路和方式,详见下面的文章: 除了还原 TIM 登录界面样式之外,还实现了如下的交互: QQ/微信登录方式切换; 二维码扫码登陆切换; 用户名密码输入; 这份源码一共包含 1 个 Python...

分类目录: 图形用户界面

觅道文档开始支持富文本编辑器

MrDoc(觅道文档)是州的先生基于 Python 后端编写的开源在线文档系统。 最初,觅道文档以 Markdown 书写为核心,集成了 EditorMD 和 Vditor 两大主流 Markdown 编辑器,配合后端的文集、文档管理,图片、附件支持,以及类 GitBook 风格的前台阅读页面,得到...

分类目录: Web开发

纯Python实现中英文全文搜索

在互联网上的各类网站中,无论大小,基本上都会有一个搜索框,用来给用户对内容进行搜索,小到站点搜索,大到搜索引擎搜索。 从简单的来说,搜索功能确实很简单,一个简单的 select 语句就可以实现数据的搜索。 而从复杂的来看,无论是搜索的精度还是搜索的效率,都是有很深的研究范围的。 对于简单的搜索功能来...

分类目录: Web开发

标签: Pythonweb全文搜索