分类: 编程

使用Selenium实现HTML转PDF

在之前,州的先生为了在觅道文档中实现 markdown 转 pdf 的功能,考察和调研的市面上的一些通行解决方案,详见https://zmister.com/archives/1607.html。 在那之后,觅道稳定选择了 Chromium + pyppeteer 的方案作为 HTML 转换 PDF...

分类目录: 编程

标签: htmlpdfselenium

Python转换HTML为PDF方案合集

将 HTML 网页转换为 PDF 是很多人常见的一个需求,在浏览器上,我们可以通过浏览器的“打印”功能直接将网页打印输出为 PDF。 但是如果有多个网页就不好办了。 二进制软件 网络上存在很多将 HTML 转换为 PDF 的软件和工具。比较著名的有 Carelib、wkhtmltopdf。 whtm...

分类目录: 编程

Python实现Word文档转换Markdown

随着SaaS服务的流行,越来越多的人选择在各个平台上编写文档,制作表格并进行分享。 同时,随着Markdown语法的破圈,很多平台开始集成支持这种简洁的书写标记语言,这样可以保证平台上用户文档样式的统一性。 但是在一些场景下,我们还是会在本地的Office软件上写有很多文档,或者历史遗留了很多本地文...

分类目录: 编程

觅道文档 0.6.0 发布

本周日(2020年10月18日),觅道文档提交发布了 v0.6.0 版本。本次版本带来了如下内容的更新: 新增站点名称、副标题、备案号、关键词等站点信息配置功能; 新增文集转让功能; 新增后台对文档图片缩略显示的配置; 新增Vditor编辑器模式插入文档模板功能; 新增Editormd编辑器模式下时...

在Markdown中扩展语法实现时间线解析

时间线(时间轴)大家应该都不陌生。 无论是在产品文档更新说明: 组织历程: 还是新闻大事件中: 都会有时间线的身影。 时间线可以线性地梳理纷繁事务的前后逻辑关系,捋清事物发展的脉络。 时间线虽然很好,但是如果需要在自己的日志、文档和笔记中加入时间线则没有很好的方案。 无论是桌面端还是 Web 端,时...

Python图形界面美化的方法论

很多人都吐槽,使用 Tkinter、PyQt5等工具制作出来的图形界面程序太丑了。既然觉得它丑,我们来想想,它为什么会那么丑。 功能性是开发的第一要务 每一个 Python 图形界面库都有它自有的功能特性和界面特性。一般来说,这些库的开发者着重要考虑的是功能性的实现。比如、列表框、拖拽框、悬浮框、自...

分类目录: 编程

标签: 图形界面开发

Python文件处理实用指南

对文件的操作算是Python中一个基础又重要的知识点了,无论是在爬虫、数据分析、Web开发,还是在编写图形界面、进行数据分析,都有可能需要用到文件相关的操作。 今天就来总结性地学习和回顾一下,Python各类文件处理。 一、open()模式 open()函数 open(文件名,操作模式)函数用来以指...

分类目录: 编程

标签: 文件处理

9个动图带你进入PyQtGraph的强大可视化世界

PyQtGraph是一个建立在PyQt/PySide之上的Python数据可视化图形界面库,其性能强、速度快,能够胜任大部分交互式的2D、3D图形绘制,可以搞定数据科学领域大量的数据可视化工作。 州的先生之前绘制的A股股票动态K线图,就是使用PyQtGraph绘制的。 A股复苏,入场还是解套?Pyt...

分类目录: 编程

标签: pyqtgraph

Python 一键下载 UNPKG 项目代码解析

最近,州的先生打算用饿了么团队开源的Element-UI组件来扩展MrDoc的前端界面。本着怎么简单怎么来、不把简单问题搞复杂的原则,选择脱离webpack和npm那一套前端工程化的东西,直接在HTML页面中调用JS文件。 按照element-ui官方文档的介绍,使用unpkg提供的CDN地址,直接...

分类目录: 数据采集编程

标签: 源码解析

真实场景下的Tesseract4.0神经网络训练识别图片验证码

何谓“真实场景”,意即图片验证码来源于实际的数据采集过程中遇到的网站,对图片验证码的识别训练工作也是出自于真实的环境,而非像很多文章用一个验证码库生成好几万个验证码图片样本,然后用一个CNN或LSTM模型,把数据扔进去跑。看着是过瘾,测试效果也很好,然后呢?照着做碰一鼻子灰! 一、验证码采集 既然要...

分类目录: 编程

标签: LSTMtesseract验证码

如何用Python实现一个全链路的舆情监控系统

舆情监控系统在过去几年曾是一个比较热门的话题,一般多被应用在政务领域、企业领域等,用于让企业、部门等单位及时获取和了解到网络上舆情的出现和发展,以便及时采取相应的措施,从而控制舆情、引导舆情,化危为机。 最近生意参谋在服务洞察栏目里面也上线了一个商家版的舆情监控系统,州的先生(https://zmi...

小巧、快速、稳定!我为什么选择使用Sqlite?

州的先生(https://zmister.com)在很多项目中都有使用到SQLite数据库作为数据存储的工具,其中包括一些桌面图形界面程序和线上的Web应用程序。至今为止,它们都运行良好,SQLite没有对他们带来任何速度和效率方面的问题。 很多人一听到SQLite数据库,就觉得这是一个很低级,效率...

分类目录: 编程

标签: sqlite

办公自动化|使用Python对Excel表格文件进行批处理

在工作中经过会遇到大量格式一致,内容不同的Excel表格文件,需要将这里面的内容整理到一个Excel文件中的情形。一般情况下,都是将这些Excel表格文件一个一个地打开,将里面的内容复制,然后粘贴到一个新的Excel表格文件中。 不仅费时费力还容易出错,Excel文件比较少还好,要是有几十个几百个,...

分类目录: 编程

标签: Excel