我就想些个爬虫，怎么要学那么多东西？

一开始，老板给了一个任务，需要从网页上复制几百页的数据到本地。一遍一遍的复制粘贴，贴得我身心憔悴。听说有一种爬虫技术，可以自动采集数据，省去了人肉取数的痛苦。 …

数据采集 . 2021/6/30 7,698 0

「爬虫实战」采集高校历史录取分数线

高考过后，这几天各省份都陆续放榜。又到了一年一度的高考志愿填报时间，不管考得好，还是考得不好，基本上，都会有学校就读。大多数时候，我们只能通过过去的高效录取…

数据采集 . 2021/6/30 8,311 0

网络上的爬虫日益猖獗，疯狂地采集网站上的内容，不仅没有带来一丝好处，反而导致内容的流失、增大服务器的压力。在众多的访问者中识别出网络爬虫并限制其访问一直是各个…

数据采集 . 2020/12/25 12,866 0

最近，州的先生打算用饿了么团队开源的Element-UI组件来扩展MrDoc的前端界面。本着怎么简单怎么来、不把简单问题搞复杂的原则，选择脱离webpack和n…

数据采集 . 2020/7/8 19,809 0

在正常情况下，对于需要登录的网站，一般只要将登录后的cookie携带到headers中就可以实现认证后的访问请求。但是，也有例外。最近，州的先生（zmiste…

数据采集 . 2019/3/28 35,058 0

一、关于毛选5 《毛泽东选集》第5卷是毛泽东1949年以后著作的选集。这本书的编辑、出版用了近十年的时间，时间贯穿了整个文革。由于特殊原因，这本书在1982年…

数据采集 . 2019/1/15 38,903 0

一、前言在进行数据采集的过程中，我们遇到的很多网页所采用的都是比较单一的页面渲染方法。比如：后端直接返回HTML; 前端请求数据接口进行渲染；对于采用第一…

数据采集 . 2019/1/9 35,287 0

前言众所周知，阿里系的反爬虫技术一直都是业内一流的，随着反爬虫手段的不断加强，淘宝的登录从Selenium操纵webdriver直接登录，到Selenium模…

数据采集 . 2018/11/5 70,251 8

温馨提示：本文为注册用户专享，请登录后刷新查看，加入州的先生知识星球，免费获得注册邀请码！

数据采集 . 2018/10/30 38,678 0

1、问题来源在数据采集过程中，经常有需要采集各种联系方式，其中就包括电子邮箱地址。一些毫不设防的网站的电子邮件地址可以直接从网页源码中获取到，而一些稍微有点防…

数据采集 . 2018/5/15 39,933 0

在上一篇中，我们介绍了如何使用Selenium在页面中查找定位页面元素。在定位到页面元素之后，我们能够做些什么呢？本篇我们就将来简单了解一下。 4.1 模拟键盘…

快速掌握Python Selenium Web自动化 . 2018/4/29 41,799 0

很多同学选择了Python作为其学习编程的首选语言，而Python也以其容易上手的语法、广泛的应用领域、不断旺盛的市场需求回报着每一个学习者和应用者。今天我们…

数据应用 . 2018/4/19 40,477 3

使用Selenium进行自动化操作，首先要做的就是通过webdriver的get()方法打开一个URL链接。在打开链接，完成页面加载之后，就可以通过Selen…

快速掌握Python Selenium Web自动化 . 2018/4/9 40,006 1

简单的使用Selenium 如何完成了上一篇的学习内容，安装好了Python下的Selenium模块，同时下载了合适的浏览器驱动程序，那么我们就可以在Pytho…

快速掌握Python Selenium Web自动化 . 2018/4/3 40,357 3