1.1、Selenium是什么
Selenium是什么,相信从事自动化测试的同学或者有过Python爬虫经历的同学都会有了解。
Selenium是一个Web自动化测试软件, 正如Selenium官网所言:Selenium主要是为了测试目的而进行自动化的Web应用程序,但是当然并不限于此,一些基于Web的无聊的管理任务也可以使用Selenium进行自动化。嗯,比如爬虫。
网络爬虫应该是Selenium除了Web自动化测试之外,最为人所熟知的应用场景了,它在面对一些JS生成的动态网页时能够有效的获取到页面上的数据。可以说是Python网络爬虫的必备良品。
1.2、在Python中安装Selenium
Selenium提供了Python的接口来供我们使用Selenium,通过简洁的API,我们可以在Python中使用到Selenium的所有功能。
我们可以下载Selenium的Python安装包进行安装,但是更加简便的方法是使用pip工具进行安装:
pip install selenium
进入Python的shell测试一下selenium是否能够成功被import:
这样selenium就安装完成了。
1.3、下载浏览器驱动程序
Selenium需要通过浏览器的驱动程序(webdriver)来连接和启动一个浏览器。如果使用Firefox,那么需要geckodriver;如果使用Chrome,那么需要chromedriver;
在这里,我们选择谷歌的Chrome浏览器作为讲解演示,所以我们需要下载chromedriver。
在淘宝的开源包管理站点上:http://npm.taobao.org/mirrors/chromedriver/ 根据自己电脑上Chrome浏览器的版本,选择合适的chromedriver版本,一般而言,如果Chrome浏览器是最新的版本,那么选择chromedriver 2.37即可:
点击进去,根据自己的电脑选择不同操作系统的版本:
在这里,我使用的是Windows系统的电脑,所以选择了“chromedriver_win32.zip”。下载之后,将其解压即可:
这样,我们下载好了浏览器驱动程序。如果需要使用其他浏览器,同样可以在http://npm.taobao.org/mirrors/这个网站上进行下载:
1.4、总结
在本篇,我们简单介绍了Selenium、在Python中安装Selenium,以及下载合适的浏览器驱动程序。了解和完成了这些知识点,就可以进行下一步的学习了。
下一篇,我们将开始介绍Selenium的自动化使用。
文章版权所有:州的先生博客,转载必须保留出处及原文链接
。。。很好