在上一篇中,我们介绍了如何使用Selenium在页面中查找定位页面元素。在定位到页面元素之后,我们能够做些什么呢?本篇我们就将来简单了解一下。
4.1 模拟键盘键入
4.1.1 输入文本
在定位到元素之后,我们一般会做什么?如果定位的是input输入框,那么我们可能需要在其中输入一些值。想要实现这个功能,在Selenium中,我们可以使用send_keys()方法,在上一篇文章定位input元素的示例中,我们稍微演示了一下send_keys()的使用:
# coding:utf-8
'''
@author:州的先生
@site:zmister.com
@微信公众号:州的先生
'''
from selenium import webdriver
driver = webdriver.Chrome(executable_path=r"D:\chromedriver_win32\chromedriver.exe")
driver.get('http://www.baidu.com')
ele = driver.find_element_by_id('kw')
ele.send_keys("州的先生")
这样,selenium就会操纵浏览器在input输入框内输入“州的先生”这4个字:
4.2.1 清除文本
如果,输入错了,嗯,没关系,我们可以使用clear()方法,对元素的值进行清除:
# coding:utf-8
'''
@author:州的先生
@site:zmister.com
@微信公众号:州的先生
'''
from selenium import webdriver
driver = webdriver.Chrome(executable_path=r"D:\chromedriver_win32\chromedriver.exe")
driver.get('http://www.baidu.com')
ele = driver.find_element_by_id('kw')
ele.send_keys("州的先生")
ele.clear()
4.1.3 实现点击
在input输入框输入了内容之后,我们可能需要点击“百度一下”按钮进行搜索。这时候,我们可以定位到按钮元素,再对按钮元素执行click()方法进行点击:
# coding:utf-8
'''
@author:州的先生
@site:zmister.com
@微信公众号:州的先生
'''
from selenium import webdriver
driver = webdriver.Chrome(executable_path=r"D:\chromedriver_win32\chromedriver.exe")
driver.get('http://www.baidu.com')
ele = driver.find_element_by_id('kw')
ele.send_keys("州的先生")
search = driver.find_element_by_id('su')
search.click()
这样就完成了从输入搜索词,到点击搜索的过程。除此之外,还有另外一种方法。
4.1.4 键盘功能键的键入
另外一种方法就是,可以在输入input输入框的值之后,直接模拟回车键(因为百度提供了回车直接搜索的功能)。
要模拟键入键盘上的回车,我们首先需要导入直接相关的模块:
from selenium.webdriver.common.keys import Keys
这个Keys中,包含了键盘的各种功能键的定义:
我们可以直接在send_keys()方法中使用:
# coding:utf-8
'''
@author:州的先生
@site:zmister.com
@微信公众号:州的先生
'''
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
driver = webdriver.Chrome(executable_path=r"D:\chromedriver_win32\chromedriver.exe")
driver.get('http://www.baidu.com')
ele = driver.find_element_by_id('kw')
ele.send_keys("州的先生",Keys.ENTER)
# search = driver.find_element_by_id('su')
# search.click()
这样,我们不用定位按钮元素,也能够成功执行搜索:
其他键的使用方法也是一样的。
4.2 模拟鼠标行为
除了在输入框中输入文本,我们可能还经常需要在网页上使用鼠标进行一些拖动操作,比如把一个元素拖动到另一个元素里面,把一个元素拖动到另一个位置上。
在selenium中,有一个专门用于鼠标行为的类名为ActionChains:
from selenium.webdriver import ActionChains
其中定义了很多的鼠标动作操作方法,比如:
- click:鼠标左键点击;
- click_and_hold:在元素上按住鼠标左键;
- context_click:在元素上执行鼠标右击;
- double_click:在元素上执行鼠标双击;
- drag_and_drop:拖拽一个元素到另一个元素上;
- drag_and_drop_by_offset:拖拽一个元素到另一个偏移量上;
- move_by_offset:移动鼠标指定的偏移量;
- move_to_element:将鼠标移动到某个元素上;
- move_to_element_with_offset:通过指定元素的偏移量移动鼠标;
- release :释放一个元素上的鼠标按钮;
- perform : 执行定义的所有鼠标动作;
我们可以通过ActionChains类下面的方法进行丰富的鼠标操作。
先来看一个例子:
http://sahitest.com/demo/dragDropMooTools.htm
是一个自动化测试的demo,里面包含了一个可拖拽对象,我们可以通过它来测试Selenium的鼠标拖拽事件:
查看一下需要拖拽的元素的结构:
目的元素的结构:
接下来,我们使用Selenium的鼠标拖拽方法drag_and_drop()演示拖拽:
# coding:utf-8
'''
@author:州的先生
@site:zmister.com
@微信公众号:州的先生
'''
from selenium import webdriver
from selenium.webdriver.common.action_chains import ActionChains
import time
driver = webdriver.Chrome(executable_path=r"D:\chromedriver_win32\chromedriver.exe")
driver.get('http://www.zhualv.com/demo/dragDropMooTools.htm')
# 被拖拽元素
dragger = driver.find_element_by_id('dragger')
# 目标元素
item1 = driver.find_element_by_xpath('//div[text()="Item 1"]')
time.sleep(3)
action = ActionChains(driver)
# 移动dragger到目标1
action.drag_and_drop(dragger, item1).perform()
这样就实现了使用Selenium在网页上进行鼠标的拖拽。
4.3 切换窗口与框架
在实际的应用中,我们可能会在浏览器中打开多个窗口,或者一些网页中存在子框架(比如一些登录框)。我们需要对其进行操作,就必须首先切换到相应的窗口或者子框架中。
在Selenium中,我们通过其提供的switch_to方法来进行切换操作。
通过上图我们可以发现,switch_to不仅支持切换窗口和子框架,还能够切换到一个活动的元素、父框架以及弹出alert框。下面我们看看其的具体使用方法。
4.3.1 切换窗口
如果我们使用Selenium打开了多个窗口,使用switch_to.window()方法可以很方便地对窗口进行切换。我们来看一个实际的例子,我们在搜狗的微信搜索中搜索“州的先生”,然后点击第一个搜索结果:
# coding:utf-8
'''
@author:州的先生
@site:zmister.com
@微信公众号:州的先生
'''
from selenium import webdriver
import time
driver = webdriver.Chrome(executable_path=r"D:\chromedriver_win32\chromedriver.exe")
driver.get('http://weixin.sogou.com/')
inputs = driver.find_element_by_id('query')
inputs.clear()
inputs.send_keys("州的先生")
submit = driver.find_element_by_css_selector("input.swz")
submit.click()
time.sleep(3)
article = driver.find_element_by_css_selector("div.txt-box > h3 > a")
article.click()
其会新打开一个窗口显示搜索的文章内容,如下动图所示:
如何将当前的窗口切换回之前的搜索结果页呢?看看switch_to.window()的方法:
# coding:utf-8
'''
@author:州的先生
@site:zmister.com
@微信公众号:州的先生
'''
from selenium import webdriver
import time
driver = webdriver.Chrome(executable_path=r"D:\chromedriver_win32\chromedriver.exe")
driver.get('http://weixin.sogou.com/')
inputs = driver.find_element_by_id('query')
inputs.clear()
inputs.send_keys("州的先生")
submit = driver.find_element_by_css_selector("input.swz")
submit.click()
time.sleep(3)
# 获取第一个窗口
window_1 = driver.current_window_handle
# 定位第一个搜索结果并新窗口打开
article = driver.find_element_by_css_selector("div.txt-box > h3 > a")
article.click()
time.sleep(5)
# 切换回第一个窗口
driver.switch_to.window(window_1)
运行程序,结果如下动图所示:
切换子框架的步骤和方法与此类似,在此就不演示了。
文章版权所有:州的先生博客,转载必须保留出处及原文链接