news 2026/6/10 10:30:43

python+selenium的web自动化之元素的常用操作

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
python+selenium的web自动化之元素的常用操作

🍅点击文末小卡片,免费获取软件测试全套资料,资料在手,涨薪更快

今天呢,笔者想和大家来聊聊python+selenium的web自动化之元素的常用操作,废话不多说直接进入主题吧!

一、常用操作

关键代码:

  • 点击:ele.click()
  • 输入内容:ele.send_keys("内容")
  • 清空内容:ele.clear()
  • 获取文本内容:ele.text
  • 获取属性值:ele.get_attribute("属性名称")
  • 获取元素的宽高:ele.size,size和location一样都是实例属性,返回都是字典格式
  • 获取元素的坐标:ele.location,元素坐标值是通过元素的最左上角相对浏览器内容区域的左上角来定位的
# 定位元素 input_ele = driver.find_element_by_id("kw") su_ele = driver.find_element_by_id("su") # 获取元素的文本内容 input_ele.text # 获取元素的某个属性 input_ele.get_attribute("属性名称") # 输入内容 input_ele.send_keys("selenium") # 点击操作 su_ele.click() # 清空内容 input_ele.clear() # 获取元素的宽高 print("【百度一下】按钮的宽高:{}".format(su_ele.size)) # 获取元素的x、y坐标值 print("【百度一下】按钮的坐标:{}".format(su_ele.location))

表单提交

关键代码:

  • 表单提交:ele.submit(),用于表单的提交;也可以定位到具体提交按钮做一个点击的动作
input_ele = driver.find_element_by_id("kw") input_ele.submit() # 也可以实现回车

检查元素

关键代码:

  • 是否可见:ele.is_displayed(),返回True可见,反之不可见
  • 是否可点击:ele.is_enabled(),返回True可点击,反之不可点击
  • 是否被选中:ele.is_selected(),返回True被选中,反之未选中
ele = driver.find_element_by_id("xxxx") print(ele.is_displayed()) print(ele.is_enabled()) print(ele.is_selected())

二、等待操作

在web自动化中,不得不提的元素等待操作,我们在做功能测试中也会经常遇到页面元素未完全加载的情况,需要等到元素出现后再进行操作。现在是代码代替人工去做这件事,那自然也需要先等到元素加载完成才进行操作。

当我们打开浏览器,进入一个网页driver.get(网址),除了get()会自主强制等待网页加载完再进入下一个操作,其他元素操作都不会自己等待页面加载完成,因此在get()之后只要我们做的动作会让页面产生变化就要做一个等待动作,以防元素未加载完成导致元素找不到报错,因为代码运行的速度是非常快的。

有三种等待方式,一种强制等待,两种智能等待:隐性和显性。

强制等待

time.sleep(秒):表示让程序强制死等x秒,无论发生什么,都会在x秒之后再执行后续的代码

import time time.sleep(2) # 强制等待10s

隐性等待

​implicitly_wait(秒):设置最长等待时间,在这个时间内只要有个时间点加载完成,则执行下一步代码,如果在这个时间内仍未完成,就会抛出一个异常,在这整个driver的会话周期内,设置一次即可,全局都可用。

​缺点:程序会一直等待整个页面加载完成,也就是一般情况下你看到浏览器标签栏那个小圈不再转,才会执行下一步,但有时候页面想要的元素早就加载完成了,但是因为个别js、图片之类的东西特别慢,仍得等到页面全部完成才能执行下一步,就会增加不必要的加载时间。

from selenium import webdriver # 实例化chrome类 # 启动了Chromedriver,并与Chromedriver开启了会话 driver = webdriver.Chrome() driver.implicitly_wait(10) driver.get("https://www.baidu.com")

显性等待

​关键代码:WebDriverWait(driver, 等待时长, 轮循周期).until/until_not(判断条件)。

​使用WebDriverWait类和expected_conditions模块,它会明确等到某个条件满足后,再去执行下一步操作。它的等待机制是程序会每隔xx秒去寻找一遍,如果条件成立则执行下一步,否则以轮循的方式继续去寻找,直到超过设置的最长时间,然后抛出一个TimeoutException异常。

​WebDriverWait类:显性等待类

​expected_conditions模块,提供了一系列期望发生的条件,如下:

  • title_is(title):判断当前页面的title是否等于预期,
  • title_contains(title):判断当前页面的title是否包含预期字符串
  • presence_of_element_located(locator):判断某个元素是否存在dom树
  • visiblilty_of_element_located(locator):判断某个元素是否可见
  • visiblilty_of(element):跟上面的方法一样,判断某个元素是否可见,只是前者要传locator(定位器),后者直接传定位到的element就好了
  • element_to_be_clickable(locator):判断某个元素是否可点击
  • frame_to_be_available_and_switch_to_it(frame下标/name属性/webelement对象):判断该frame是否可以swtich进去,可以则返回True并swtich进去,否则返回False。
  • alert_is_present():判断页面上是否存在alert

以上是列举的部分条件类,还有更多的方法有兴趣可以自行扩展。下面是其中一个方法示例:

import time from selenium import webdriver from selenium.webdriver.support.wait import WebDriverWait from selenium.webdriver.support import expected_conditions as EC from selenium.webdriver.common.by import By # By模块封装了8大定位方法名 driver = webdriver.Chrome() # driver.implicitly_wait(10) # 智能等待10秒 driver.get("http://www.baidu.com") driver.find_element_by_xpath('//div[@id="u1"]//a[@name="tj_login"]').click() # 定位表达式 loc = (By.ID, "TANGRAM__PSP_10__footerULoginBtn") # 实际是11,这里改成10找不到会弹出报错 # 等待元素可见:等待时间10秒,轮循周期默认0.5秒一次 WebDriverWait(driver, 10).until(EC.visibility_of_element_located(loc)) # 操作满足条件之后的元素 driver.find_element(*loc).click() time.sleep(2) driver.quit()

​运行结果:

C:\software\python\python.exe D:/learn/test.py Traceback (most recent call last): File "D:/learn/test.py", line 25, in <module> WebDriverWait(driver, 10).until(EC.visibility_of_element_located(loc)) File "C:\software\python\lib\site-packages\selenium\webdriver\support\wait.py", line 80, in until raise TimeoutException(message, screen, stacktrace) selenium.common.exceptions.TimeoutException: Message: Process finished with exit code 1

知识点:

​上面提到的定位器其实就是一个元组(定位方式, 定位表达式),By模块里封装了8大定位方法名,跟我们之前的定位方式是一样的。

​不过要注意的是,在使用find_element() 定位元素时,不是传入一个元组,定位方式和表达式是直接作为参数传入的,因此上面的例子中会用到*解包。而find_element_by_id(属性值)之类的定位,底层代码用的其实就是find_element(),后者只要传对应定位方式的值,前者则需要传定位方式、定位表达式。

三、iframe切换

iframe:iframe就是一个网页里面嵌套了另外一个框架/页面,即一个html页面中,还内嵌了另一个html页面,这个内嵌的html页面放在<iframe></iframe>标签对中。iframe也是html中的某一个元素,里面放的是html页面。

切换到iframe

​如果我们要操作的元素,在内嵌的iframe页面中,那么必须要从当前页面切换到iframe中,然后再去iframe中的页面去操作元素。切换到iframe,主要有以下两种方式:

方式一:swtich_to.iframe()

参数:iframe的index(下标)/ iframe的name属性 / iframe的webelement对象

# 切换到iframe 下标/name属性/webelement对象 driver.switch_to.iframe("login_frame_qq") driver.switch_to.iframe(0) driver.switch_to.iframe(dirver.find_element_by_tag_name('iframe'))

方式二:EC.frame_to_be_available_and_switch_to_it()(强烈推荐 ,等待和切换一次到位)

参数:iframe的index(下标)/ iframe的name属性 / iframe的webelement对象,等待条件:此方法会判断iframe是否可用,并且会自动切换到iframe中

wait = WebDriverWait(driver, 10) # 设置显性等待时间 # 设置等待条件,此方法会判断iframe是否可用,并且会自动切换到iframe中 wait.until(EC.frame_to_be_available_and_switch_to_it('login_frame_qq')) driver.find_element_by_id('switcher_plogin').click()

切换到上层iframe

​关键代码:driver.iframe_to.parent_frame()

​如果iframe中又内嵌了一个iframe,那就只能在主html中一层一层地切进去。如果想返回上一层时也是一层一层地返回去。一般很少会返回去。

切换到主html

​关键代码:driver.swtich_to.default_content()

​切换到iframe之后,本身在主html就变成了在切换后的内嵌html,这时可以操作内嵌html的元素了,如果想重新操作主html的元素,就要先从iframe中回到主html。

​这里要注意,不管你是在第几层的iframe中,想切回到主html中,都只需执行一次。例子:

import time from selenium import webdriver from selenium.webdriver.support.wait import WebDriverWait from selenium.webdriver.support import expected_conditions as EC from selenium.webdriver.common.by import By # 主html、内嵌html # 确定要操作的元素是否在iframe内? # 启动Chromedriver,并与Chromedriver开启会话 driver = webdriver.Chrome() driver.maximize_window() driver.get("http://xxxx.com/") driver.find_element_by_id('js_login').click() wait = WebDriverWait(driver, 10) # 设置显性等待时间 qq_l = (By.XPATH, '//div[@class="content-btns"]//a') wait.until(EC.visibility_of_element_located(qq_l)) # 设置显性等待条件 driver.find_element(*qq_l).click() # 设置等待条件,此方法会判断iframe是否可用,并且会自动切换到iframe中 wait.until(EC.frame_to_be_available_and_switch_to_it('login_frame_qq')) driver.find_element_by_id('switcher_plogin').click() driver.find_element_by_id('u').send_keys('test') driver.find_element_by_id('p').send_keys('test') driver.find_element_by_id('login_button').click() time.sleep(2) driver.quit() # 关闭浏览器,kill掉chromedriver进程

四、alert弹出框操作

网页上的弹出框分两种,一种是页面弹出框 ,这是一个html页面元素,可见时是能定位到并进行操作的;另一种则是alert弹出框,这是是js里的alert弹框,而selenium只能定位到html元素,那么像这种alert弹出框如何处理呢?既然是js那么我们就用js来处理。

页面弹出框

​它是一个html页面元素,只是需要由用户在页面的操作中触发弹出,因此处理这种类型的弹出框,一般分为两步:

  • 第一步:执行触发操作之后,等待弹出框出现
  • 第二步:定位弹出框中的元素并操作

​如百度登录的弹出框:

import time from selenium import webdriver from selenium.webdriver.support.wait import WebDriverWait from selenium.webdriver.support import expected_conditions as EC from selenium.webdriver.common.by import By # By模块封装了8大定位方法名 driver = webdriver.Chrome() driver.get("http://www.baidu.com") driver.find_element_by_xpath('//div[@id="u1"]//a[@name="tj_login"]').click() # 用户名登陆定位表达式 loc = (By.ID, "TANGRAM__PSP_11__footerULoginBtn") # 等待时间10秒,轮循周期默认0.5秒一次 WebDriverWait(driver, 10).until(EC.visibility_of_element_located(loc)) # 操作满足条件之后的元素 driver.find_element(*loc).click() time.sleep(2) driver.quit()

alert弹出框

​alert弹出框的处理方式:

  • 第一步:使用swtich_to.alert切换到弹出框,建议先使用显性等待EC.alert_is_present()判断弹出框是否可见,或者强制等待0.5s:time.sleep(0.5)
  • 第二步:使用Alert类提供的一系列操作方法对弹窗进行操作:accept() 是dismiss() 否Send_keys() 往弹出框里输入文本text() 获取弹框里的内容
import time from selenium import webdriver from selenium.webdriver.support.wait import WebDriverWait from selenium.webdriver.support import expected_conditions as EC # 启动Chromedriver,并与Chromedriver开启会话 driver = webdriver.Chrome() driver.maximize_window() driver.get("https://www.w3school.com.cn/tiy/t.asp?f=js_alert") wait = WebDriverWait(driver, 10) wait.until(EC.frame_to_be_available_and_switch_to_it('iframeResult')) # 触发alert弹框 driver.find_element_by_xpath('//button[text()="试一试"]').click() wait.until(EC.alert_is_present()) time.sleep(3) # 这里是为了看下效果 alert = driver.switch_to.alert # Alert类的实例化,切换到alert alert.accept() # 是 # dismiss() 否 # text() 获取弹框里的内容 # Send_keys() 往弹出框里输入文本 driver.quit()

五、总结

最后感谢每一个认真阅读我文章的人,礼尚往来总是要有的,虽然不是什么很值钱的东西,如果你用得到的话可以直接拿走:

这些资料,对于做【软件测试】的朋友来说应该是最全面最完整的备战仓库,这个仓库也陪伴我走过了最艰难的路程,希望也能帮助到你!凡事要趁早,特别是技术行业,一定要提升技术功底。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/10 9:56:58

EasyGBS视频监控联网方案及应用场景实践

随着平安城市建设的加速发展&#xff0c;视频监控“大联网”的需求愈发凸显&#xff0c;推动视频监控系统联网建设及视频图像信息的整合与共享&#xff0c;已成为公安机关业务发展的必然趋势和公安科技信息化工作的关键需求。国标GB28181算法算力平台EasyGBSEasyGBS凭借其在视频…

作者头像 李华
网站建设 2026/6/10 9:54:58

开始批量生成后能否中途暂停?当前版本不支持

批量生成任务中途能暂停吗&#xff1f;HeyGem 系统为何选择“一跑到底” 在数字人内容创作的实际场景中&#xff0c;一个看似简单却频繁被问到的问题是&#xff1a;我能不能在批量生成视频的过程中临时停一下&#xff1f; 比如你正在处理一批教学视频&#xff0c;总共 30 个&am…

作者头像 李华
网站建设 2026/6/10 9:56:55

Google Sheets在线表格控制HeyGem输入列表

Google Sheets 在线表格控制 HeyGem 输入列表&#xff1a;构建可编程的数字人内容工厂 在教育机构批量生成双语教学视频、客服团队制作多语言培训素材、或是全球化品牌进行本地化内容投放时&#xff0c;一个共通的挑战浮出水面——如何高效管理成百上千条数字人视频任务&#…

作者头像 李华
网站建设 2026/6/10 9:56:56

PHP实现千万级物联网设备状态存储(基于Redis+MySQL的高性能架构设计)

第一章&#xff1a;PHP实现千万级物联网设备状态存储概述在物联网&#xff08;IoT&#xff09;应用不断扩展的背景下&#xff0c;如何高效存储与管理千万级设备的实时状态成为系统架构的关键挑战。传统的数据库设计难以应对高频写入、低延迟读取以及海量数据持久化的复合需求。…

作者头像 李华
网站建设 2026/5/29 4:08:08

为什么你的PHP视频流总是缓冲?这3个关键点必须掌握

第一章&#xff1a;为什么你的PHP视频流总是缓冲&#xff1f;这3个关键点必须掌握在构建基于PHP的视频流服务时&#xff0c;频繁的缓冲问题常常让用户流失。这通常不是网络带宽单一因素导致&#xff0c;而是服务器配置、文件处理逻辑与HTTP协议交互不当共同作用的结果。掌握以下…

作者头像 李华
网站建设 2026/5/30 14:37:33

能否去除HeyGem启动页广告?定制化需求反馈通道

能否去除HeyGem启动页广告&#xff1f;定制化需求反馈通道 在企业级AI应用日益普及的今天&#xff0c;越来越多机构开始尝试将数字人技术用于内部培训、客户服务和品牌宣传。然而&#xff0c;当一位银行科技部门负责人准备用数字人系统生成一段高管致辞视频时&#xff0c;却在点…

作者头像 李华