WebDriver定位网页元素
webDriver是Python 的一个用于实现web自动化的第三方库,以百度首页为例,学习元素定位。首先使用前端工具找到百度首页部分前端代码:
webDriver 中元素定位方法:
find_element_by_id()find_element_by_name()
find_element_by_class_name()find_element_by_tag_name()
find_element_by_link_test()find_element_by_partial_link_text()
find_element_by_xpath()find_element_by_css_selector()
1.id/name/class/tag定位 例如百度输入框:
文章图片
Paste_Image.png
我们可以使用它的各种属性进行定位:
find_element_by_id("kw")
find_element_by_name("wd")
find_element_by_class_name("s_ipt")
find_element_by_tag_name("input")-- 但是下查看前端会发现大量、、等标签,所以很难通过by_tag_name找到准确的定位,适用于批量定位。
2.link/partial link 定位: link定位是专门用来定位文本连接 的。比如:
视频
贴吧
更多产品
------------------------------------------
find_element_by_link_test("视频")
#当文本比较长的时候,我们可以取文本的一部分,只要这部分信息可以唯一标识这个连接就行:
find_element_by_partial_link_text("更多")
3.XPath定位 例:(百度输入框和搜索框定位)
●绝对路径定位
find_element_by_xpath("/html/body/div/div/div/div/div/form/span/input")
find_element_by_xpath("/html/body/div/div/div/div/div/form/span[2]/input")
如果一个层级下有多个相同标签名,按上下顺序确定是第几个,如:span[2] 第二个表示搜索框
●元素属性定位
find_element_by_xpath("//input[@id='kw']")
find_element_by_xpath("//input[@id='su']")
find_element_by_xpath("//*[@id='su']")
//表示当前页面某个目录下,input是元素标签名,[@id='kw']表示元素的id属性,这里可以使用元素的任意属性名,只要能唯一识别该元素,如果不想指定标签名可以用*号代替
●层级属性结合
如果一个元素没有任何可以唯一标识的属性,可以找到他的上一级元素(上级没有找上上级...)
find_element_by_xpath("//span[@class='bg s_ipt_wr']/input")
find_element_by_xpath("//span[@class='bg s_btn']/input")
●使用逻辑运算符
如果一个属性不能唯一区分一个元素,可以用逻辑运算符 ‘and’ 连接多个属性定位元素
find_element_by_xpath("//input[@id='kw' and @class='s_ipt']")
4.CSS定位 1.通过(.)号进行class属性定位,(#)号进行id属性定位:
find_element_by_css_selector(".s_ipt")
find_element_by_css_selector("#kw")
2.通过标签名定位
find_element_by_css_selector("input") #标签名重复概率大,适用定位一组元素
3.通过父子关系定位
find_element_by_css_selector("span>input")
4.通过属性定位
find_element_by_css_selector("autocomplete=off")
5.组合定位
find_element_by_css_selector("form.fm>span>input.s_ipt")
#class属性为fm的form标签->span标签->标签名为input、class属性为s_ipt 的元素。
【WebDriver定位网页元素】WebDriver的8种定位方法还提供了统一的调用方法:find_element() 方法。通过By声明定位方法,再 传入响应的定位参数:
使用By之前导入By类:
form selenium.webdriver.common.by import By
find_element(By.ID, "kw")
find_element(By.NAME, "wd")
...
推荐阅读
- 使用协程爬取网页,计算网页数据大小
- 三国谋略22(找准你的定位)
- web网页模板|如此优秀的JS轮播图,写完老师都沉默了
- 渠道云定位
- 品牌定位及纠偏|品牌定位及纠偏 | 大牌训练营第二次作业 | 张胜萍
- markdown中使用iframe|markdown中使用iframe 嵌套网页
- 第六课|第六课 js管理页面元素位置大小
- EXCEL的汽车导航-全能的GPS定位
- 店铺定价
- 微信小程序____CSS篇之定位(position)及浮动(float)