WebDriver定位网页元素

webDriver是Python 的一个用于实现web自动化的第三方库,以百度首页为例,学习元素定位。
首先使用前端工具找到百度首页部分前端代码:
......

webDriver 中元素定位方法:
find_element_by_id()find_element_by_name() find_element_by_class_name()find_element_by_tag_name() find_element_by_link_test()find_element_by_partial_link_text() find_element_by_xpath()find_element_by_css_selector()

1.id/name/class/tag定位 例如百度输入框:
WebDriver定位网页元素
文章图片
Paste_Image.png
我们可以使用它的各种属性进行定位:
find_element_by_id("kw") find_element_by_name("wd") find_element_by_class_name("s_ipt") find_element_by_tag_name("input")-- 但是下查看前端会发现大量、、等标签,所以很难通过by_tag_name找到准确的定位,适用于批量定位。

2.link/partial link 定位: link定位是专门用来定位文本连接 的。比如:
视频 贴吧 更多产品 ------------------------------------------ find_element_by_link_test("视频") #当文本比较长的时候,我们可以取文本的一部分,只要这部分信息可以唯一标识这个连接就行: find_element_by_partial_link_text("更多")

3.XPath定位 例:(百度输入框和搜索框定位)
●绝对路径定位
find_element_by_xpath("/html/body/div/div/div/div/div/form/span/input")
find_element_by_xpath("/html/body/div/div/div/div/div/form/span[2]/input")
如果一个层级下有多个相同标签名,按上下顺序确定是第几个,如:span[2] 第二个表示搜索框
●元素属性定位
find_element_by_xpath("//input[@id='kw']") find_element_by_xpath("//input[@id='su']") find_element_by_xpath("//*[@id='su']")

//表示当前页面某个目录下,input是元素标签名,[@id='kw']表示元素的id属性,这里可以使用元素的任意属性名,只要能唯一识别该元素,如果不想指定标签名可以用*号代替
●层级属性结合
如果一个元素没有任何可以唯一标识的属性,可以找到他的上一级元素(上级没有找上上级...)
find_element_by_xpath("//span[@class='bg s_ipt_wr']/input") find_element_by_xpath("//span[@class='bg s_btn']/input")

●使用逻辑运算符
如果一个属性不能唯一区分一个元素,可以用逻辑运算符 ‘and’ 连接多个属性定位元素
find_element_by_xpath("//input[@id='kw' and @class='s_ipt']")

4.CSS定位 1.通过(.)号进行class属性定位,(#)号进行id属性定位:
find_element_by_css_selector(".s_ipt")
find_element_by_css_selector("#kw")
2.通过标签名定位
find_element_by_css_selector("input") #标签名重复概率大,适用定位一组元素
3.通过父子关系定位
find_element_by_css_selector("span>input")
4.通过属性定位
find_element_by_css_selector("autocomplete=off")
5.组合定位
find_element_by_css_selector("form.fm>span>input.s_ipt") #class属性为fm的form标签->span标签->标签名为input、class属性为s_ipt 的元素。

【WebDriver定位网页元素】WebDriver的8种定位方法还提供了统一的调用方法:find_element() 方法。通过By声明定位方法,再 传入响应的定位参数:
使用By之前导入By类:
form selenium.webdriver.common.by import By
find_element(By.ID, "kw")
find_element(By.NAME, "wd")
...

    推荐阅读