python|python selenium实现登录豆瓣示例详解
使用python爬虫selenium访问豆瓣https://www.douban.com/,实现模拟登录过程。
网页界面如图所示
文章图片
【python|python selenium实现登录豆瓣示例详解】首先导包后,定位图中 密码登录 的element,并点击。
经分析,该标签的class_name为’account-tab-account’。
文章图片
from selenium import webdriverimport timedriver = webdriver.Chrome()driver.get('https://www.douban.com/')# 点击 密码登录按钮 。但是找不到该element,不存在网页中driver.find_element_by_class_name('account-tab-account').click()
但是该段代码结果出现了报错,定位不到目标元素。
经核实,发现该element并不存在与网页源码中。
经分析,登录界面存在于一个叫iframe的标签中。iframe这个标签是嵌套在这个网页中的,单独拿出来也能用。所以并不存在于网页源码中。
文章图片
访问该src链接可以看到如下界面:
文章图片
iframe中的元素不属于原网页的元素,但是iframe在网页源码中,要获取其元素,先定位iframe:
文章图片
# 找到登陆的iframelogin_iframe = driver.find_element_by_xpath('//div[@class="login"]/iframe')# 切换到iframedriver.switch_to.frame(login_iframe)# 点击密码登陆driver.find_element_by_class_name('account-tab-account').click()
找到之后,还要切换进去,使用 switch_to 方法。
经测试,点击成功。
文章图片
接下来,就是输入账号和密码过程了
# 填写账号driver.find_element_by_id('username').send_keys('123456789@163.com')time.sleep(2)# 填写密码driver.find_element_by_id('password').send_keys('xxxx')
登录
# 点击登陆按钮driver.find_element_by_xpath('/html/body/div[1]/div[2]/div[1]/div[5]/a').click()
也可以通过JS点击
execute_script() 方法
login_button = driver.find_element_by_xpath('/html/body/div[1]/div[2]/div[1]/div[5]/a')driver.execute_script("arguments[0].click()", login_button)
此外,在输入账号密码前,有时也会遇到输入框中有诸如“请输入账号”、“请输入密码”这样的文字(默认值),需要清除掉后才能输入,否则输入内容会重叠。(此例中不会,此例中输入新内容后自动覆盖原有的“手机号/邮箱”、“密码”字样)清楚输入框中的文字,使用 clear 方法。
# 以清除用户名一栏的内容为例driver.find_element_by_id('username').clear()
最后,模拟登陆的目的,一般是为了获取cookie。使用到以下命令。
get_cookies()
print(driver.get_cookies())
文章图片
到此这篇关于python selenium登录豆瓣示例详解的文章就介绍到这了,更多相关python selenium登录豆瓣内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!
推荐阅读
- docker安装elastic|docker安装elastic search和kibana的实现
- SpringBoot|SpringBoot 枚举类型的自动转换的实现
- 贝叶斯优化python包_《用贝叶斯优化进行超参数调优》
- Tomcat实现基于域名的多虚拟主机
- BigTable的开源实现(HBase)
- C#/VB.NET 实现Word和ODT文档相互转换
- Java 实现订单未支付超时自动取消
- 如何利用Python随机从list中挑选一个元素
- 详解线程同步和线程互斥,Java如何实现线程同步和互斥
- # yyds干货盘点 # Python面向对象中的类变量,实例变量怎么来理解()