用 Python 写爬虫时应该注意哪些坑（） python

1.学会使用chrome浏览器查看通信以及查看元素格式
2.增加User-Agent, 这是最简单的反爬措施了
3.写爬虫最好使用Ipython，在交互式的环境下，可以时刻了解自己问题具体出在哪里
4.使用requests
5.用get或者post下好html之后，要确认你需要的东西html里面有，而不是之后用ajax或者javascript加载的。
6.解析的话，BeautifulSoup不错。对于少数非常特殊的，可以考虑用re。
【用 Python 写爬虫时应该注意哪些坑（）】7，需要大量采集数据的话，学会使用框架，比如scrapy。
进阶：
加入网站需要模拟登陆，里面使用了很多ajax或者javascript，或者反爬虫厉害，用requests的session，注意F12查看到底发送了什么数据。
实在不会，就使用模拟浏览器吧，推荐selenium，虽然速度慢点，内存多点，但是真的很省力，而且基本查不出来。
最后，爬虫速度不要太快，加上time.sleep(1),尽量少用多线程，别人建站也不容易，（尤其是小站）你不给别人带来很大的麻烦，别人也就睁一只眼闭一只眼了，否则封IP不是好玩的。

用 Python 写爬虫时应该注意哪些坑（）

推荐阅读

鸿蒙可以做电脑系统吗

山菜的做法

热玛吉适合什么样的人

松下空调lfe13km1怎么样,看完这些差不多就明白了

如果小孩子不听话怎么办如果小孩子不听话怎么教育

蜈蚣怕风油精的气味吗

oppo手机怎么关闭软件广告

息肉|息肉切除后，被查出肠癌，是咋回事？反复长息肉，是啥原因？

平安银行信用卡怎么申请提高额度平安银行信用卡怎么申请

mysql教程哪个好 mysql学习看谁的视频好

mysql怎么设置并发 mysql数据库并发问题

虎眼万年青放在家里哪个位置虎眼万年青的摆放风水禁忌

Android开始之Checkboxs

健康喝水五要点一定要牢记

自动挡刹车怎样防点头自动挡车刹车防点头

建造师资格证丢失怎么补办

iqoo3玩游戏卡顿怎么办

腐烂国度2巨霸版建筑师机制介绍建筑师可解锁建筑说明

高情商回复别人的表白

网易有道词典怎么去除广告？网易有道词典去除广告的方法