用python写爬虫--3.1解析网页+pyquery 用python写爬虫--3.1解析网页+p

前面用的是beautifulsoup来解析，最近用的pyquery，觉得也挺好用，就先试试pyquery。
这个库当然有很多用法，我只说我用的习惯的几个。
当然，首先想好自己爬的是什么，前面说了，我想要的是每项的价格跟标题。
额，解析有一个思路，叫从大div中选小项，就是说，我想要的是一页中每一项的价格和标题，就先找到每一项div的class名，再用迭代找到每一个div里的价格跟标题，有一点绕，举个例子。
先用F12看看页面。点element，再点最左边的箭头。再点选任一项，要点到div最外层框子上。就会出现如图。

文章图片
这个feed-block-ver就是大项，里面的feed-ver-title就是标题，z-highlight z-ellipsis就是价格，这两个就是小项.用for循环来迭代。

文章图片
为啥不直接找file('.feed-ver-title').text()？
因为所有内容会挤到一起，我不晓得怎么换的行。最后一行就是print(file('.feed-ver-title').text())的效果

文章图片
现在来说pyquery，我用的上的是file = pq(re.text)，这句是用pq来解析网页
1.file('.feed-block-ver').items()是页面中所有class为feed-block-ver的div，就包含了div里的所有信息，items（）是个生成器，用于遍历所有上述div
2.hr = item('a').attr('href')attr这个是获取a标签的属性，这里提取的是href
3.file('.feed-block-ver').eq(0) .text()eq(0)是file('.feed-block-ver')中的第一个,括号里是index，这个用于你要提取的信息，一般是没有特别的标识，class，p之类，只能通过数数来的，
4..text() 提取标签的文字信息，这个应该很简单了
另外还有一个事情值得注意，file('.feed-block-ver a')代表a前面有个空格表示.feed-block-ver下面的a标签
有了思路，后面提取就是很简单的事了，下一次讲讲提取的利器Infolite
【用python写爬虫--3.1解析网页+pyquery】.

用python写爬虫--3.1解析网页+pyquery

推荐阅读

顺丰速递单号查询查快递信息官网顺丰速递单号查询查快递信息

不急不躁就是最好的状态

小朋友过生日送什么礼物好

诗姐诗妹接龙

投稿|淘系女装脱去“黄金甲”

广仁医院是不是私立医院杭州广仁医院怎么样

新手如何开自动挡汽车呢图片新手如何开自动挡汽车呢

可以带上飞机的行李箱尺寸图片可以带上飞机的行李箱尺寸

如何正确晒太阳补钙

subverse阿根廷怎么买 subverse阿根廷区买法一览

三菱电机空调显示UL处理方法,是因为这些原因

捷达vs5的发动机和大众哪款一样捷达vs5发动机和大众哪个一样

苦瓜怎么做不苦苦瓜怎么吃不苦

专家教你节后怎样清理肠胃

火车的英语怎么写火车翻译成英文

go语言与java Go语言与环境

柞树叶

华为mate40价格多少？华为mate40pro内屏坏了多少钱

尼康fm2镜头怎么装尼康fm2相机修理

iphone12|华为手机销量跌42%，苹果暴涨22%，中国市场不喜欢华为了？