scrapy-3.items并存入csv/json
【scrapy-3.items并存入csv/json】如果只是把数据打印出来,还是有些不太够用,scrapy还提供了各种存储途径。
items我觉得有点像pandas里的列,名字就是列名。items文件已经写好框架只要把你需要爬取的名字加进去就好。
import scrapyclass ZdmItem(scrapy.Item):
# define the fields for your item here like:
name = scrapy.Field()
price = scrapy.Field()
# pass
然后更改spider程序。
import scrapy
from pyquery import PyQuery as pq
#导入items
from zdm.items import ZdmItemclass SmzdmCrawler(scrapy.Spider):
name = 'smzdm'
start_urls = ['https://faxian.smzdm.com/']def parse(self, response):
res = pq(response.body)
for item in res('.feed-block-ver').items():
yield scrapy.Request(item('a').attr('href'),self.parse_detail)def parse_detail(self,response):
res = pq(response.body)
#导入item,添加内容
zdmitem = ZdmItem()
zdmitem['name'] = res('.article_title em').eq(0).text()
zdmitem['price'] = res('.article_title span').text()
yield zdmitem
更改之处为导入item和把原本print的部分放入到item里去。
然后就可以存到json,csv等格式了。
只需要在terminal里输入
scrapy crawl smzdm -o smzdm.csv
scrapy crawl smzdm -o smzdm.json
就存好了
推荐阅读
- 抱怨并没有任何意义
- 读猫文收获
- 喜剧演员,小丑一样的活着
- 如果鸽子会说话(二十三)
- 排序(归并排序)
- 逃避问题并不能让问题消失
- 羁旅.和陆游临安春雨初霁并步原韵(旧体诗)
- 【剽悍晨读感悟】0714并不是要把一天过成48小时的样子
- 用npm发布一个包的教程并编写一个vue的插件发布
- 来日方长并不长