- 首页 > it技术 > >
【python爬取网上图片】爬取网址:http://www.jikexueyuan.com/course
import re
import requests#读取源代码文件
# f = open('test.txt','r',encoding='utf-8')
# html = f.read()
# f.close
with open('test.txt','r+') as f:
html = f.read()# url = 'http://www.jikexueyuan.com/course'
# html = requests.get(url).text #匹配图片网址
pic_url =re.findall('img src="https://www.it610.com/article/(.*?)" class="lessonimg"',html,re.S)
i = 0
# print(pic_url)
for each in pic_url:
print('now downloading:'+each)
pic = requests.get(each)
#open()语法格式:open(filename, mode)
fp = open('pic\\'+str(i)+'.jpg','wb')#新建文件夹pic储存图片
#wb以二进制格式打开一个文件只用于写入。
#如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。
fp.write(pic.content)
fp.close()
i += 1
推荐阅读