豆瓣ｔｏｐ２５０豆瓣ｔｏｐ２５０

import requests
import bs4
import re
import openpyxl
def open_url(url):
【豆瓣ｔｏｐ２５０】# 使用代理
# proxies = {"http": "127.0.0.1:1080", "https": "127.0.0.1:1080"}
headers = {
'user-agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/57.0.2987.98 Safari/537.36'}
# res = requests.get(url, headers=headers, proxies=proxies)
res = requests.get(url,headers=headers)
return res
def find_movies(res):
soup = bs4.BeautifulSoup(res.text,'html.parser')
# 电影名
movies = []
targets = soup.find_all("div",class_="hd")
for eachin targets:
movies.append(each.a.span.text)
# 评分
ranks = []
targets = soup.find_all("span",class_="rating_num")
for eachin targets:
ranks.append(each.text)
# 资料
messages = []
targets = soup.find_all("div",class_="bd")
for eachin targets:
try:
messages.append(each.p.text.split('\n')[1].strip() + each.p.text.split('\n')[2].strip())
except:
continue
result = []
length =len(movies)
for iin range(length):
result.append([movies[i], ranks[i], messages[i]])
return result
# 找出一共有多少个页面
def find_depth(res):
soup = bs4.BeautifulSoup(res.text,'html.parser')
depth = soup.find('span',class_='next').previous_sibling.previous_sibling.text
return int(depth)
def save_to_excel(result):
wb = openpyxl.Workbook()
ws = wb.active
ws['A1'] ="电影名称"
ws['B1'] ="评分"
ws['C1'] ="资料"
for eachin result:
ws.append(each)
wb.save("豆瓣TOP250电影.xlsx")
def main():
host ="https://movie.douban.com/top250"
res = open_url(host)
depth = find_depth(res)
result = []
for iin range(depth):
url = host +'/?start=' +str(25 * i)
res = open_url(url)
result.extend(find_movies(res))
'''
with open("test.txt", "w", encoding="utf-8") as f:
for each in result:
f.write(each)
'''
save_to_excel(result)
if __name__ =="__main__":
main()

豆瓣ｔｏｐ２５０

推荐阅读

尼康3400值得入手吗尼康340价格

中医四诊室中医堂怎么样

运动励志币计划

打新冠加强针不满48小时核酸会阳性吗

河南赊刀人最新预言2021 赊刀人2021年10月前兑现

匆匆那些年

遇到博世冰箱显示横杠怎么办？3个处理方法帮助你

电脑hdmi接口没有反应解决方法

win10系统与安卓系统,安装手机驱动程序需要注意什么?

芥菜种植最佳时间和方法及注意事项图片芥菜种植最佳时间和方法及注意事项

电饭煲内胆涂层有划痕还能用吗电饭煲内胆涂层有划痕还能用吗视频

姓氏来源姓氏来源查询表

甲状腺结节忌食哪些食物

店面部分转租没有经过房东同意转租犯法吗？

玉米秃尖怎么办如何防治玉米秃尖

mla-tl10是什么型号mla-tl10型号是什么

老人失眠怎么办：6招还你好睡眠

md788zp/a是什么型号 md788zp/a的型号是什么

比亚迪f3水温正常不过沒有热风 17年比亚迪f3有时候水温高有时候不高

达尔文进化岛新手攻略,达尔文进化岛若何举行搭配