我自横刀向天笑,去留肝胆两昆仑。这篇文章主要讲述最新酷狗音乐反爬来袭,Python掌握酷狗排行榜加密规则相关的知识,希望能为你提供帮助。
【最新酷狗音乐反爬来袭,Python掌握酷狗排行榜加密规则】对你有用的话记得三连呦!
效果展示
文章图片
爬取目标网址:酷我音乐
文章图片
工具使用开发工具:pycharm
开发环境:python3.7, Windows10
使用工具包:requests,re
项目思路解析找到需要解析的榜单数据
文章图片
随意点击一个歌曲获取到音乐的详情数据 通过抓包的方式获取到音乐播放数据
文章图片
找到MP3的数据提交地址 mp3数据来自于这个url地址
文章图片
提交数据的网址:
将多个网址数据进行对比看看哪些参数是需要自行修改的
文章图片
变化的url数据有3个
- hash
- album_id
- _
文章图片
歌曲的数据都是来自网页源代码
文章图片
梳理整体思路:
- 从首页源码里提取出对应的hash、album_id值
- 组合成新的url地址
- 获取到json数据总的歌曲播放地址##
Pythonimport requests
import re
import time
?
?
def Tools(url):
headers = {
\'user-agent\': \'Mozilla/5.0 (Windows NT 10.0;
Win64;
x64) AppleWebKit/537.36 (Khtml, like Gecko) Chrome/91.0.4472.124 Safari/537.36 Edg/91.0.864.70\'
}
response = requests.get(url, headers=headers)
return response
?
?
def Save(name, url):
mp3 = Tools(url).content# 请求mp3地址链接 返回格式是16进制
f = open(\'./kugou/{}.mp3\'.format(name), \'wb\') # w 文件存在就写入不存在就会创建b进制读写
f.write(mp3)
f.close()
print(\'{}下载完成....\'.format(name))
?
?
url = \'https://www.kugou.com/yy/html/rank.html\'
response = Tools(url).text
album_id = re.findall(r\'"album_id":(\\d*?),\', response) # id
Hash = re.findall(r\'"Hash":"(.*?)",\', response)# hash
?
for a, h in zip(album_id, Hash):
# 生成时间戳
time1 = int(time.time() * 1000)
# 包含歌曲下载地址的url
urls = \'https://wwwapi.kugou.com/yy/index.php?r=play/getdata&
hash={}&
dfid=0zlWqK0UWNFa0weUnX0hjlFa&
mid=f79511e2e86914b99e351c42ba1f8bc7&
platid=4&
album_id={}&
_={}\'.format(h, a, time1)
response1 = Tools(urls).json()
audio_name = response1[\'data\'][\'audio_name\'].split(\'-\')[1]
play_url = response1[\'data\'][\'play_url\']
Save(audio_name, play_url)
关注我持续为您分享干货内容,你的收藏、评论、点赞就是对我最大的支持!
推荐阅读
- 红帽Linux入门指南第二期(Linux的基本使用)
- 质量那些事儿
- SSE图像算法优化系列三十一(Base64编码和解码算法的指令集优化(C#自带函数的3到4倍速度)。)
- traefik配置用户端透传ip(前端ELb 基于k8s平台)
- Windows显示器无信号
- oeasy教您玩转vim - 35 - # 正则表达
- 只要有热情和方法就能学好Linux
- 在elementor小部件中显示wordpress短代码()
- 在1页中按类别显示post-WordPress开发