前言 【python|python淘宝关键字词云分析】续上篇《Python爬虫 获得淘宝商品评论》用python实际应用了一把。今天试着用python试玩一词云。从客户搜索的关键字中分析下客户的喜好,从而去优化宝贝标题,提高宝贝曝光率。
“词云”是对文本中出现频率较高的“关键词”予以视觉上的突出,形成“关键词云层”或“关键词渲染”,从而过滤掉大量的文本信息,使浏览网页者只要一眼扫过文本就可以领略文本的主旨正文 0x01 数据来源 数据来源是 淘宝直通车表,下载是excel文档,筛选二级类目“染发烫发”,得到相关关键字列表,然后统一贴至txt中。我收集了下列数据并存放至ranfa.txt中
文件名 |
---|
07月26日TOP20万词表PC.xlsx |
07月26日TOP20万词表无线.xlsx |
06月27日TOP20万词表PC.xlsx |
06月27日TOP20万词表无线.xlsx |
05月23日TOP20万词表无线.xlsx |
4月25TOP20万词表无线.xlsx |
python库名 |
---|
wordcloud |
matplotlib |
numpy |
pillow |
jieba |
import os
import jieba
import matplotlib.pyplot as plt
from os import path
from wordcloud import WordCloud, STOPWORDS, ImageColorGeneratortext = open(path.join(os.getcwd(), 'ranfa.txt')).read()
# print(text)
text = ' '.join(jieba.cut(text))
# print(text)
backgroud_Image = plt.imread('12.jpg')
wordcloud = WordCloud(
background_color = 'black',# 设置背景颜色
mask = backgroud_Image,
# max_words = 2000,# 设置最大现实的字数
stopwords = STOPWORDS,# 设置停用词
font_path='C:\Windows\Fonts\simsun.ttc',
max_font_size=70,# 设置字体最大值
# min_font_size=5,
random_state=42,
scale=2,
).generate(text)image_colors = ImageColorGenerator(backgroud_Image)
plt.imshow(wordcloud.recolor(color_func=image_colors))
plt.imshow(wordcloud)
plt.axis("off")
plt.show()
0x03 词云效果
文章图片
分析 从图片我们一目了然,客户购买时最先搜索的关键字。淘宝卖家可以根据关键字优化标题,增加宝贝曝光率。
简要分析
1. 搜索频率最高是“染发”、“染发剂”。
2. 多数客户更佳关注无害“植物”、“纯天然”染发。
3. 颜色上更多客户选择黑色
更多分析…
源码下载 链接: https://pan.baidu.com/s/1xRkwQNePtRf_ScVtKsROHg
密码: 4edk
广告 纯天然植物提取染发剂,有需要的朋友客户关注下我老婆的店铺。
【广州威蒂娜品牌店】,復·制这段描述€kmMQb0VNFEr€后咑閞手机淘宝或者用浏览器咑閞http://m.tb.cn/h.32gDlKv查看
推荐阅读
- coding4fun|使用Python制作中文词云
- PYTHON|python(应用)中文输出拼音
- ORACLE|oracle利用函数实现oracle表生成mysql建表DDL
- Pygame实战|【Pygame实战】众志成城 同心战“疫”,为抗疫加油,只待春暖花开(附抗疫小游戏)
- 神经网络|目标检测算法YOLOv4详解
- 蓝桥杯试题|蓝桥杯基础试题汇总(Python)看这一篇就够了
- python|经典非局部均值滤波(NLM)算法python实现(1)
- Turtle|【Turtle系列】2022年春天限定(“樱你而来”带着喜欢的人一起去看一场粉色浪潮吧~)
- Python|【Turtle系列】端正心态正确面对疫情,守护安全防线不放松,共抗疫情,只待春来~