python|python淘宝关键字词云分析

前言 【python|python淘宝关键字词云分析】续上篇《Python爬虫 获得淘宝商品评论》用python实际应用了一把。今天试着用python试玩一词云。从客户搜索的关键字中分析下客户的喜好,从而去优化宝贝标题,提高宝贝曝光率。

“词云”是对文本中出现频率较高的“关键词”予以视觉上的突出,形成“关键词云层”或“关键词渲染”,从而过滤掉大量的文本信息,使浏览网页者只要一眼扫过文本就可以领略文本的主旨
正文 0x01 数据来源 数据来源是 淘宝直通车表,下载是excel文档,筛选二级类目“染发烫发”,得到相关关键字列表,然后统一贴至txt中。我收集了下列数据并存放至ranfa.txt中
文件名
07月26日TOP20万词表PC.xlsx
07月26日TOP20万词表无线.xlsx
06月27日TOP20万词表PC.xlsx
06月27日TOP20万词表无线.xlsx
05月23日TOP20万词表无线.xlsx
4月25TOP20万词表无线.xlsx
0x02 代码 安装wordcloud 和 相关库存。详细安装说明
python库名
wordcloud
matplotlib
numpy
pillow
jieba
源代码块
import os import jieba import matplotlib.pyplot as plt from os import path from wordcloud import WordCloud, STOPWORDS, ImageColorGeneratortext = open(path.join(os.getcwd(), 'ranfa.txt')).read() # print(text) text = ' '.join(jieba.cut(text)) # print(text) backgroud_Image = plt.imread('12.jpg') wordcloud = WordCloud( background_color = 'black',# 设置背景颜色 mask = backgroud_Image, # max_words = 2000,# 设置最大现实的字数 stopwords = STOPWORDS,# 设置停用词 font_path='C:\Windows\Fonts\simsun.ttc', max_font_size=70,# 设置字体最大值 # min_font_size=5, random_state=42, scale=2, ).generate(text)image_colors = ImageColorGenerator(backgroud_Image) plt.imshow(wordcloud.recolor(color_func=image_colors)) plt.imshow(wordcloud) plt.axis("off") plt.show()

0x03 词云效果 python|python淘宝关键字词云分析
文章图片

分析 从图片我们一目了然,客户购买时最先搜索的关键字。淘宝卖家可以根据关键字优化标题,增加宝贝曝光率。
简要分析
1. 搜索频率最高是“染发”、“染发剂”。
2. 多数客户更佳关注无害“植物”、“纯天然”染发。
3. 颜色上更多客户选择黑色
更多分析…
源码下载 链接: https://pan.baidu.com/s/1xRkwQNePtRf_ScVtKsROHg
密码: 4edk
广告 纯天然植物提取染发剂,有需要的朋友客户关注下我老婆的店铺。
【广州威蒂娜品牌店】,復·制这段描述€kmMQb0VNFEr€后咑閞手机淘宝或者用浏览器咑閞http://m.tb.cn/h.32gDlKv查看

    推荐阅读