python可视化函数库的简单介绍

强烈推荐一款Python可视化神器!强烈必备!Plotly Express 是一个新的高级 Python 可视化库:它是 Plotly.py 的高级封装,它为复杂的图表提供了一个简单的语法 。
受 Seaborn 和 ggplot2 的启发,它专门设计为具有简洁,一致且易于学习的 API :只需一次导入,您就可以在一个函数调用中创建丰富的交互式绘图 , 包括分面绘图(faceting)、地图、动画和趋势线 。它带有数据集、颜色面板和主题,就像 Plotly.py 一样 。
Plotly Express 完全免费:凭借其宽松的开源 MIT 许可证,您可以随意使用它(是的 , 甚至在商业产品中?。?。
最重要的是,Plotly Express 与 Plotly 生态系统的其他部分完全兼容:在您的 Dash 应用程序中使用它,使用 Orca 将您的数据导出为几乎任何文件格式,或使用JupyterLab 图表编辑器在 GUI 中编辑它们!
用 pip install plotly_express 命令可以安装 Plotly Express 。
一旦导入Plotly Express(通常是 px ),大多数绘图只需要一个函数调用 , 接受一个整洁的Pandas dataframe,并简单描述你想要制作的图 。如果你想要一个基本的散点图,它只是 px.scatter(data,x =“column_name” , y =“column_name”) 。
以下是内置的 Gapminder 数据集的示例 , 显示2007年按国家/地区的人均预期寿命和人均GDP 之间的趋势:
如果你想通过大陆区分它们 , 你可以使用 color 参数为你的点着色,由 px 负责设置默认颜色,设置图例等:
这里的每一点都是一个国家,所以也许我们想要按国家人口来衡量这些点...... 没问题:这里也有一个参数来设置,它被称为 size:
如果你好奇哪个国家对应哪个点? 可以添加一个 hover_name ,您可以轻松识别任何一点:只需将鼠标放在您感兴趣的点上即可! 事实上,即使没有 hover_name,整个图表也是互动的:
也可以通过 facet_col =”continent“ 来轻松划分各大洲,就像着色点一样容易,并且让我们使用 x轴 对数(log_x)以便在我们在图表中看的更清晰:
也许你不仅仅对 2007年 感兴趣 , 而且你想看看这张图表是如何随着时间的推移而演变的 。可以通过设置 animation_frame=“year” (以及 animation_group =“country” 来标识哪些圆与控制条中的年份匹配)来设置动画 。
在这个最终版本中,让我们在这里调整一些显示,因为像“gdpPercap” 这样的文本有点难看,即使它是我们的数据框列的名称 。我们可以提供更漂亮的“标签” (labels),可以在整个图表、图例、标题轴和悬停(hovers)中应用 。我们还可以手动设置边界,以便动画在整个过程中看起来更棒:
因为这是地理数据 , 我们也可以将其表示为动画地图,因此这清楚地表明 Plotly Express 不仅仅可以绘制散点图(不过这个数据集缺少前苏联的数据) 。
事实上,Plotly Express 支持三维散点图、三维线形图、极坐标和地图上三元坐标以及二维坐标 。条形图(Bar)有二维笛卡尔和极坐标风格 。
进行可视化时,您可以使用单变量设置中的直方图(histograms)和箱形图(box)或小提琴图(violin plots),或双变量分布的密度等高线图(density contours) 。大多数二维笛卡尔图接受连续或分类数据,并自动处理日期/时间数据 。可以查看我们的图库 (ref-3) 来了解每个图表的例子 。
数据 探索 的主要部分是理解数据集中值的分布,以及这些分布如何相互关联 。Plotly Express 有许多功能来处理这些任务 。
使用直方图(histograms),箱形图(box)或小提琴图(violin plots)可视化单变量分布:
直方图:

推荐阅读