1行代码完成可视化(Seaborn3个常用方法示例)
数据可视化基本上是数据的图形表示。在探索性数据分析中,可以使用数据可视化来理解变量之间的关系,还可以通过视化数据揭示底层结构或了解数据信息。
有多种工具可以帮助我们创建数据可视化。Seaborn就是其中之一 ,它是一个流行的 Python 数据可视化库。虽然Seaborn也是基于 Matplotlib ,但是与其他流行的数据可视化库相比,Seaborn 的语法更简单需要的代码更少。
只需一行 Seaborn 代码,我们就能够创建最常用的绘图并对其进行自定义,这是我们将在本文中重点介绍的内容。本文中将使用 Seaborn 的来创建以下绘图:
- 散点图
- 折线图
- 直方图
- 箱形图
Seaborn 有一些内置的数据集,可以使用 load_dataset 函数访问。本文将使用penguins和taxis数据集进行演示。
# importing libraries
import pandas as pd
import seaborn as sns
sns.set(style="darkgrid")# reading the datasets
penguins = sns.load_dataset(name="penguins")
taxis = sns.load_dataset(name="taxis")
散点图
penguins.head()
文章图片
relplot 是最常用的一个函数。可以创建散点图和折线图,因为两种绘图类型主要用于研究变量之间的关系。
以下代码创建散点图。height 和 aspect 参数调整图形大小。
sns.relplot(data=https://www.it610.com/article/penguins, x="bill_length_mm", y="bill_depth_mm",
kind="scatter", height=6, aspect=1.4)
文章图片
每个点代表一个数据点(即行)。我们可以使用 hue 参数通过以不同的颜色显示来区分不同的类别。这是一个将上图中的雌性和雄性企鹅分开的示例。
sns.relplot(data=https://www.it610.com/article/df, x="bill_length_mm", y="bill_depth_mm",
hue="sex", kind="scatter", height=6, aspect=1.4)
文章图片
折线图 折线图是另一种非常常用的关系图。它可以展示值如何随时间或连续测量而变化。
我们将创建一个折线图来可视化每日乘客数量,该数量可以使用 Pandas 的 groupby 函数从出租车数据集中计算出来。为了让事情变得更有趣,我们还分别计算不同支付方式的总数。
taxis["date"] = taxis["pickup"].astype("datetime64[ns]").dt.datetaxis_daily = taxis.groupby(["date","payment"], as_index=False).agg(
total_passengers = ("passengers","sum"),
total_amount = ("total","sum")
)taxis_daily.head()
文章图片
以下代码行创建了一个显示每日总乘客人数的折线图。
sns.relplot(data=https://www.it610.com/article/taxis_daily, x="date", y="total_passengers",
hue="payment", kind="line", height=5, aspect=2)
文章图片
直方图 直方图用于可视化连续变量的数据分布。它们将值范围划分为离散的 bin,并显示每个 bin 中的数据点数(即行)。
对于前面的示例,计算每日乘客人数和总量创建总金额的直方图,如下所示:
sns.displot(data=https://www.it610.com/article/taxis_daily, x="total_amount", kind="hist",
height=5, aspect=1.5, bins=12)
文章图片
displot 函数可以用于创建直方图, kde图 和 ecdf 图。bins 参数控制直方图中的 bin 数量。
这个直方图告诉我们的是,花费的总金额通常在 1000 左右。条的高度与它们所代表的范围内的值的数量成正比。
箱形图 箱线图是一个分类分布图,显示变量在中位数和四分位数方面的分布。Seaborn 的 catplot 函数可以创建箱形图。
sns.catplot(data=https://www.it610.com/article/penguins, x="island", y="body_mass_g", kind="box",
height=5, aspect=1.5)
文章图片
彩色框覆盖了第一个和第三个四分位数之间的范围,中间的线是中值。当所有值按升序排序时:
- 第一个四分位数是找到 25% 数据点的值。
- 中位数是中间的点。
- 第三个四分位数是找到 75% 数据点的值。
总结 Seaborn 使创建数据可视化变得非常容易。它们提供了清晰直观的语法。并且seaborn的函数语法基本相同。只需更改函数名称和 kind 参数,就可以只用一行代码创建许多不同的图。
https://www.overfit.cn/post/64e1f6f65f0a4a19b01ded1e2fe82a32
【1行代码完成可视化(Seaborn3个常用方法示例)】作者:Soner Y?ld?r?m
推荐阅读
- Less嵌套详解
- 第一个SSM整个框架完成增删改查的项目(里面的配置文件可以复用)
- Less的注释
- Win10系统如何运用讯飞语音输入法完成语音输入?
- angular 分离app.module.ts代码
- 第四章(重构代码[学习Android Studio汉化教程])
- 在微信下载app引导页代码
- 25行Python代码实现人脸识别
- 无法保存打印机设置怎样办?打印机设置设置无法完成处理办法
- 获取Go程序汇编代码的3种方法