hist()函数被定义为一种从数据集中了解某些数值变量分布的快速方法。它将数字变量中的值划分为”
bins”
。它计算落入每个分类箱中的检查次数。这些容器负责通过可视化容器来快速直观地了解变量中值的分布。
我们可以使用DataFrame.hist()方法创建直方图, 该方法是matplotlib pyplot API的包装器。
它也是快速访问概率分布的有用工具。
句法
DataFrame.hist(data, column=None, by=None, grid=True, xlabelsize=None, xrot=None, ylabelsize=None, yrot=None, ax=None, sharex=False, sharey=False, figsize=None, layout=None, bins=10, **kwds)
参数
- 数据:一个DataFrame。
它是一个保存数据的pandas DataFrame对象。 - 列:指字符串或序列。
如果通过, 它将用于将数据限制为列的子集。 - by:这是一个可选参数。如果通过, 它将用于形成独立组的直方图。
- grid:它也是可选参数。用于显示轴线网格线。默认值True。
- xlabelsize:指整数值。默认值无。用于指定x轴标签大小的更改。
- xrot:表示浮点值。用于旋转x轴标签。默认值无。
- ylabelsize:表示整数值。用于指定y轴标签大小的更改。
- yrot:表示浮点值。用于旋转y轴标签。默认值无。
- ax:Matplotlib轴对象。
它定义了我们需要绘制直方图的轴。默认值无。 - sharex:布尔值。如果ax为None, 则默认值为True。否则为False。对于子图, 如果value为True, 它将共享x轴并将某些x轴标签设置为不可见。其默认值为True。
如果没有斧头, 则如果传入斧头, 则返回False。
- sharey:默认值False。如果子图为True, 则它共享y轴并将某些y轴标签设置为不可见。
- figsize:指要创建的图形的尺寸(以英寸为单位)。默认情况下, 它使用matplotlib.rcParams中的值。
- layout:这是一个可选参数。它返回直方图的布局(行, 列)的元组。
- bins:默认值10。它是指要使用的直方图bin的数量。如果给出整数值, 则它将返回bin +1 bin边缘的计算值。
- ** kwds:指所有其他要传递给matplotlib.pyplot.hist()的绘图关键字参数。
它返回matplotlib.AxesSubplot或numpy.ndarray。
例1
import pandas as pdinfo = pd.DataFrame({'length': [2, 1.7, 3.6, 2.4, 1], 'width': [4.2, 2.6, 1.6, 5.1, 2.9]})hist = info.hist(bins=4)
【Pandas DataFrame.hist()介绍和用法】输出
文章图片
推荐阅读
- Pandas DataFrame.mean()例子
- Pandas DataFrame.head()用法例子
- Pandas DataFrame.iterrows()用法示例
- Pandas DataFrame.describe()使用例子
- Pandas DataFrame.drop_duplicates()用例
- Pandas DataFrame.cut()用法例子
- Pandas DataFrame.astype()使用实例
- Pandas DataFrame.assign()用法介绍
- Pandas DataFrame.aggregate()使用例子