Pandas DataFrame.hist()介绍和用法

hist()函数被定义为一种从数据集中了解某些数值变量分布的快速方法。它将数字变量中的值划分为” bins” 。它计算落入每个分类箱中的检查次数。这些容器负责通过可视化容器来快速直观地了解变量中值的分布。
我们可以使用DataFrame.hist()方法创建直方图, 该方法是matplotlib pyplot API的包装器。
它也是快速访问概率分布的有用工具。
句法

DataFrame.hist(data, column=None, by=None, grid=True, xlabelsize=None, xrot=None, ylabelsize=None, yrot=None, ax=None, sharex=False, sharey=False, figsize=None, layout=None, bins=10, **kwds)

参数
  • 数据:一个DataFrame。
    它是一个保存数据的pandas DataFrame对象。
  • 列:指字符串或序列。
    如果通过, 它将用于将数据限制为列的子集。
  • by:这是一个可选参数。如果通过, 它将用于形成独立组的直方图。
  • grid:它也是可选参数。用于显示轴线网格线。默认值True。
  • xlabelsize:指整数值。默认值无。用于指定x轴标签大小的更改。
  • xrot:表示浮点值。用于旋转x轴标签。默认值无。
  • ylabelsize:表示整数值。用于指定y轴标签大小的更改。
  • yrot:表示浮点值。用于旋转y轴标签。默认值无。
  • ax:Matplotlib轴对象。
    它定义了我们需要绘制直方图的轴。默认值无。
  • sharex:布尔值。如果ax为None, 则默认值为True。否则为False。对于子图, 如果value为True, 它将共享x轴并将某些x轴标签设置为不可见。其默认值为True。
    如果没有斧头, 则如果传入斧头, 则返回False。
注意:在ax和sharex中都传递true, 它将更改所有子图的所有x轴标签。
  • sharey:默认值False。如果子图为True, 则它共享y轴并将某些y轴标签设置为不可见。
  • figsize:指要创建的图形的尺寸(以英寸为单位)。默认情况下, 它使用matplotlib.rcParams中的值。
  • layout:这是一个可选参数。它返回直方图的布局(行, 列)的元组。
  • bins:默认值10。它是指要使用的直方图bin的数量。如果给出整数值, 则它将返回bin +1 bin边缘的计算值。
  • ** kwds:指所有其他要传递给matplotlib.pyplot.hist()的绘图关键字参数。
退货
它返回matplotlib.AxesSubplot或numpy.ndarray。
例1
import pandas as pdinfo = pd.DataFrame({'length': [2, 1.7, 3.6, 2.4, 1], 'width': [4.2, 2.6, 1.6, 5.1, 2.9]})hist = info.hist(bins=4)

【Pandas DataFrame.hist()介绍和用法】输出
Pandas DataFrame.hist()介绍和用法

文章图片

    推荐阅读