Pandas Series.value_counts()实例介绍

value_counts()函数返回一个Series, 其中包含唯一值的计数。它返回一个降序排列的对象, 这样它的第一个元素将成为最常出现的元素。
默认情况下, 它不包含NA值。
句法

Series.value_counts(normalize=False, sort=True, ascending=False, bins=None, dropna=True)

参数
  • normalize:如果为true, 则返回的对象将包含唯一值的相对频率。
  • sort:按值排序。
  • 升序:按升序排序。
  • bins:不对值进行计数, 而是将它们分组到半开式容器中, 这些容器为pd.cut(仅适用于数字数据)提供了便利。
  • dropna:不包括NaN计数。
退货
它返回计数的序列。
例1
import pandas as pdimport numpy as npindex = pd.Index([2, 1, 1, np.nan, 3])index.value_counts()

输出
1.023.012.01dtype: int64

例2
import pandas as pdimport numpy as npindex = pd.Index([2, 1, 1, np.nan, 3])a = pd.Series([2, 1, 1, np.nan, 3])a.value_counts(normalize=True)

输出
1.00.503.00.252.00.25dtype: float64

范例3
import pandas as pdindex = pd.Index([1, 3, 2, 2, 1, np.nan])index.value_counts()a = pd.Series([1, 3, 2, 2, 1, np.nan])a.value_counts(bins=2)

输出
(0.997, 2.0]4(2.0, 3.0]1dtype: int64

例子4
import pandas as pdindex = pd.Index([1, 3, 2, 2, 1, np.nan])index.value_counts()a = pd.Series([1, 3, 2, 2, 1, np.nan])a.value_counts(dropna=False)

【Pandas Series.value_counts()实例介绍】输出
2.021.02NaN13.01dtype: int64

    推荐阅读