Pandas Series.unique()用法介绍

本文概述

  • 句法
  • 参数
  • 退货
  • 例子1
在Pandas中使用DataFrame时, 你需要查找列中存在的唯一元素。为此, 我们必须使用unique()方法从列中提取唯一值。 Python中的Pandas库可以轻松地帮助我们找到唯一的数据。
列中存在的唯一值按其出现的顺序返回。这不会排序其出现顺序。另外, 此方法基于哈希表。
它比numpy.unique()方法快得多, 并且还包含空值。
句法
pandas.unique(values)

参数【Pandas Series.unique()用法介绍】values:它是指由数组值组成的一维类似于数组的对象。
退货此方法返回numpy.ndarray或ExtensionArray对象, 可以是:
  • index:当用户通过索引作为输入时返回。
  • 分类:当用户传递分类dtype作为输入时返回。
  • ndarray:当用户传递ndarray / Series作为输入时返回。
例子1
import pandas as pdpd.unique(pd.Series([2, 1, 3, 3]))pd.unique(pd.Series([pd.Timestamp('20160101'), pd.Timestamp('20160101')]))

输出
array(['2016-01-01T00:00:00.000000000'], dtype='datetime64[ns]')

示例2:以下示例从Index中提取唯一的时间戳:
import pandas as pdimport numpy as nppd.unique(pd.Index([pd.Timestamp('20160101', tz='US/Eastern'), pd.Timestamp('20160101', tz='US/Eastern')]))

输出
DatetimeIndex(['2016-01-01 00:00:00-05:00'], dtype='datetime64[ns, US/Eastern]', freq=None)

    推荐阅读