pandas.Series.unique#

Series.unique()[源代码]#

返回 Series 对象中的唯一值。

唯一值按出现顺序返回。基于哈希表的唯一值,因此**不**排序。

Returns:
ndarray 或 ExtensionArray

作为 NumPy 数组返回的唯一值。参见 Notes。

参见

Series.drop_duplicates

返回去除重复值的 Series。

unique

任何一维类数组对象的顶级唯一方法。

Index.unique

从 Index 对象返回具有唯一值的 Index。

Notes

将唯一值作为 NumPy 数组返回。对于由扩展数组支持的 Series,将返回一个具有唯一值的新该类型的 ExtensionArray 。这包括

  • Categorical

  • Period

  • 带时区的 Datetime

  • 无时区日期时间

  • Timedelta

  • Interval

  • 稀疏

  • IntegerNA

见示例部分。

Examples

>>> pd.Series([2, 1, 3, 3], name='A').unique()
array([2, 1, 3])
>>> pd.Series([pd.Timestamp('2016-01-01') for _ in range(3)]).unique()
<DatetimeArray>
['2016-01-01 00:00:00']
Length: 1, dtype: datetime64[ns]
>>> pd.Series([pd.Timestamp('2016-01-01', tz='US/Eastern')
...            for _ in range(3)]).unique()
<DatetimeArray>
['2016-01-01 00:00:00-05:00']
Length: 1, dtype: datetime64[ns, US/Eastern]

Categorical 对象将按出现顺序返回类别,并具有相同的 dtype。

>>> pd.Series(pd.Categorical(list('baabc'))).unique()
['b', 'a', 'c']
Categories (3, object): ['a', 'b', 'c']
>>> pd.Series(pd.Categorical(list('baabc'), categories=list('abc'),
...                          ordered=True)).unique()
['b', 'a', 'c']
Categories (3, object): ['a' < 'b' < 'c']