pandas.Series.drop_duplicates#

Series.drop_duplicates(*, keep='first', inplace=False, ignore_index=False)[源代码]#

返回去除重复值的 Series。

Parameters:
keep : {‘first’, ‘last’, False}, 默认 ‘first’{‘first’, ‘last’, False}, default ‘first’

处理删除重复项的方法:

  • ‘first’ : 删除重复项,保留第一次出现的。

  • ‘last’ : 删除重复项,保留最后一次出现的。

  • False : 删除所有重复项。

inplace : bool, 默认 Falsebool, 默认

如果为 True,则就地执行操作并返回 None。

ignore_index : bool, 默认 Falsebool, 默认

如果为 True,则结果轴将标记为 0, 1, …, n - 1。

在 2.0.0 版本加入.

Returns:
Series 或 None

删除重复项后的 Series,如果 inplace=True 则返回 None。

参见

Index.drop_duplicates

Index 上的等效方法。

DataFrame.drop_duplicates

DataFrame 上的等效方法。

Series.duplicated

Series 上的相关方法,指示重复的 Series 值。

Series.unique

返回唯一的作为数组的值。

Examples

生成一个包含重复项的 Series。

>>> s = pd.Series(['llama', 'cow', 'llama', 'beetle', 'llama', 'hippo'],
...               name='animal')
>>> s
0     llama
1       cow
2     llama
3    beetle
4     llama
5     hippo
Name: animal, dtype: object

通过 ‘keep’ 参数,可以更改重复值的选择行为。 ‘first’ 值会保留每组重复项的第一次出现。keep 的默认值为 ‘first’。

>>> s.drop_duplicates()
0     llama
1       cow
3    beetle
5     hippo
Name: animal, dtype: object

‘keep’ 参数的值 ‘last’ 会保留每组重复项的最后一次出现。

>>> s.drop_duplicates(keep='last')
1       cow
3    beetle
4     llama
5     hippo
Name: animal, dtype: object

‘keep’ 参数的值 False 会删除所有重复项。

>>> s.drop_duplicates(keep=False)
1       cow
3    beetle
5     hippo
Name: animal, dtype: object