pandas.Series.duplicated#

Series.duplicated(keep='first')[源代码]#

指示重复的 Series 值。

重复值用结果 Series 中的 True 值指示。可以指示所有重复项、除第一次出现的重复项外所有项,或除最后一次出现的重复项外所有项。

Parameters:
keep{‘first’, ‘last’, False}, 默认 ‘first’

处理删除重复项的方法:

  • ‘first’ : 标记重复项为 True,除了第一个出现。

  • ‘last’ : 标记重复项为 True,除了最后一个出现。

  • False : 标记所有重复项为 True

Returns:
Series[bool]

指示每个值是否在先前的值中出现过的 Series。

参见

Index.duplicated

pandas.Index 上的等效方法。

DataFrame.duplicated

pandas.DataFrame 上的等效方法。

Series.drop_duplicates

从 Series 中删除重复值。

Examples

默认情况下,对于每组重复值,第一次出现设置为 False,所有其他设置为 True:

>>> animals = pd.Series(['llama', 'cow', 'llama', 'beetle', 'llama'])
>>> animals.duplicated()
0    False
1    False
2     True
3    False
4     True
dtype: bool

这等价于

>>> animals.duplicated(keep='first')
0    False
1    False
2     True
3    False
4     True
dtype: bool

使用 ‘last’ 时,每组重复值的最后一个出现设置为 False,其余的设置为 True:

>>> animals.duplicated(keep='last')
0     True
1    False
2     True
3    False
4    False
dtype: bool

将 keep 设置为 False 时,所有重复项都为 True:

>>> animals.duplicated(keep=False)
0     True
1    False
2     True
3    False
4     True
dtype: bool