pandas.Index.duplicated#

Index.duplicated(keep='first')[源代码]#

指示重复的索引值。

重复值在结果数组中用 True 指示。可以指示所有重复项、除第一个以外的所有重复项或除最后一个以外的所有重复项。

Parameters:
keep{‘first’, ‘last’, False}, 默认 ‘first’

要标记为缺失的重复值。

  • ‘first’ : 标记重复项为 True,除了第一个出现。

  • ‘last’ : 标记重复项为 True,除了最后一个出现。

  • False : 标记所有重复项为 True

Returns:
np.ndarray[bool]

参见

Series.duplicated

pandas.Series 上的等效方法。

DataFrame.duplicated

pandas.DataFrame 上的等效方法。

Index.drop_duplicates

从 Index 中删除重复值。

Examples

默认情况下,对于每组重复值,第一个出现设置为 False,其余的设置为 True:

>>> idx = pd.Index(['lama', 'cow', 'lama', 'beetle', 'lama'])
>>> idx.duplicated()
array([False, False,  True, False,  True])

这等价于

>>> idx.duplicated(keep='first')
array([False, False,  True, False,  True])

使用 ‘last’ 时,每组重复值的最后一个出现设置为 False,其余的设置为 True:

>>> idx.duplicated(keep='last')
array([ True, False,  True, False, False])

将 keep 设置为 False 时,所有重复项都为 True:

>>> idx.duplicated(keep=False)
array([ True, False,  True, False,  True])