pandas.Index.duplicated#
- Index.duplicated(keep='first')[源代码]#
指示重复的索引值。
重复值在结果数组中用
True指示。可以指示所有重复项、除第一个以外的所有重复项或除最后一个以外的所有重复项。- Parameters:
- keep{‘first’, ‘last’, False}, 默认 ‘first’
要标记为缺失的重复值。
‘first’ : 标记重复项为
True,除了第一个出现。‘last’ : 标记重复项为
True,除了最后一个出现。False: 标记所有重复项为True。
- Returns:
- np.ndarray[bool]
参见
Series.duplicatedpandas.Series 上的等效方法。
DataFrame.duplicatedpandas.DataFrame 上的等效方法。
Index.drop_duplicates从 Index 中删除重复值。
Examples
默认情况下,对于每组重复值,第一个出现设置为 False,其余的设置为 True:
>>> idx = pd.Index(['lama', 'cow', 'lama', 'beetle', 'lama']) >>> idx.duplicated() array([False, False, True, False, True])
这等价于
>>> idx.duplicated(keep='first') array([False, False, True, False, True])
使用 ‘last’ 时,每组重复值的最后一个出现设置为 False,其余的设置为 True:
>>> idx.duplicated(keep='last') array([ True, False, True, False, False])
将 keep 设置为
False时,所有重复项都为 True:>>> idx.duplicated(keep=False) array([ True, False, True, False, True])