pandas.Series.duplicated#
- Series.duplicated(keep='first')[源代码]#
指示重复的 Series 值。
重复值用结果 Series 中的
True值指示。可以指示所有重复项、除第一次出现的重复项外所有项,或除最后一次出现的重复项外所有项。- Parameters:
- keep{‘first’, ‘last’, False}, 默认 ‘first’
处理删除重复项的方法:
‘first’ : 标记重复项为
True,除了第一个出现。‘last’ : 标记重复项为
True,除了最后一个出现。False: 标记所有重复项为True。
- Returns:
- Series[bool]
指示每个值是否在先前的值中出现过的 Series。
参见
Index.duplicatedpandas.Index 上的等效方法。
DataFrame.duplicatedpandas.DataFrame 上的等效方法。
Series.drop_duplicates从 Series 中删除重复值。
Examples
默认情况下,对于每组重复值,第一次出现设置为 False,所有其他设置为 True:
>>> animals = pd.Series(['llama', 'cow', 'llama', 'beetle', 'llama']) >>> animals.duplicated() 0 False 1 False 2 True 3 False 4 True dtype: bool
这等价于
>>> animals.duplicated(keep='first') 0 False 1 False 2 True 3 False 4 True dtype: bool
使用 ‘last’ 时,每组重复值的最后一个出现设置为 False,其余的设置为 True:
>>> animals.duplicated(keep='last') 0 True 1 False 2 True 3 False 4 False dtype: bool
将 keep 设置为
False时,所有重复项都为 True:>>> animals.duplicated(keep=False) 0 True 1 False 2 True 3 False 4 True dtype: bool