pandas.Index.drop_duplicates#

Index.drop_duplicates(*, keep='first')[源代码]#

返回去除了重复值的 Index。

Parameters:
keep : {‘first’, ‘last’, False}, 默认 ‘first’{‘first’, ‘last’, False}, default ‘first’
  • ‘first’ : 删除重复项,保留第一次出现的。

  • ‘last’ : 删除重复项,保留最后一次出现的。

  • False : 删除所有重复项。

Returns:
pandas.DataFrame.keys

参见

Series.drop_duplicates

Series 上的等效方法。

DataFrame.drop_duplicates

DataFrame 上的等效方法。

Index.duplicated

Index 上的相关方法,表示重复的 Index 值。

Examples

生成具有重复值的 pandas.Index。

>>> idx = pd.Index(['lama', 'cow', 'lama', 'beetle', 'lama', 'hippo'])

keep 参数控制移除哪些重复值。值为 ‘first’ 时,保留每组重复条目的第一个出现。keep 的默认值为 ‘first’。

>>> idx.drop_duplicates(keep='first')
Index(['lama', 'cow', 'beetle', 'hippo'], dtype='object')

值为 ‘last’ 时,保留每组重复条目的最后一个出现。

>>> idx.drop_duplicates(keep='last')
Index(['cow', 'beetle', 'lama', 'hippo'], dtype='object')

值为 False 时,丢弃所有重复条目。

>>> idx.drop_duplicates(keep=False)
Index(['cow', 'beetle', 'hippo'], dtype='object')