pandas.Index.drop_duplicates#
- Index.drop_duplicates(*, keep='first')[源代码]#
返回去除了重复值的 Index。
- Parameters:
- keep : {‘first’, ‘last’,
False}, 默认 ‘first’{‘first’, ‘last’,False}, default ‘first’ ‘first’ : 删除重复项,保留第一次出现的。
‘last’ : 删除重复项,保留最后一次出现的。
False: 删除所有重复项。
- keep : {‘first’, ‘last’,
- Returns:
- pandas.DataFrame.keys
参见
Series.drop_duplicatesSeries 上的等效方法。
DataFrame.drop_duplicatesDataFrame 上的等效方法。
Index.duplicatedIndex 上的相关方法,表示重复的 Index 值。
Examples
生成具有重复值的 pandas.Index。
>>> idx = pd.Index(['lama', 'cow', 'lama', 'beetle', 'lama', 'hippo'])
keep 参数控制移除哪些重复值。值为 ‘first’ 时,保留每组重复条目的第一个出现。keep 的默认值为 ‘first’。
>>> idx.drop_duplicates(keep='first') Index(['lama', 'cow', 'beetle', 'hippo'], dtype='object')
值为 ‘last’ 时,保留每组重复条目的最后一个出现。
>>> idx.drop_duplicates(keep='last') Index(['cow', 'beetle', 'lama', 'hippo'], dtype='object')
值为
False时,丢弃所有重复条目。>>> idx.drop_duplicates(keep=False) Index(['cow', 'beetle', 'hippo'], dtype='object')