pandas.Series.drop_duplicates#
- Series.drop_duplicates(*, keep='first', inplace=False, ignore_index=False)[源代码]#
返回去除重复值的 Series。
- Parameters:
- keep : {‘first’, ‘last’,
False}, 默认 ‘first’{‘first’, ‘last’,False}, default ‘first’ 处理删除重复项的方法:
‘first’ : 删除重复项,保留第一次出现的。
‘last’ : 删除重复项,保留最后一次出现的。
False: 删除所有重复项。
- inplace : bool, 默认
Falsebool, 默认 如果为
True,则就地执行操作并返回 None。- ignore_index : bool, 默认
Falsebool, 默认 如果为
True,则结果轴将标记为 0, 1, …, n - 1。在 2.0.0 版本加入.
- keep : {‘first’, ‘last’,
- Returns:
- Series 或 None
删除重复项后的 Series,如果
inplace=True则返回 None。
参见
Index.drop_duplicatesIndex 上的等效方法。
DataFrame.drop_duplicatesDataFrame 上的等效方法。
Series.duplicatedSeries 上的相关方法,指示重复的 Series 值。
Series.unique返回唯一的作为数组的值。
Examples
生成一个包含重复项的 Series。
>>> s = pd.Series(['llama', 'cow', 'llama', 'beetle', 'llama', 'hippo'], ... name='animal') >>> s 0 llama 1 cow 2 llama 3 beetle 4 llama 5 hippo Name: animal, dtype: object
通过 ‘keep’ 参数,可以更改重复值的选择行为。 ‘first’ 值会保留每组重复项的第一次出现。keep 的默认值为 ‘first’。
>>> s.drop_duplicates() 0 llama 1 cow 3 beetle 5 hippo Name: animal, dtype: object
‘keep’ 参数的值 ‘last’ 会保留每组重复项的最后一次出现。
>>> s.drop_duplicates(keep='last') 1 cow 3 beetle 4 llama 5 hippo Name: animal, dtype: object
‘keep’ 参数的值
False会删除所有重复项。>>> s.drop_duplicates(keep=False) 1 cow 3 beetle 5 hippo Name: animal, dtype: object