pandas.Series.where#
- Series.where(cond, other=nan, *, inplace=False, axis=None, level=None)[源代码]#
替换条件为False的值。
- Parameters:
- condbool Series/DataFrame, 类数组对象, 或可调用对象
当 cond 为 True 时,保留原始值。当 False 时,用 other 中的相应值替换。如果 cond 是可调用的,它将在 Series/DataFrame 上计算,并应返回布尔 Series/DataFrame 或数组。可调用对象不能更改输入 Series/DataFrame(尽管 pandas 不会检查它)。
- other标量、Series/DataFrame 或可调用对象
cond 为 False 的条目将替换为 other 中的相应值。如果 other 是可调用的,它将在 Series/DataFrame 上计算,并应返回标量或 Series/DataFrame。可调用对象不能更改输入 Series/DataFrame(尽管 pandas 不会检查它)。如果未指定,条目将用相应的 NULL 值填充(对于 numpy 数据类型为
np.nan,对于扩展数据类型为pd.NA)。- inplacebool,默认 False
是否在数据上原地执行操作。
- axisint,默认 None
如果需要,将对齐轴。对于 Series,此参数未使用,默认为 0。
- levelint,默认 None
如果需要,将对齐级别。
- Returns:
- 与调用者相同类型,如果
inplace=True则为 None。
- 与调用者相同类型,如果
参见
DataFrame.mask()返回与 self 形状相同的对象。
Notes
where 方法是 if-then 惯用法的一个应用。对于调用 DataFrame 中的每个元素,如果
cond为True,则使用该元素;否则,使用 DataFrameother中的相应元素。如果other的轴与condSeries/DataFrame 的轴不对齐,则不对齐的索引位置将用 False 填充。DataFrame.where()的签名与numpy.where()不同。大致上df1.where(m, df2)等同于np.where(m, df1, df2)。有关更多详细信息和示例,请参阅 indexing 中的
where文档。对象的 dtype 优先。填充值将被强制转换为对象的 dtype,如果可以无损转换的话。
Examples
>>> s = pd.Series(range(5)) >>> s.where(s > 0) 0 NaN 1 1.0 2 2.0 3 3.0 4 4.0 dtype: float64 >>> s.mask(s > 0) 0 0.0 1 NaN 2 NaN 3 NaN 4 NaN dtype: float64
>>> s = pd.Series(range(5)) >>> t = pd.Series([True, False]) >>> s.where(t, 99) 0 0 1 99 2 99 3 99 4 99 dtype: int64 >>> s.mask(t, 99) 0 99 1 1 2 99 3 99 4 99 dtype: int64
>>> s.where(s > 1, 10) 0 10 1 10 2 2 3 3 4 4 dtype: int64 >>> s.mask(s > 1, 10) 0 0 1 1 2 10 3 10 4 10 dtype: int64
>>> df = pd.DataFrame(np.arange(10).reshape(-1, 2), columns=['A', 'B']) >>> df A B 0 0 1 1 2 3 2 4 5 3 6 7 4 8 9 >>> m = df % 3 == 0 >>> df.where(m, -df) A B 0 0 -1 1 -2 3 2 -4 -5 3 6 -7 4 -8 9 >>> df.where(m, -df) == np.where(m, df, -df) A B 0 True True 1 True True 2 True True 3 True True 4 True True >>> df.where(m, -df) == df.mask(~m, -df) A B 0 True True 1 True True 2 True True 3 True True 4 True True