pandas.DataFrame.transform#
- DataFrame.transform(func, axis=0, *args, **kwargs)[源代码]#
在self上调用``func``,生成一个与self具有相同轴形状的DataFrame。
- Parameters:
- func函数、str、类列表或类字典
用于转换数据的函数。如果为函数,则必须能够接受 DataFrame 作为输入,或者能够通过 DataFrame.apply 使用。如果 func 同时是类列表和类字典,则类字典行为具有优先权。
可接受的组合有:
function
字符串函数名
函数和/或函数名称的类列表,例如
[np.exp, 'sqrt']轴标签 -> 函数、函数名称或此类列表的类字典。
- axis{0 或 ‘index’, 1 或 ‘columns’}, default 0
如果为 0 或 ‘index’:对每列应用函数。如果为 1 或 ‘columns’:对每行应用函数。
- *args
传递给 func 的位置参数。
- **kwargs
传递给 func 的关键字参数。
- Returns:
- DataFrame
长度必须与 self 相同的 DataFrame。
- Raises:
- ValueError如果返回的 DataFrame 的长度与 self 不同。
参见
DataFrame.agg仅执行聚合类型操作。
DataFrame.apply在 DataFrame 上调用函数。
Notes
修改传入对象的函数可能会导致意外行为或错误,因此不受支持。有关详细信息,请参阅 使用用户定义函数 (UDF) 方法进行变异 。
Examples
>>> df = pd.DataFrame({'A': range(3), 'B': range(1, 4)}) >>> df A B 0 0 1 1 1 2 2 2 3 >>> df.transform(lambda x: x + 1) A B 0 1 2 1 2 3 2 3 4
即使结果 DataFrame 的长度必须与输入 DataFrame 相同,也可以提供多个输入函数:
>>> s = pd.Series(range(3)) >>> s 0 0 1 1 2 2 dtype: int64 >>> s.transform([np.sqrt, np.exp]) sqrt exp 0 0.000000 1.000000 1 1.000000 2.718282 2 1.414214 7.389056
您可以对 GroupBy 对象调用 transform:
>>> df = pd.DataFrame({ ... "Date": [ ... "2015-05-08", "2015-05-07", "2015-05-06", "2015-05-05", ... "2015-05-08", "2015-05-07", "2015-05-06", "2015-05-05"], ... "Data": [5, 8, 6, 1, 50, 100, 60, 120], ... }) >>> df Date Data 0 2015-05-08 5 1 2015-05-07 8 2 2015-05-06 6 3 2015-05-05 1 4 2015-05-08 50 5 2015-05-07 100 6 2015-05-06 60 7 2015-05-05 120 >>> df.groupby('Date')['Data'].transform('sum') 0 55 1 108 2 66 3 121 4 55 5 108 6 66 7 121 Name: Data, dtype: int64
>>> df = pd.DataFrame({ ... "c": [1, 1, 1, 2, 2, 2, 2], ... "type": ["m", "n", "o", "m", "m", "n", "n"] ... }) >>> df c type 0 1 m 1 1 n 2 1 o 3 2 m 4 2 m 5 2 n 6 2 n >>> df['size'] = df.groupby('c')['type'].transform(len) >>> df c type size 0 1 m 3 1 1 n 3 2 1 o 3 3 2 m 4 4 2 m 4 5 2 n 4 6 2 n 4