pandas.core.groupby.DataFrameGroupBy.mean#

DataFrameGroupBy.mean(numeric_only=False, engine=None, engine_kwargs=None)[源代码]#

计算组的平均值,排除缺失值。

Parameters:
numeric_onlybool,默认 False

仅包括浮点数、整数、布尔列。

在 2.0.0 版本发生变更: numeric_only 不再接受 None,并默认为 False

enginestr,默认 None
  • 'cython' : 通过 cython 的 C 扩展运行操作。

  • 'numba' : 通过 numba 的 JIT 编译代码运行操作。

  • None : 默认为 'cython' 或全局设置的 compute.use_numba

在 1.4.0 版本加入.

engine_kwargsdict, 默认为 None
  • 对于 'cython' 引擎,没有可接受的 engine_kwargs

  • 对于 'numba' 引擎,该引擎可以接受 nopythonnogilparallel 字典键。值必须是 TrueFalse'numba' 引擎的默认 engine_kwargs{{'nopython': True, 'nogil': False, 'parallel': False}}

在 1.4.0 版本加入.

Returns:
pandas.Series 或 pandas.DataFrame

参见

Series.groupby

将函数 groupby 应用于 Series。

DataFrame.groupby

将函数 groupby 应用于 DataFrame 的每一行或每一列。

Examples

>>> df = pd.DataFrame({'A': [1, 1, 2, 1, 2],
...                    'B': [np.nan, 2, 3, 4, 5],
...                    'C': [1, 2, 1, 1, 2]}, columns=['A', 'B', 'C'])

按一列分组,并返回每个组中剩余列的平均值。

>>> df.groupby('A').mean()
     B         C
A
1  3.0  1.333333
2  4.0  1.500000

按两列分组,并返回剩余列的平均值。

>>> df.groupby(['A', 'B']).mean()
         C
A B
1 2.0  2.0
  4.0  1.0
2 3.0  1.0
  5.0  2.0

按一列分组,并返回组内特定列的平均值。

>>> df.groupby('A')['B'].mean()
A
1    3.0
2    4.0
Name: B, dtype: float64