GroupBy#

pandas.api.typing.DataFrameGroupBypandas.api.typing.SeriesGroupBy 实例由分组调用 pandas.DataFrame.groupby()pandas.Series.groupby() 分别返回。

索引,迭代#

DataFrameGroupBy.__iter__ ()

Groupby 迭代器。

SeriesGroupBy.__iter__ ()

Groupby 迭代器。

DataFrameGroupBy.groups 

字典 {组名 -> 组标签}。

SeriesGroupBy.groups 

字典 {组名 -> 组标签}。

DataFrameGroupBy.indices 

字典 {组名 -> 组索引}。

SeriesGroupBy.indices 

字典 {组名 -> 组索引}。

DataFrameGroupBy.get_group (name[, obj])

从具有指定名称的组构建 DataFrame。

SeriesGroupBy.get_group (name[, obj])

从具有指定名称的组构建 DataFrame。

Grouper (*args, **kwargs)

A Grouper allows the user to specify a groupby instruction for an object.

函数应用辅助#

NamedAgg (column, aggfunc)

用于对特定列进行聚合的辅助工具,可控制输出列名。

函数应用#

SeriesGroupBy.apply (func, *args, **kwargs)

按组应用函数 func 并将结果组合在一起。

DataFrameGroupBy.apply (func, *args[, ...])

按组应用函数 func 并将结果组合在一起。

SeriesGroupBy.agg ([func, engine, engine_kwargs])

沿指定轴使用一个或多个操作进行聚合。

DataFrameGroupBy.agg ([func, engine, ...])

沿指定轴使用一个或多个操作进行聚合。

SeriesGroupBy.aggregate ([func, engine, ...])

沿指定轴使用一个或多个操作进行聚合。

DataFrameGroupBy.aggregate ([func, engine, ...])

沿指定轴使用一个或多个操作进行聚合。

SeriesGroupBy.transform (func, *args[, ...])

对每个组调用产生相同索引的 Series 的函数。

DataFrameGroupBy.transform (func, *args[, ...])

调用函数,对每个组生成一个具有相同索引的 DataFrame。

SeriesGroupBy.pipe (func, *args, **kwargs)

将带有参数的 func 应用于此 GroupBy 对象并返回其结果。

DataFrameGroupBy.pipe (func, *args, **kwargs)

将带有参数的 func 应用于此 GroupBy 对象并返回其结果。

DataFrameGroupBy.filter (func[, dropna])

过滤掉不满足标准的组元素。

SeriesGroupBy.filter (func[, dropna])

过滤掉不满足标准的组元素。

DataFrameGroupBy 计算 / 描述性统计#

DataFrameGroupBy.all ([skipna])

如果组中的所有值都为真,则返回 True,否则返回 False。

DataFrameGroupBy.any ([skipna])

如果组中的任何值为真,则返回 True,否则返回 False。

DataFrameGroupBy.bfill ([limit])

向后填充值。

DataFrameGroupBy.corr ([method, min_periods, ...])

计算列的成对相关性,排除 NA/null 值。

DataFrameGroupBy.corrwith (other[, axis, ...])

计算成对相关性。

DataFrameGroupBy.count ()

计算组的计数,排除缺失值。

DataFrameGroupBy.cov ([min_periods, ddof, ...])

计算列的成对协方差,排除 NA/null 值。

DataFrameGroupBy.cumcount ([ascending])

为组中的每个项从 0 编号到该组的长度减 1。

DataFrameGroupBy.cummax ([axis, numeric_only])

每个组的累积最大值。

DataFrameGroupBy.cummin ([axis, numeric_only])

每个组的累积最小值。

DataFrameGroupBy.cumprod ([axis])

每个组的累积乘积。

DataFrameGroupBy.cumsum ([axis])

每个组的累积和。

DataFrameGroupBy.describe ([percentiles, ...])

生成描述性统计信息。

DataFrameGroupBy.diff ([periods, axis])

元素的离散差分。

DataFrameGroupBy.ffill ([limit])

向前填充值。

DataFrameGroupBy.fillna ([value, method, ...])

(已弃用) 使用指定的方法在组内填充 NA/NaN 值。

DataFrameGroupBy.first ([numeric_only, ...])

计算每个组内每列的第一个条目。

DataFrameGroupBy.head ([n])

返回每个组的前 n 行。

DataFrameGroupBy.idxmax ([axis, skipna, ...])

返回请求轴上最大值的第一个出现索引。

DataFrameGroupBy.idxmin ([axis, skipna, ...])

返回请求轴上最小值第一个出现的索引。

DataFrameGroupBy.last ([numeric_only, ...])

计算每个组内每列的最后一个条目。

DataFrameGroupBy.max ([numeric_only, ...])

计算组的最大值。

DataFrameGroupBy.mean ([numeric_only, ...])

计算组的平均值,排除缺失值。

DataFrameGroupBy.median ([numeric_only])

计算组的中位数,排除缺失值。

DataFrameGroupBy.min ([numeric_only, ...])

计算组的最小值。

DataFrameGroupBy.ngroup ([ascending])

为每个组从 0 编号到组数 - 1。

DataFrameGroupBy.nth 

如果 n 是整数,则取每个组的第 n 行,否则取行的子集。

DataFrameGroupBy.nunique ([dropna])

返回每个位置上唯一元素的计数 DataFrame。

DataFrameGroupBy.ohlc ()

计算组的开盘价、最高价、最低价和收盘价,排除缺失值。

DataFrameGroupBy.pct_change ([periods, ...])

计算组中每个值相对于前一个条目的百分比变化。

DataFrameGroupBy.prod ([numeric_only, min_count])

计算组值的乘积。

DataFrameGroupBy.quantile ([q, ...])

返回组中给定分位数的值,类似于 numpy.percentile。

DataFrameGroupBy.rank ([method, ascending, ...])

提供每个组内值的排名。

DataFrameGroupBy.resample (rule, *args[, ...])

使用 TimeGrouper 时提供重采样。

DataFrameGroupBy.rolling (*args, **kwargs)

返回一个滚动观察员,为每个组提供滚动功能。

DataFrameGroupBy.sample ([n, frac, replace, ...])

为每个组返回一个随机样本。

DataFrameGroupBy.sem ([ddof, numeric_only])

计算组均值的标准误差,排除缺失值。

DataFrameGroupBy.shift ([periods, freq, ...])

将每个组移动几个观测值。

DataFrameGroupBy.size ()

计算组的大小。

DataFrameGroupBy.skew ([axis, skipna, ...])

返回组内无偏偏度。

DataFrameGroupBy.std ([ddof, engine, ...])

计算组的标准差,排除缺失值。

DataFrameGroupBy.sum ([numeric_only, ...])

计算组值的总和。

DataFrameGroupBy.var ([ddof, engine, ...])

计算组的方差,排除缺失值。

DataFrameGroupBy.tail ([n])

返回每个组的最后 n 行。

DataFrameGroupBy.take (indices[, axis])

返回每个组中指定*位置*索引的元素。

DataFrameGroupBy.value_counts ([subset, ...])

返回一个包含唯一行计数的 Series 或 DataFrame。

SeriesGroupBy 计算/描述性统计#

SeriesGroupBy.all ([skipna])

如果组中的所有值都为真,则返回 True,否则返回 False。

SeriesGroupBy.any ([skipna])

如果组中的任何值为真,则返回 True,否则返回 False。

SeriesGroupBy.bfill ([limit])

向后填充值。

SeriesGroupBy.corr (other[, method, min_periods])

计算与 other Series 的相关性,排除缺失值。

SeriesGroupBy.count ()

计算组的计数,排除缺失值。

SeriesGroupBy.cov (other[, min_periods, ddof])

计算与 Series 的协方差,排除缺失值。

SeriesGroupBy.cumcount ([ascending])

为组中的每个项从 0 编号到该组的长度减 1。

SeriesGroupBy.cummax ([axis, numeric_only])

每个组的累积最大值。

SeriesGroupBy.cummin ([axis, numeric_only])

每个组的累积最小值。

SeriesGroupBy.cumprod ([axis])

每个组的累积乘积。

SeriesGroupBy.cumsum ([axis])

每个组的累积和。

SeriesGroupBy.describe ([percentiles, ...])

生成描述性统计信息。

SeriesGroupBy.diff ([periods, axis])

元素的离散差分。

SeriesGroupBy.ffill ([limit])

向前填充值。

SeriesGroupBy.fillna ( value、 method、 axis、 ...)

(已弃用) 使用指定的方法在组内填充 NA/NaN 值。

SeriesGroupBy.first ( numeric_only、 ...)

计算每个组内每列的第一个条目。

SeriesGroupBy.head ( n

返回每个组的前 n 行。

SeriesGroupBy.last ( numeric_only、 ...)

计算每个组内每列的最后一个条目。

SeriesGroupBy.idxmax ( axis、 skipna

返回最大值的行标签。

SeriesGroupBy.idxmin ( axis、 skipna

返回最小值的行标签。

SeriesGroupBy.is_monotonic_increasing

返回每个分组的值是否单调递增。

SeriesGroupBy.is_monotonic_decreasing

返回每个分组的值是否单调递减。

SeriesGroupBy.max ( numeric_only、 min_count、 ...)

计算组的最大值。

SeriesGroupBy.mean ( numeric_only、 engine、 ...)

计算组的平均值,排除缺失值。

SeriesGroupBy.median ( numeric_only

计算组的中位数,排除缺失值。

SeriesGroupBy.min ( numeric_only、 min_count、 ...)

计算组的最小值。

SeriesGroupBy.ngroup ( ascending

为每个组从 0 编号到组数 - 1。

SeriesGroupBy.nlargest ( n、 keep

返回最大的 n 个元素。

SeriesGroupBy.nsmallest ( n、 keep

返回最小的 n 个元素。

SeriesGroupBy.nth

如果 n 是整数,则取每个组的第 n 行,否则取行的子集。

SeriesGroupBy.nunique ( dropna

返回分组中唯一元素的数量。

SeriesGroupBy.unique ( )

为每个组返回唯一值。

SeriesGroupBy.ohlc ( )

计算组的开盘价、最高价、最低价和收盘价,排除缺失值。

SeriesGroupBy.pct_change ( periods、 ...)

计算组中每个值相对于前一个条目的百分比变化。

SeriesGroupBy.prod ( numeric_only、 min_count

计算组值的乘积。

SeriesGroupBy.quantile ( q、 interpolation、 ...)

返回组中给定分位数的值,类似于 numpy.percentile。

SeriesGroupBy.rank ( method、 ascending、 ...)

提供每个组内值的排名。

SeriesGroupBy.resample ( rule、 *args[、 ...])

使用 TimeGrouper 时提供重采样。

SeriesGroupBy.rolling ( *args、 **kwargs)

返回一个滚动观察员,为每个组提供滚动功能。

SeriesGroupBy.sample ( n、 frac、 replace、 ...)

为每个组返回一个随机样本。

SeriesGroupBy.sem ( ddof、 numeric_only

计算组均值的标准误差,排除缺失值。

SeriesGroupBy.shift ( periods、 freq、 axis、 ...)

将每个组移动几个观测值。

SeriesGroupBy.size ( )

计算组的大小。

SeriesGroupBy.skew ( axis、 skipna、 numeric_only

返回组内无偏偏度。

SeriesGroupBy.std ( ddof、 engine、 ...)

计算组的标准差,排除缺失值。

SeriesGroupBy.sum ( numeric_only、 min_count、 ...)

计算组值的总和。

SeriesGroupBy.var ( ddof、 engine、 ...)

计算组的方差,排除缺失值。

SeriesGroupBy.tail ( n

返回每个组的最后 n 行。

SeriesGroupBy.take ( indices[、 axis])

返回每个组中指定*位置*索引的元素。

SeriesGroupBy.value_counts ( normalize、 ...)

绘图与可视化#

DataFrameGroupBy.boxplot ( subplots、 column、 ...)

从 DataFrameGroupBy 数据制作箱线图。

DataFrameGroupBy.hist ( column、 by、 grid、 ...)

绘制DataFrame列的直方图。

SeriesGroupBy.hist ( by、 ax、 grid、 ...)

使用 matplotlib 绘制输入序列的直方图。

DataFrameGroupBy.plot

绘制 Series 或 DataFrame 的图。

SeriesGroupBy.plot

绘制 Series 或 DataFrame 的图。