通用函数#

数据操作#

melt (frame[, id_vars, value_vars, var_name, ...])

将 DataFrame 从宽格式重塑为长格式,并可选择保留标识符。

pivot (data, *, columns[, index, values])

返回由给定的索引/列值组织的重塑后的 DataFrame。

pivot_table (data[, values, index, columns, ...])

创建电子表格风格的透视表作为 DataFrame。

crosstab (index, columns[, values, rownames, ...])

计算两个(或多个)因子的简单交叉表。

cut (x, bins[, right, labels, retbins, ...])

将值分箱到离散区间。

qcut (x, q[, labels, retbins, precision, ...])

基于分位数的离散化函数。

merge (left, right[, how, on, left_on, ...])

将 DataFrame 或命名 Series 对象与数据库风格的连接(join)进行合并。

merge_ordered (left, right[, on, left_on, ...])

对有序数据执行合并,并可选择填充/插值。

merge_asof (left, right[, on, left_on, ...])

按键距离执行合并。

concat (objs, *[, axis, join, ignore_index, ...])

沿特定轴连接 pandas 对象。

get_dummies (data[, prefix, prefix_sep, ...])

将分类变量转换为虚拟/指示变量.

from_dummies (data[, sep, default_category])

从虚拟变量的 DataFrame 创建一个分类 DataFrame。

factorize (values[, sort, use_na_sentinel, ...])

将对象编码为枚举类型或分类变量。

unique (values)

ndarray,当输入是 Series/ndarray 时

lreshape (data, groups[, dropna])

将宽格式数据重塑为长格式。

wide_to_long (df, stubnames, i, j[, sep, suffix])

str 或类列表

顶层缺失值处理#

isna (obj)

检测类数组对象中的缺失值。

isnull (obj)

检测类数组对象中的缺失值。

notna (obj)

检测类数组对象的非缺失值。

notnull (obj)

检测类数组对象的非缺失值。

顶层数值数据处理#

to_numeric (arg[, errors, downcast, ...])

将参数转换为数字类型。

顶层日期时间数据处理#

to_datetime (arg[, errors, dayfirst, ...])

将参数转换为 datetime。

to_timedelta (arg[, unit, errors])

将参数转换为 timedelta。

date_range ([start, end, periods, freq, tz, ...])

返回固定频率的 DatetimeIndex。

bdate_range ([start, end, periods, freq, tz, ...])

返回固定频率的 DatetimeIndex,默认为工作日。

period_range ([start, end, periods, freq, name])

返回固定频率的 PeriodIndex。

timedelta_range ([start, end, periods, freq, ...])

返回一个固定频率的 TimedeltaIndex,默认为天。

infer_freq (index)

根据输入索引推断最可能的频率。

顶层 Interval 数据处理#

interval_range ([start, end, periods, freq, ...])

返回固定频率的 IntervalIndex。

顶层求值#

eval (expr[, parser, engine, local_dict, ...])

使用各种后端评估字符串格式的 Python 表达式。

日期时间格式#

tseries.api.guess_datetime_format (dt_str[, ...])

猜测给定日期时间字符串的日期时间格式。

哈希#

util.hash_array (vals[, encoding, hash_key, ...])

pandas.util.hash_pandas_object

util.hash_pandas_object (obj[, index, ...])

比 melt 更灵活但更用户友好。

从其他 DataFrame 库导入#

api.interchange.from_dataframe (df[, allow_copy])

从任何支持 interchange 协议的 DataFrame 构建 pd.DataFrame