pandas.api.extensions.ExtensionArray.factorize#

ExtensionArray.factorize(use_na_sentinel=True)[源代码]#

将扩展数组编码为枚举类型。

Parameters:
use_na_sentinelbool, default True

如果为 True,则 NaN 值将使用 sentinel -1。如果为 False,NaN 值将被编码为非负整数,并且不会从值的 uniques 中删除 NaN。

在 1.5.0 版本加入.

Returns:
codesndarray

一个整数 NumPy 数组,它是原始 ExtensionArray 的索引器。

uniquesExtensionArray

一个包含 self 的唯一值的 ExtensionArray。

备注

如果 self 中存在缺失值,则 uniques 不会 包含 ExtensionArray 的 NA 值的条目。

参见

factorize

分派到此处的頂級 factorize 方法。

Notes

pandas.factorize() 也提供了一个 sort 关键字。

Examples

>>> idx1 = pd.PeriodIndex(["2014-01", "2014-01", "2014-02", "2014-02",
...                       "2014-03", "2014-03"], freq="M")
>>> arr, idx = idx1.factorize()
>>> arr
array([0, 0, 1, 1, 2, 2])
>>> idx
PeriodIndex(['2014-01', '2014-02', '2014-03'], dtype='period[M]')