pandas.api.extensions.ExtensionArray.factorize#
- ExtensionArray.factorize(use_na_sentinel=True)[源代码]#
将扩展数组编码为枚举类型。
- Parameters:
- use_na_sentinelbool, default True
如果为 True,则 NaN 值将使用 sentinel -1。如果为 False,NaN 值将被编码为非负整数,并且不会从值的 uniques 中删除 NaN。
在 1.5.0 版本加入.
- Returns:
- codesndarray
一个整数 NumPy 数组,它是原始 ExtensionArray 的索引器。
- uniquesExtensionArray
一个包含 self 的唯一值的 ExtensionArray。
备注
如果 self 中存在缺失值,则 uniques 不会 包含 ExtensionArray 的 NA 值的条目。
参见
factorize分派到此处的頂級 factorize 方法。
Notes
pandas.factorize()也提供了一个 sort 关键字。Examples
>>> idx1 = pd.PeriodIndex(["2014-01", "2014-01", "2014-02", "2014-02", ... "2014-03", "2014-03"], freq="M") >>> arr, idx = idx1.factorize() >>> arr array([0, 0, 1, 1, 2, 2]) >>> idx PeriodIndex(['2014-01', '2014-02', '2014-03'], dtype='period[M]')