pandas.api.extensions.ExtensionArray._values_for_factorize#

ExtensionArray._values_for_factorize()[源代码]#

返回适合因子化的数组和缺失值。

Returns:
valuesndarray

适合因子化的数组。这应该保持顺序,并且是支持的 dtype(Float64、Int64、UInt64、String、Object)。默认情况下,扩展数组被强制转换为 object dtype。

na_valueobject

values 中要视为缺失的值。这将在因子化例程中被视为 NA,因此将被编码为 -1 并且不包含在 uniques 中。默认情况下,使用 np.nan

Notes

此方法返回的值也用于 pandas.util.hash_pandas_object() 。如果需要,可以在 self._hash_pandas_object() 方法中重写。

Examples

>>> pd.array([1, 2, 3])._values_for_factorize()
(array([1, 2, 3], dtype=object), nan)