pandas.DataFrame.truncate#
- DataFrame.truncate(before=None, after=None, axis=None, copy=None)[源代码]#
截断Series或DataFrame在某个索引值之前和之后的部分。
这是基于高于或低于特定阈值的索引值的布尔索引的有用简写。
- Parameters:
- 之前 (before)日期、字符串、整数
截断此索引值之前的所有行。
- 之后 (after)日期、字符串、整数
截断此索引值之后的所有行。
- axis{0 或 ‘index’, 1 或 ‘columns’}, 可选
要截断的轴。 默认情况下截断索引(行)。 对于 Series,此参数未使用,默认为 0。
- copy布尔值, 默认 True,
返回截断部分的副本。
备注
copy 关键字在 pandas 3.0 中将更改行为。Copy-on-Write 将默认启用,这意味着所有带有 copy 关键字的方法都将使用惰性复制机制来延迟复制并忽略 copy 关键字。copy 关键字将在 pandas 的未来版本中移除。
通过启用 copy on write
pd.options.mode.copy_on_write = True,您可以获得未来的行为和改进。
- Returns:
- 调用者的类型
截断的 Series 或 DataFrame。
参见
DataFrame.loc选择 DataFrame 的子集。
DataFrame.iloc根据标签选择 DataFrame 的子集。
Notes
如果正在截断的索引仅包含日期时间值,则 before 和 after 可以指定为字符串而不是 Timestamps。
Examples
>>> df = pd.DataFrame({'A': ['a', 'b', 'c', 'd', 'e'], ... 'B': ['f', 'g', 'h', 'i', 'j'], ... 'C': ['k', 'l', 'm', 'n', 'o']}, ... index=[1, 2, 3, 4, 5]) >>> df A B C 1 a f k 2 b g l 3 c h m 4 d i n 5 e j o
>>> df.truncate(before=2, after=4) A B C 2 b g l 3 c h m 4 d i n
可以截断 DataFrame 的列。
>>> df.truncate(before="A", after="B", axis="columns") A B 1 a f 2 b g 3 c h 4 d i 5 e j
对于 Series,只能截断行。
>>> df['A'].truncate(before=2, after=4) 2 b 3 c 4 d Name: A, dtype: object
truncate中的索引值可以是日期时间或字符串日期。>>> dates = pd.date_range('2016-01-01', '2016-02-01', freq='s') >>> df = pd.DataFrame(index=dates, data={'A': 1}) >>> df.tail() A 2016-01-31 23:59:56 1 2016-01-31 23:59:57 1 2016-01-31 23:59:58 1 2016-01-31 23:59:59 1 2016-02-01 00:00:00 1
>>> df.truncate(before=pd.Timestamp('2016-01-05'), ... after=pd.Timestamp('2016-01-10')).tail() A 2016-01-09 23:59:56 1 2016-01-09 23:59:57 1 2016-01-09 23:59:58 1 2016-01-09 23:59:59 1 2016-01-10 00:00:00 1
因为索引是一个只包含日期的 DatetimeIndex,所以我们可以将 before 和 after 指定为字符串。 它们将在截断之前强制转换为 Timestamps。
>>> df.truncate('2016-01-05', '2016-01-10').tail() A 2016-01-09 23:59:56 1 2016-01-09 23:59:57 1 2016-01-09 23:59:58 1 2016-01-09 23:59:59 1 2016-01-10 00:00:00 1
请注意,
truncate假定任何未指定的时分秒部分的值为 0(午夜)。 这与部分字符串切片不同,后者将返回任何部分匹配的日期。>>> df.loc['2016-01-05':'2016-01-10', :].tail() A 2016-01-10 23:59:55 1 2016-01-10 23:59:56 1 2016-01-10 23:59:57 1 2016-01-10 23:59:58 1 2016-01-10 23:59:59 1