pandas.read_sas#
- pandas.read_sas(filepath_or_buffer, *, format=None, index=None, encoding=None, chunksize=None, iterator=False, compression='infer')[源代码]#
读取以 XPORT 或 SAS7BDAT 格式存储的 SAS 文件。
- Parameters:
- filepath_or_buffer字符串、路径对象或文件类对象
字符串、路径对象(实现
os.PathLike[str])或实现了二进制read()函数的文件类对象。字符串可以是 URL。有效的 URL 方案包括 http、ftp、s3 和 file。对于 file URL,需要主机名。本地文件可以是:file://localhost/path/to/table.sas7bdat。- formatstr {‘xport’, ‘sas7bdat’} 或 None
如果为 None,则根据文件扩展名推断文件格式。如果为 ‘xport’ 或 ‘sas7bdat’,则使用相应的格式。
- index索引列的标识符,默认为 None
DataFrame 的索引应使用的列的标识符。
- encodingstr,默认为 None
文本数据的编码。如果为 None,则文本数据将作为原始字节存储。
- chunksizeint
一次读取 chunksize 行,返回迭代器。
- iteratorbool,默认为 False
如果为 True,则返回一个用于增量读取文件的迭代器。
- compressionstr or dict, default ‘infer’
对磁盘上的数据进行即时解压缩。如果为 ‘infer’ 且 ‘filepath_or_buffer’ 是类路径,则根据以下扩展名检测压缩:’.gz’, ‘.bz2’, ‘.zip’, ‘.xz’, ‘.zst’, ‘.tar’, ‘.tar.gz’, ‘.tar.xz’ 或 ‘.tar.bz2’(否则不进行压缩)。如果使用 ‘zip’ 或 ‘tar’,ZIP 文件必须只包含一个要读取的数据文件。设置为
None表示不解压缩。也可以是一个字典,其中键'method'设置为 {'zip','gzip','bz2','zstd','xz','tar'} 中的一个,其他键值对将转发到zipfile.ZipFile,gzip.GzipFile,bz2.BZ2File,zstandard.ZstdDecompressor,lzma.LZMAFile或tarfile.TarFile。例如,可以传递以下内容以使用自定义压缩字典进行 Zstandard 解压缩:compression={'method': 'zstd', 'dict_data': my_compression_dict}。在 1.5.0 版本加入: 增加了对 .tar 文件的支持。
- Returns:
- DataFrame(如果 iterator=False 且 chunksize=None),否则为 SAS7BDATReader
- 或 XportReader
Examples
>>> df = pd.read_sas("sas_data.sas7bdat")