⌘+k ctrl+k
1.3 (稳定版)
搜索快捷键 cmd + k | ctrl + k
S3 Parquet 导入

先决条件

要从 S3 加载 Parquet 文件,需要 httpfs 扩展。可以使用 INSTALL SQL 命令进行安装。这只需要运行一次。

INSTALL httpfs;

要加载 httpfs 扩展以供使用,请使用 LOAD SQL 命令

LOAD httpfs;

凭据和配置

加载 httpfs 扩展后,设置凭据和 S3 区域以读取数据

CREATE SECRET (
    TYPE s3,
    KEY_ID 'AKIAIOSFODNN7EXAMPLE',
    SECRET 'wJalrXUtnFEMI/K7MDENG/bPxRfiCYEXAMPLEKEY',
    REGION 'us-east-1'
);

提示:如果遇到 IO 错误(Connection error for HTTP HEAD),请通过 ENDPOINT 's3.your_region.amazonaws.com' 显式配置端点。

或者,使用 aws 扩展 自动检索凭据

CREATE SECRET (
    TYPE s3,
    PROVIDER credential_chain
);

查询

httpfs 扩展设置完毕且 S3 配置正确后,可以使用以下命令从 S3 读取 Parquet 文件

SELECT * FROM read_parquet('s3://bucket/file');

Google Cloud Storage (GCS) 和 Cloudflare R2

DuckDB 还可以通过 S3 API 处理 Google Cloud Storage (GCS)Cloudflare R2。有关详细信息,请参阅相关指南。