- 安装
- 文档
- 入门
- 连接
- 数据导入
- 客户端 API
- 概览
- ADBC
- C
- C++
- CLI
- Dart
- Go
- Java (JDBC)
- Julia
- Node.js (已弃用)
- Node.js (Neo)
- ODBC
- PHP
- Python
- R
- Rust
- Swift
- Wasm
- SQL
- 介绍
- 语句
- 概览
- ANALYZE
- ALTER TABLE
- ALTER VIEW
- ATTACH 和 DETACH
- CALL
- CHECKPOINT
- COMMENT ON
- COPY
- CREATE INDEX
- CREATE MACRO
- CREATE SCHEMA
- CREATE SECRET
- CREATE SEQUENCE
- CREATE TABLE
- CREATE VIEW
- CREATE TYPE
- DELETE
- DESCRIBE
- DROP
- EXPORT 和 IMPORT DATABASE
- INSERT
- LOAD / INSTALL
- PIVOT
- 性能分析
- SELECT
- SET / RESET
- SET VARIABLE
- SUMMARIZE
- 事务管理
- UNPIVOT
- UPDATE
- USE
- VACUUM
- 查询语法
- SELECT
- FROM 和 JOIN
- WHERE
- GROUP BY
- GROUPING SETS
- HAVING
- ORDER BY
- LIMIT 和 OFFSET
- SAMPLE
- 展开嵌套
- WITH
- WINDOW
- QUALIFY
- VALUES
- FILTER
- 集合操作
- 预处理语句
- 数据类型
- 表达式
- 函数
- 概览
- 聚合函数
- 数组函数
- 位字符串函数
- Blob 函数
- 日期格式化函数
- 日期函数
- 日期部分函数
- 枚举函数
- 间隔函数
- Lambda 函数
- 列表函数
- 映射函数
- 嵌套函数
- 数值函数
- 模式匹配
- 正则表达式
- 结构体函数
- 文本函数
- 时间函数
- 时间戳函数
- 带时区时间戳函数
- 联合函数
- 实用函数
- 窗口函数
- 约束
- 索引
- 元查询
- DuckDB 的 SQL 方言
- 示例
- 配置
- 扩展
- 核心扩展
- 概览
- 自动补全
- Avro
- AWS
- Azure
- Delta
- DuckLake
- 编码
- Excel
- 全文搜索
- httpfs (HTTP 和 S3)
- Iceberg
- ICU
- inet
- jemalloc
- MySQL
- PostgreSQL
- 空间
- SQLite
- TPC-DS
- TPC-H
- UI
- VSS
- 指南
- 概览
- 数据查看器
- 数据库集成
- 文件格式
- 概览
- CSV 导入
- CSV 导出
- 直接读取文件
- Excel 导入
- Excel 导出
- JSON 导入
- JSON 导出
- Parquet 导入
- Parquet 导出
- 查询 Parquet 文件
- 使用 file: 协议访问文件
- 网络和云存储
- 概览
- HTTP Parquet 导入
- S3 Parquet 导入
- S3 Parquet 导出
- S3 Iceberg 导入
- S3 Express One
- GCS 导入
- Cloudflare R2 导入
- 通过 HTTPS / S3 使用 DuckDB
- Fastly 对象存储导入
- 元查询
- ODBC
- 性能
- Python
- 安装
- 执行 SQL
- Jupyter Notebooks
- marimo Notebooks
- Pandas 上的 SQL
- 从 Pandas 导入
- 导出到 Pandas
- 从 Numpy 导入
- 导出到 Numpy
- Arrow 上的 SQL
- 从 Arrow 导入
- 导出到 Arrow
- Pandas 上的关系型 API
- 多个 Python 线程
- 与 Ibis 集成
- 与 Polars 集成
- 使用 fsspec 文件系统
- SQL 编辑器
- SQL 功能
- 代码片段
- 故障排除
- 术语表
- 离线浏览
- 操作手册
- 开发
- 内部结构
- 为什么选择 DuckDB
- 行为准则
- 发布日历
- 路线图
- 站点地图
- 在线演示
DuckDB 支持用于从现有 JSON 读取值和创建新 JSON 数据的 SQL 函数。JSON 通过 json
扩展支持,该扩展随大多数 DuckDB 分发版一起提供,并在首次使用时自动加载。如果您想手动安装或加载它,请参阅“安装和加载”页面。
关于 JSON
JSON 是一种开放标准的文件格式和数据交换格式,它使用人类可读的文本来存储和传输由属性-值对和数组(或其他可序列化值)组成的数据对象。虽然它对于表格数据来说不是一种非常高效的格式,但它被广泛使用,尤其作为数据交换格式。
JSONPath 和 JSON Pointer 语法
DuckDB 为 JSON 提取实现了多种接口:JSONPath 和 JSON Pointer。它们都支持箭头运算符 (->
) 和 json_extract
函数调用。
请注意,DuckDB 仅支持 JSONPath 中的查找,即使用 .<key>
提取字段或使用 [<index>]
提取数组元素。数组可以从后向前索引,并且这两种方法都支持通配符 *
。DuckDB 不支持完整的 JSONPath 语法,因为 SQL 可用于任何进一步的转换。
最好选择 JSONPath 或 JSON Pointer 语法,并在整个应用程序中使用它。
索引
警告:遵循 PostgreSQL 的约定,DuckDB 对其
ARRAY
和LIST
数据类型使用 1-基于索引,但对 JSON 数据类型使用 0-基于索引。
示例
加载 JSON
从磁盘读取 JSON 文件,自动推断选项
SELECT * FROM 'todos.json';
使用自定义选项的 read_json
函数
SELECT *
FROM read_json('todos.json',
format = 'array',
columns = {userId: 'UBIGINT',
id: 'UBIGINT',
title: 'VARCHAR',
completed: 'BOOLEAN'});
从 stdin 读取 JSON 文件,自动推断选项
cat data/json/todos.json | duckdb -c "SELECT * FROM read_json('/dev/stdin')"
将 JSON 文件读入表中
CREATE TABLE todos (userId UBIGINT, id UBIGINT, title VARCHAR, completed BOOLEAN);
COPY todos FROM 'todos.json' (AUTO_DETECT true);
另外,可以使用 CREATE TABLE ... AS SELECT
子句创建表,而无需手动指定模式
CREATE TABLE todos AS
SELECT * FROM 'todos.json';
自 DuckDB v1.3.0 起,JSON 读取器返回 filename
虚拟列
SELECT filename, *
FROM 'todos-*.json';
写入 JSON
将查询结果写入 JSON 文件
COPY (SELECT * FROM todos) TO 'todos.json';
JSON 数据类型
创建一个带列以存储 JSON 数据并向其中插入数据的表
CREATE TABLE example (j JSON);
INSERT INTO example VALUES
('{ "family": "anatidae", "species": [ "duck", "goose", "swan", null ] }');
检索 JSON 数据
检索 family 键的值
SELECT j.family FROM example;
"anatidae"
使用 JSONPath 表达式将 family 键的值提取为 JSON
SELECT j->'$.family' FROM example;
"anatidae"
使用 JSONPath 表达式将 family 键的值提取为 VARCHAR
SELECT j->>'$.family' FROM example;
anatidae
对特殊字符使用引号
包含特殊字符 [
和 .
的 JSON 对象键可以通过用双引号 ("
) 将它们括起来使用
SELECT '{"d[u]._\"ck":42}'->'$."d[u]._\"ck"' AS v;
42