搜索快捷键 cmd + k | ctrl + k
- 安装
- 文档
- 入门
- 连接
- 数据导入
- 客户端 API
- 概览
- ADBC
- C
- C++
- CLI
- Dart
- Go
- Java (JDBC)
- Julia
- Node.js (已弃用)
- Node.js (Neo)
- ODBC
- PHP
- Python
- R
- Rust
- Swift
- Wasm
- SQL
- 介绍
- 语句
- 概览
- ANALYZE
- ALTER TABLE
- ALTER VIEW
- ATTACH 和 DETACH
- CALL
- CHECKPOINT
- COMMENT ON
- COPY
- CREATE INDEX
- CREATE MACRO
- CREATE SCHEMA
- CREATE SECRET
- CREATE SEQUENCE
- CREATE TABLE
- CREATE VIEW
- CREATE TYPE
- DELETE
- DESCRIBE
- DROP
- EXPORT 和 IMPORT DATABASE
- INSERT
- LOAD / INSTALL
- PIVOT
- 性能分析
- SELECT
- SET / RESET
- SET VARIABLE
- SUMMARIZE
- 事务管理
- UNPIVOT
- UPDATE
- USE
- VACUUM
- 查询语法
- SELECT
- FROM 和 JOIN
- WHERE
- GROUP BY
- GROUPING SETS
- HAVING
- ORDER BY
- LIMIT 和 OFFSET
- SAMPLE
- 展开嵌套
- WITH
- WINDOW
- QUALIFY
- VALUES
- FILTER
- 集合操作
- 预处理语句
- 数据类型
- 表达式
- 函数
- 概览
- 聚合函数
- 数组函数
- 位字符串函数
- Blob 函数
- 日期格式化函数
- 日期函数
- 日期部分函数
- 枚举函数
- 间隔函数
- Lambda 函数
- 列表函数
- 映射函数
- 嵌套函数
- 数值函数
- 模式匹配
- 正则表达式
- 结构体函数
- 文本函数
- 时间函数
- 时间戳函数
- 带时区时间戳函数
- 联合函数
- 实用函数
- 窗口函数
- 约束
- 索引
- 元查询
- DuckDB 的 SQL 方言
- 示例
- 配置
- 扩展
- 核心扩展
- 概览
- 自动补全
- Avro
- AWS
- Azure
- Delta
- DuckLake
- 编码
- Excel
- 全文搜索
- httpfs (HTTP 和 S3)
- Iceberg
- ICU
- inet
- jemalloc
- MySQL
- PostgreSQL
- 空间
- SQLite
- TPC-DS
- TPC-H
- UI
- VSS
- 指南
- 概览
- 数据查看器
- 数据库集成
- 文件格式
- 概览
- CSV 导入
- CSV 导出
- 直接读取文件
- Excel 导入
- Excel 导出
- JSON 导入
- JSON 导出
- Parquet 导入
- Parquet 导出
- 查询 Parquet 文件
- 使用 file: 协议访问文件
- 网络和云存储
- 概览
- HTTP Parquet 导入
- S3 Parquet 导入
- S3 Parquet 导出
- S3 Iceberg 导入
- S3 Express One
- GCS 导入
- Cloudflare R2 导入
- 通过 HTTPS / S3 使用 DuckDB
- Fastly 对象存储导入
- 元查询
- ODBC
- 性能
- Python
- 安装
- 执行 SQL
- Jupyter Notebooks
- marimo Notebooks
- Pandas 上的 SQL
- 从 Pandas 导入
- 导出到 Pandas
- 从 Numpy 导入
- 导出到 Numpy
- Arrow 上的 SQL
- 从 Arrow 导入
- 导出到 Arrow
- Pandas 上的关系型 API
- 多个 Python 线程
- 与 Ibis 集成
- 与 Polars 集成
- 使用 fsspec 文件系统
- SQL 编辑器
- SQL 功能
- 代码片段
- 故障排除
- 术语表
- 离线浏览
- 操作手册
- 开发
- 内部结构
- 为什么选择 DuckDB
- 行为准则
- 发布日历
- 路线图
- 站点地图
- 在线演示
文档 / SQL / 数据类型
数组类型
一个 ARRAY
列存储固定大小的数组。列中的所有字段必须具有相同的长度和相同的底层类型。数组通常用于存储数字数组,但可以包含任何统一的数据类型,包括 ARRAY
、LIST
和 STRUCT
类型。
数组可用于存储向量,例如词嵌入或图像嵌入。
要存储变长列表,请使用 LIST
类型。有关嵌套数据类型之间的比较,请参阅数据类型概述。
PostgreSQL 中的
ARRAY
类型允许变长字段。DuckDB 的ARRAY
类型是固定长度的。
创建数组
数组可以使用 array_value(expr, ...)
函数创建。
使用 array_value
函数构造
SELECT array_value(1, 2, 3);
您总是可以将数组隐式转换为列表(并使用列表函数,如 list_extract
、[i]
)
SELECT array_value(1, 2, 3)[2];
您可以将列表转换为数组(维度必须匹配)
SELECT [3, 2, 1]::INTEGER[3];
数组可以嵌套
SELECT array_value(array_value(1, 2), array_value(3, 4), array_value(5, 6));
数组可以存储结构体
SELECT array_value({'a': 1, 'b': 2}, {'a': 3, 'b': 4});
定义数组字段
数组可以使用 TYPE_NAME[LENGTH]
语法创建。例如,要创建一个包含 3 个整数的数组字段,请运行
CREATE TABLE array_table (id INTEGER, arr INTEGER[3]);
INSERT INTO array_table VALUES (10, [1, 2, 3]), (20, [4, 5, 6]);
从数组中检索值
可以使用方括号和切片表示法,或通过 列表函数(如 list_extract
和 array_extract
)从数组中检索一个或多个值。使用定义数组字段中的示例。
以下用于提取数组第二个元素的查询是等效的
SELECT id, arr[1] AS element FROM array_table;
SELECT id, list_extract(arr, 1) AS element FROM array_table;
SELECT id, array_extract(arr, 1) AS element FROM array_table;
id | 元素 |
---|---|
10 | 1 |
20 | 4 |
使用切片表示法返回一个 LIST
SELECT id, arr[1:2] AS elements FROM array_table;
id | 元素 |
---|---|
10 | [1, 2] |
20 | [4, 5] |
函数
所有 LIST
函数都适用于 ARRAY
类型。此外,还支持一些 ARRAY
原生函数。请参阅ARRAY
函数。
示例
创建示例数据
CREATE TABLE x (i INTEGER, v FLOAT[3]);
CREATE TABLE y (i INTEGER, v FLOAT[3]);
INSERT INTO x VALUES (1, array_value(1.0::FLOAT, 2.0::FLOAT, 3.0::FLOAT));
INSERT INTO y VALUES (1, array_value(2.0::FLOAT, 3.0::FLOAT, 4.0::FLOAT));
计算叉积
SELECT array_cross_product(x.v, y.v)
FROM x, y
WHERE x.i = y.i;
计算余弦相似度
SELECT array_cosine_similarity(x.v, y.v)
FROM x, y
WHERE x.i = y.i;
排序
ARRAY
实例的排序是使用字典序定义的。NULL
值大于所有其他值,并被视为彼此相等。
另请参阅
有关更多函数,请参阅列表函数。