⌘+k ctrl+k
1.3 (稳定版)
搜索快捷键 cmd + k | ctrl + k
索引

索引类型

DuckDB 提供了两种内置索引类型。索引也可以通过扩展定义。

最小-最大索引 (Zonemap)

一个最小-最大索引(也称为分区图或块范围索引)会为所有通用数据类型的列自动创建

自适应基数树 (ART)

自适应基数树 (ART) 主要用于确保主键约束并加速点查询和极高选择性(即 < 0.1%)的查询。ART 索引可以使用 CREATE INDEX 语句手动创建,并且会为具有 UNIQUEPRIMARY KEY 约束的列自动创建。

警告:ART 索引在创建过程中目前必须能够完全载入内存。如果索引在创建过程中无法完全载入内存,请避免创建 ART 索引。

通过扩展定义的索引

DuckDB 通过 spatial 扩展支持用于空间索引的R 树

持久性

最小-最大索引和 ART 索引都持久化在磁盘上。

CREATE INDEXDROP INDEX 语句

要创建ART 索引,请使用CREATE INDEX 语句。要删除ART 索引,请使用DROP INDEX 语句

ART 索引的限制

ART 索引会在第二个位置创建数据的次级副本——这会使处理复杂化,尤其是在与事务结合使用时。在修改也存储在次级索引中的数据时,会存在某些限制。

正如预期,索引对性能有显著影响,会减慢加载和更新速度,但会加速某些查询。请查阅性能指南以获取详细信息。

UPDATE 语句中的约束检查

对已索引列和无法原地更新的列执行的 UPDATE 语句会被转换为先 DELETE 原始行,然后 INSERT 更新后的行。这种重写会对性能产生影响,特别是对于宽表,因为重写的是整行而不是仅受影响的列。

此外,它还会导致 UPDATE 语句的以下约束检查限制。其他数据库管理系统(如 PostgreSQL)也存在相同的限制。

在下面的示例中,请注意行数如何超过 DuckDB 的标准向量大小(2048)。UPDATE 语句被重写为 DELETE,然后是 INSERT。这种重写是针对通过 DuckDB 处理管道的每块数据(2048 行)发生的。当将 i = 2047 更新为 i = 2048 时,我们尚不知道 2048 将变为 2049,依此类推。那是因为我们还没有看到那块数据。因此,我们会抛出约束冲突。

CREATE TABLE my_table (i INTEGER PRIMARY KEY);
INSERT INTO my_table SELECT range FROM range(3_000);
UPDATE my_table SET i = i + 1;
Constraint Error:
Duplicate key "i: 2048" violates primary key constraint.

一种变通方法是将 UPDATE 分解为 DELETE ... RETURNING ...,然后是 INSERT,并添加一些额外逻辑来(临时)存储 DELETE 的结果。所有语句都应通过 BEGIN 并在最终 COMMIT 的事务中运行。

以下是它在命令行客户端中可能的样子示例。

CREATE TABLE my_table (i INTEGER PRIMARY KEY);
INSERT INTO my_table SELECT range FROM range(3_000);

BEGIN;
CREATE TEMP TABLE tmp AS SELECT i FROM my_table;
DELETE FROM my_table;
INSERT INTO my_table SELECT i FROM tmp;
DROP TABLE tmp;
COMMIT;

在其他客户端中,你可能能够获取 DELETE ... RETURNING ... 的结果。然后,你可以在后续的 INSERT ... 语句中使用该结果,或者(如果客户端可用)利用 DuckDB 的 Appender

外键中过度积极的约束检查

如果你满足以下条件,则会出现此限制

  • 表具有 FOREIGN KEY 约束。
  • 对应的 PRIMARY KEY 表上有 UPDATE 操作,DuckDB 将其重写为 DELETE 后跟 INSERT
  • 待删除的行存在于外键表中。

如果满足这些条件,你将遇到意外的约束冲突

CREATE TABLE pk_table (id INTEGER PRIMARY KEY, payload VARCHAR[]);
INSERT INTO pk_table VALUES (1, ['hello']);
CREATE TABLE fk_table (id INTEGER REFERENCES pk_table(id));
INSERT INTO fk_table VALUES (1);
UPDATE pk_table SET payload = ['world'] WHERE id = 1;
Constraint Error:
Violates foreign key constraint because key "id: 1" is still referenced by a foreign key in a different table. If this is an unexpected constraint violation, please refer to our foreign key limitations in the documentation

其原因是 DuckDB 尚不支持“前瞻”。在 INSERT 期间,它不知道自己将作为 UPDATE 重写的一部分重新插入外键值。