SQL 怪癖 – DuckDB - DuckDB 数据库

搜索快捷键 cmd + k | ctrl + k

文档 / SQL / DuckDB 的 SQL 方言

SQL 怪癖

像所有编程语言和库一样，DuckDB 也有其独特的特性和不一致之处。
其中一些是我们自身演变的遗留，另一些则是必然的，因为我们致力于遵守 SQL 标准，特别是 PostgreSQL 的方言（例外情况请参阅 “PostgreSQL 兼容性” 页面）。其余的可能只是偏好不同，或者我们甚至就应该做什么达成了一致，但尚未着手。

承认这些怪癖是我们能做的最好的事情，这就是我们下面整理了一系列示例的原因。

空组聚合

对于空组，聚合函数 sum、list 和 string_agg 都返回 NULL，而不是 0、[] 和 ''。这由 SQL 标准规定并被我们所知的所有 SQL 实现所遵守。此行为被列表聚合函数 list_sum 继承，但 DuckDB 原生函数 list_dot_product 则不会，它在空列表上返回 0。

0 基索引与 1 基索引

为遵守标准 SQL，几乎所有地方都使用 1 基索引，例如数组和字符串的索引与切片，以及窗口函数（row_number、rank、dense_rank）。然而，与 PostgreSQL 类似，JSON 特性使用 0 基索引。

类型

`UINT8` 与 `INT8`

UINT8 和 INT8 是不同宽度的整数类型的别名

UINT8 对应于 UTINYINT，因为它是一个 8 位无符号整数
INT8 对应于 BIGINT，因为它是一个 8 字节有符号整数

解释：数值类型 INTn 和 UINTn 中的 n 表示数字的宽度，单位可以是字节或位。INT1、INT2、INT4 对应字节数，而 INT16、INT32 和 INT64 对应位数。UINT 值也适用相同规则。然而，n = 8 对于位数和字节数都是有效的选择。对于无符号值，UINT8 对应 UTINYINT（8 位）。对于有符号值，INT8 对应 BIGINT（8 字节）。

表达式

可能会让你惊讶的结果

表达式	结果	注意
`-2^2`	`4.0`	PostgreSQL 兼容性意味着一元负号的优先级高于幂运算符。请使用额外的括号，例如 `-(2^2)`，或者使用 `pow` 函数，例如 `-pow(2, 2)`，以避免错误。
`'t' = true`	`true`	与 PostgreSQL 兼容。
`1 = '1'`	`true`	与 PostgreSQL 兼容。
`1 = ' 1'`	`true`	与 PostgreSQL 兼容。
`1 = '01'`	`true`	与 PostgreSQL 兼容。
`1 = ' 01 '`	`true`	与 PostgreSQL 兼容。
`1 = true`	`true`	与 PostgreSQL 不兼容。
`1 = '1.1'`	`true`	与 PostgreSQL 不兼容。
`1 IN (0, NULL)`	`NULL`	如果你将输入和输出中的 `NULL` 视为 `UNKNOWN`，这就有意义。
`1 in [0, NULL]`	`false`
`concat('abc', NULL)`	`abc`	与 PostgreSQL 兼容。`list_concat` 的行为类似。
`'abc' \|\| NULL`	`NULL`

CREATE TABLE tbl AS SELECT 1 AS a;
SELECT a FROM (SELECT *, 2 AS a FROM tbl);

a
1

`SELECT` 选择列的大小写不敏感

由于大小写不敏感，当 file.parquet 文件中名为 A 的列出现在所需列 a 之前时，无法使用 SELECT a FROM 'file.parquet'。

`USING SAMPLE`

USING SAMPLE 子句在语法上放置在 WHERE 和 GROUP BY 子句之后（与 LIMIT 子句相同），但在语义上却在两者之前应用（与 LIMIT 子句不同）。

空组聚合

0 基索引与 1 基索引

类型

`UINT8` 与 `INT8`

表达式

可能会让你惊讶的结果

`NaN` 值

`age` 函数

提取函数

子句

`SELECT` 中列的自动去重

`SELECT` 选择列的大小写不敏感

`USING SAMPLE`

关于此页面

本文中