一个 DuckDB 扩展,用于轻松解析、提取和分析域、URI 和路径。
维护者: hatamiarash7
安装和加载
INSTALL netquack FROM community;
LOAD netquack;
关于 netquack
此扩展旨在简化在数据库查询中直接处理域、URI、IP 和 Web 路径的操作。无论您是提取顶级域 (TLD)、解析 URI 组件,还是分析 Web 路径,Netquack 都提供了一套直观的函数,可高效处理您的所有网络任务。专为数据工程师、分析师和开发人员打造。
借助 Netquack,您可以从与 Web 相关的数据集中解锁更深层次的见解,而无需外部工具或复杂的工作流程。
请查阅文档,了解每个函数的更多详细信息和示例。
新增函数
function_name | 函数类型 | description | comment | examples |
---|---|---|---|---|
extract_domain | 标量 | 从 URL 中提取主域 | NULL | [SELECT extract_domain('a.example.com') as domain;] |
extract_host | 标量 | 从 URL 中提取主机名 | NULL | [SELECT extract_host('https://b.a.example.com/path/path') as host;] |
extract_path | 标量 | 从 URL 中提取路径 | NULL | [SELECT extract_path('example.com/path/path/image.png') as path;] |
extract_query_string | 标量 | 从 URL 中提取查询字符串 | NULL | [SELECT extract_query_string('example.com?key=value') as query;] |
extract_schema | 标量 | 从 URL 中提取方案 | NULL | [SELECT extract_schema('mailto:[email protected]') as schema;] |
extract_subdomain | 标量 | 从 URL 中提取子域 | NULL | [SELECT extract_subdomain('test.example.com.ac') as dns_record;] |
extract_tld | 标量 | 从 URL 中提取顶级域 | NULL | [SELECT extract_tld('a.example.com') as tld;] |
get_tranco_rank | 标量 | 获取域的 Tranco 排名 | NULL | [SELECT get_tranco_rank('cloudflare.com') as rank;] |
update_suffixes | 标量 | 更新公共后缀 | NULL | [SELECT update_suffixes();] |
update_tranco | 标量 | 更新 Tranco 数据 | NULL | [SELECT update_tranco(true);] |
extract_port | 标量 | NULL | NULL | NULL |
extract_extension | 标量 | NULL | NULL | NULL |
ipcalc | table | NULL | NULL | NULL |
get_tranco_rank_category | 标量 | NULL | NULL | NULL |
netquack_version | table | NULL | NULL | NULL |