搜索快捷键 cmd + k | ctrl + k
netquack

一个 DuckDB 扩展,用于轻松解析、提取和分析域、URI 和路径。

维护者: hatamiarash7

安装和加载

INSTALL netquack FROM community;
LOAD netquack;

关于 netquack

此扩展旨在简化在数据库查询中直接处理域、URI、IP 和 Web 路径的操作。无论您是提取顶级域 (TLD)、解析 URI 组件,还是分析 Web 路径,Netquack 都提供了一套直观的函数,可高效处理您的所有网络任务。专为数据工程师、分析师和开发人员打造。

借助 Netquack,您可以从与 Web 相关的数据集中解锁更深层次的见解,而无需外部工具或复杂的工作流程。

请查阅文档,了解每个函数的更多详细信息和示例。

新增函数

function_name 函数类型 description comment examples
extract_domain 标量 从 URL 中提取主域 NULL [SELECT extract_domain('a.example.com') as domain;]
extract_host 标量 从 URL 中提取主机名 NULL [SELECT extract_host('https://b.a.example.com/path/path') as host;]
extract_path 标量 从 URL 中提取路径 NULL [SELECT extract_path('example.com/path/path/image.png') as path;]
extract_query_string 标量 从 URL 中提取查询字符串 NULL [SELECT extract_query_string('example.com?key=value') as query;]
extract_schema 标量 从 URL 中提取方案 NULL [SELECT extract_schema('mailto:[email protected]') as schema;]
extract_subdomain 标量 从 URL 中提取子域 NULL [SELECT extract_subdomain('test.example.com.ac') as dns_record;]
extract_tld 标量 从 URL 中提取顶级域 NULL [SELECT extract_tld('a.example.com') as tld;]
get_tranco_rank 标量 获取域的 Tranco 排名 NULL [SELECT get_tranco_rank('cloudflare.com') as rank;]
update_suffixes 标量 更新公共后缀 NULL [SELECT update_suffixes();]
update_tranco 标量 更新 Tranco 数据 NULL [SELECT update_tranco(true);]
extract_port 标量 NULL NULL NULL
extract_extension 标量 NULL NULL NULL
ipcalc table NULL NULL NULL
get_tranco_rank_category 标量 NULL NULL NULL
netquack_version table NULL NULL NULL