技术深度解析
Seltz的技术主张基于对搜索技术栈的彻底重构,其优化目标只有一个:AI智能体。传统的搜索API(如Google Custom Search、SerpAPI)是为人类节奏的交互而构建的,通常涉及浏览器模拟、广告剥离和结果格式化,这些操作会额外增加数百毫秒的延迟。对于智能体而言,这些都是冗余操作。
基于Rust的技术栈: 整个处理流水线均采用Rust实现,该语言以其零成本抽象、无畏并发和内存安全性著称,这些特性对于实现可预测的低延迟性能至关重要。该技术栈包括:
1. Seltz-Crawler: 一个高吞吐量、遵守规则的网络爬虫,优先获取新鲜度和结构化数据(JSON-LD、微数据),而非视觉页面渲染。它可能采用自适应礼貌策略,并专注于与智能体任务最相关的领域(知识库、金融数据、技术文档)。
2. Seltz-Index: 一个为机器可读性优化的自定义列式索引。它不存储渲染后的HTML片段,而是以专为超快速检索和片段生成设计的格式存储纯净文本、元数据和实体嵌入。索引分片和复制机制专为并行查询执行而设计。
3. 神经检索器-排序器: 搜索质量的核心。虽然细节是专有的,但其架构可能包含一个轻量级的双编码器模型(例如Sentence-BERT的蒸馏版本或来自`sentence-transformers` GitHub仓库的自定义模型)用于初始候选检索,然后由一个更复杂的交叉编码器进行最终重排序。关键在于,这些模型为推理速度进行了深度优化,可能使用了量化技术(通过`llama.cpp`或`GGUF`等库)并编译为在CPU上以最小开销运行,从而避免了对GPU的依赖以实现可扩展性。
200毫秒保证: 实现端到端(从查询提交到结构化结果返回)低于200毫秒的延迟是一项工程壮举。这需要:
- 可预测的网络路径: 将索引服务器部署在靠近智能体运行位置的主要云区域(例如AWS us-east-1, eu-west-1)。
- 查询并行化: API设计为原生支持批量查询,允许智能体在单个网络调用中发送10-100个搜索请求,Seltz后端并行执行它们并返回统一响应。这消除了困扰那些使用顺序API调用的智能体的网络往返延迟倍增问题。
- 结果格式: 结果以纯净、结构化的JSON格式(标题、URL、摘要、发布日期、置信度分数)返回,不含任何HTML、CSS或JavaScript,减少了有效负载大小和智能体的解析时间。
| 搜索解决方案 | 典型延迟 (p95) | 设计目标 | 批量查询支持 | 输出格式 |
| :--------------------- | :--------------------- | :------------------- | :--------------------- | :------------------- |
| Seltz API | <200 毫秒 | AI智能体 | 原生、并行 | 结构化JSON |
| SerpAPI / Serper | 500-1500 毫秒 | 人机交互应用 | 否(顺序) | 半结构化 / 原始HTML |
| Google Custom Search | 300-800 毫秒 | 网站搜索 | 否 | 复杂JSON/HTML |
| 自托管Elasticsearch | 50-100 毫秒(仅检索) | 企业搜索 | 需自定义实现 | Elastic DSL |
数据要点: 上表凸显了Seltz对延迟和以机器为中心的设计的专注。虽然自托管Elasticsearch可以实现较低的检索延迟,但它缺乏网络规模的索引和排序智能。Seltz低于200毫秒的保证,结合原生批量支持,意味着在智能体循环中的关键搜索操作上实现了3-5倍的延迟改进。
主要参与者与案例研究
AI智能体的基础设施层正在迅速成型,Seltz将自己定位在一个特定细分市场:高速、外部知识检索。
直接与间接竞争者:
- Perplexity AI: 虽然主要面向消费者的搜索界面,但其`pplx-api`提供了AI驱动的搜索端点。然而,它针对的是与人类的对话式、单次查询交互,而非低延迟、高吞吐量的智能体工作负载。
- Firecrawl (GitHub: `mendableai/firecrawl`): 一个将网站转换为LLM就绪数据(Markdown、结构化数据)的开源项目。它是爬取特定站点的补充工具,但并未提供基于广泛、新鲜网络索引的托管式低延迟搜索API。
- Brave Search API: 提供了一种注重隐私的Google替代方案,延迟尚可。然而,其API设计和定价并非为智能体的突发性、并行查询模式量身定制。
- 定制化解决方案: 拥有内部智能体计划的大型企业(例如摩根士丹利、彭博社)很可能在其内部数据湖和授权金融新闻源之上构建专有的搜索网关。Seltz的目标是为那些没有雄厚资源构建此类系统的长尾公司提供更优的托管服务。