Seltz推出200毫秒搜索API:以神经加速重构AI智能体基础设施

Hacker News April 2026
来源:Hacker NewsAI agentsautonomous AI归档:April 2026
AI竞赛正从模型能力转向更根本的基础设施构建——如何让智能体感知并作用于世界。初创公司Seltz从第一性原理出发,为AI智能体打造专用搜索API,将响应时间压缩至200毫秒以内,旨在消除自主工作流中的关键瓶颈。

人工智能领域正在发生一场根本性转变:焦点正从原始模型能力转向构建可靠、高性能AI智能体所需的专用基础设施。刚刚结束隐身模式的Seltz公司正是这一趋势的体现,其核心产品是一款专为自主AI系统设计的网络搜索API,并保证响应时间低于200毫秒。该公司的核心理念是:当前一代AI智能体的瓶颈并非缺乏智能,而是依赖于为人类设计的、迟缓的感知工具。当一个协调复杂任务的智能体需要并行执行数十次网络搜索(用于数据验证、事实核查或信息收集)时,标准搜索API的累积延迟可能从数秒膨胀至数分钟,彻底摧毁任何实时响应的可能性。Seltz通过重构整个搜索技术栈来解决这一问题,其系统针对机器可读性、并行查询和极低延迟进行了深度优化。这标志着AI基础设施层正朝着专业化、垂直化方向演进,为真正自主、高效的AI智能体铺平道路。

技术深度解析

Seltz的技术主张基于对搜索技术栈的彻底重构,其优化目标只有一个:AI智能体。传统的搜索API(如Google Custom Search、SerpAPI)是为人类节奏的交互而构建的,通常涉及浏览器模拟、广告剥离和结果格式化,这些操作会额外增加数百毫秒的延迟。对于智能体而言,这些都是冗余操作。

基于Rust的技术栈: 整个处理流水线均采用Rust实现,该语言以其零成本抽象、无畏并发和内存安全性著称,这些特性对于实现可预测的低延迟性能至关重要。该技术栈包括:
1. Seltz-Crawler: 一个高吞吐量、遵守规则的网络爬虫,优先获取新鲜度和结构化数据(JSON-LD、微数据),而非视觉页面渲染。它可能采用自适应礼貌策略,并专注于与智能体任务最相关的领域(知识库、金融数据、技术文档)。
2. Seltz-Index: 一个为机器可读性优化的自定义列式索引。它不存储渲染后的HTML片段,而是以专为超快速检索和片段生成设计的格式存储纯净文本、元数据和实体嵌入。索引分片和复制机制专为并行查询执行而设计。
3. 神经检索器-排序器: 搜索质量的核心。虽然细节是专有的,但其架构可能包含一个轻量级的双编码器模型(例如Sentence-BERT的蒸馏版本或来自`sentence-transformers` GitHub仓库的自定义模型)用于初始候选检索,然后由一个更复杂的交叉编码器进行最终重排序。关键在于,这些模型为推理速度进行了深度优化,可能使用了量化技术(通过`llama.cpp`或`GGUF`等库)并编译为在CPU上以最小开销运行,从而避免了对GPU的依赖以实现可扩展性。

200毫秒保证: 实现端到端(从查询提交到结构化结果返回)低于200毫秒的延迟是一项工程壮举。这需要:
- 可预测的网络路径: 将索引服务器部署在靠近智能体运行位置的主要云区域(例如AWS us-east-1, eu-west-1)。
- 查询并行化: API设计为原生支持批量查询,允许智能体在单个网络调用中发送10-100个搜索请求,Seltz后端并行执行它们并返回统一响应。这消除了困扰那些使用顺序API调用的智能体的网络往返延迟倍增问题。
- 结果格式: 结果以纯净、结构化的JSON格式(标题、URL、摘要、发布日期、置信度分数)返回,不含任何HTML、CSS或JavaScript,减少了有效负载大小和智能体的解析时间。

| 搜索解决方案 | 典型延迟 (p95) | 设计目标 | 批量查询支持 | 输出格式 |
| :--------------------- | :--------------------- | :------------------- | :--------------------- | :------------------- |
| Seltz API | <200 毫秒 | AI智能体 | 原生、并行 | 结构化JSON |
| SerpAPI / Serper | 500-1500 毫秒 | 人机交互应用 | 否(顺序) | 半结构化 / 原始HTML |
| Google Custom Search | 300-800 毫秒 | 网站搜索 | 否 | 复杂JSON/HTML |
| 自托管Elasticsearch | 50-100 毫秒(仅检索) | 企业搜索 | 需自定义实现 | Elastic DSL |

数据要点: 上表凸显了Seltz对延迟和以机器为中心的设计的专注。虽然自托管Elasticsearch可以实现较低的检索延迟,但它缺乏网络规模的索引和排序智能。Seltz低于200毫秒的保证,结合原生批量支持,意味着在智能体循环中的关键搜索操作上实现了3-5倍的延迟改进。

主要参与者与案例研究

AI智能体的基础设施层正在迅速成型,Seltz将自己定位在一个特定细分市场:高速、外部知识检索。

直接与间接竞争者:
- Perplexity AI: 虽然主要面向消费者的搜索界面,但其`pplx-api`提供了AI驱动的搜索端点。然而,它针对的是与人类的对话式、单次查询交互,而非低延迟、高吞吐量的智能体工作负载。
- Firecrawl (GitHub: `mendableai/firecrawl`): 一个将网站转换为LLM就绪数据(Markdown、结构化数据)的开源项目。它是爬取特定站点的补充工具,但并未提供基于广泛、新鲜网络索引的托管式低延迟搜索API。
- Brave Search API: 提供了一种注重隐私的Google替代方案,延迟尚可。然而,其API设计和定价并非为智能体的突发性、并行查询模式量身定制。
- 定制化解决方案: 拥有内部智能体计划的大型企业(例如摩根士丹利、彭博社)很可能在其内部数据湖和授权金融新闻源之上构建专有的搜索网关。Seltz的目标是为那些没有雄厚资源构建此类系统的长尾公司提供更优的托管服务。

更多来自 Hacker News

AI智能体操作系统崛起:开源如何架构自主智能人工智能领域正在经历一场根本性的架构变革。尽管大语言模型已展现出卓越的认知能力,但将其转化为能够在现实世界中执行多步骤任务的可靠、持久且可协作的智能体,仍是艰巨的工程挑战。开发者们被迫拼凑记忆、工具使用、状态管理和智能体间通信等分散组件,导谷歌自研AI芯片撼动英伟达:推理计算王座遭遇正面挑战谷歌的AI战略正在经历一场深刻的、以硬件为中心的转型。公司正积极开发其下一代张量处理单元(TPU),并锐意聚焦于驱动搜索、Gemini和YouTube等实时服务的推理工作负载。这直接冲击了英伟达在AI加速硬件领域近乎垄断的地位,尤其是在延迟Runtime Guardrails Emerge as Essential Infrastructure for Taming AI Coding AssistantsThe landscape of AI-assisted programming is undergoing a fundamental transformation. The initial phase, characterized by查看来源专题页Hacker News 已收录 2219 篇文章

相关专题

AI agents560 篇相关文章autonomous AI99 篇相关文章

时间归档

April 20261866 篇已发布文章

延伸阅读

AI智能体失控:能力与管控之间的危险鸿沟将自主AI智能体投入生产系统的竞赛,已引发一场根本性的安全危机。当这些“数字员工”获得前所未有的操作能力时,行业对其能力的扩张热情已远超可靠控制框架的发展速度,为我们的技术基础设施埋下了系统性漏洞。超越Claude Code:智能体AI架构如何重塑智能系统以Claude Code为代表的先进AI智能体系统的崛起,标志着人工智能发展进入关键转折点。前沿焦点已从单纯的模型能力,转向以记忆管理、工具编排与多智能体协作为核心的架构创新,这正定义着下一代智能系统的形态。G42的AI智能体招聘实验:当数字实体成为公司正式参与者阿联酋科技巨头G42启动了一项颠覆性的企业实验:为自主AI智能体建立正式框架,使其能够申请并可能担任公司内部职位。此举超越了自动化范畴,将AI定位为制度性参与者而非工具,迫使人们从根本上重新审视组织结构、价值创造与责任归属。AI智能体幻象:为何惊艳的演示无法兑现现实价值AI领域充斥着自主智能体执行复杂多步任务的炫目演示,但这些舞台表演与将稳健智能体融入日常工作流之间存在深刻断层。本报告揭示了造成这一‘演示陷阱’的核心技术与商业壁垒,并勾勒出通往真实效用的路径。

常见问题

这次公司发布“Seltz's 200ms Search API Redefines AI Agent Infrastructure with Neural Acceleration”主要讲了什么?

A fundamental shift is underway in artificial intelligence, moving beyond raw model capability toward the specialized infrastructure required for reliable, performant AI agents. Se…

从“Seltz search API pricing vs SerpAPI”看,这家公司的这次发布为什么值得关注?

Seltz's technical proposition rests on a radical re-architecture of the search stack, optimized for a single user: the AI agent. Traditional search APIs (e.g., Google Custom Search, SerpAPI) are built for human-paced int…

围绕“how to integrate Seltz with LangChain agent”,这次发布可能带来哪些后续影响?

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。