Seltz推出200毫秒搜索API:以神经加速重构AI智能体基础设施

Hacker News April 2026
来源:Hacker NewsAI agentsautonomous AI归档:April 2026
AI竞赛正从模型能力转向更根本的基础设施构建——如何让智能体感知并作用于世界。初创公司Seltz从第一性原理出发,为AI智能体打造专用搜索API,将响应时间压缩至200毫秒以内,旨在消除自主工作流中的关键瓶颈。

人工智能领域正在发生一场根本性转变:焦点正从原始模型能力转向构建可靠、高性能AI智能体所需的专用基础设施。刚刚结束隐身模式的Seltz公司正是这一趋势的体现,其核心产品是一款专为自主AI系统设计的网络搜索API,并保证响应时间低于200毫秒。该公司的核心理念是:当前一代AI智能体的瓶颈并非缺乏智能,而是依赖于为人类设计的、迟缓的感知工具。当一个协调复杂任务的智能体需要并行执行数十次网络搜索(用于数据验证、事实核查或信息收集)时,标准搜索API的累积延迟可能从数秒膨胀至数分钟,彻底摧毁任何实时响应的可能性。Seltz通过重构整个搜索技术栈来解决这一问题,其系统针对机器可读性、并行查询和极低延迟进行了深度优化。这标志着AI基础设施层正朝着专业化、垂直化方向演进,为真正自主、高效的AI智能体铺平道路。

技术深度解析

Seltz的技术主张基于对搜索技术栈的彻底重构,其优化目标只有一个:AI智能体。传统的搜索API(如Google Custom Search、SerpAPI)是为人类节奏的交互而构建的,通常涉及浏览器模拟、广告剥离和结果格式化,这些操作会额外增加数百毫秒的延迟。对于智能体而言,这些都是冗余操作。

基于Rust的技术栈: 整个处理流水线均采用Rust实现,该语言以其零成本抽象、无畏并发和内存安全性著称,这些特性对于实现可预测的低延迟性能至关重要。该技术栈包括:
1. Seltz-Crawler: 一个高吞吐量、遵守规则的网络爬虫,优先获取新鲜度和结构化数据(JSON-LD、微数据),而非视觉页面渲染。它可能采用自适应礼貌策略,并专注于与智能体任务最相关的领域(知识库、金融数据、技术文档)。
2. Seltz-Index: 一个为机器可读性优化的自定义列式索引。它不存储渲染后的HTML片段,而是以专为超快速检索和片段生成设计的格式存储纯净文本、元数据和实体嵌入。索引分片和复制机制专为并行查询执行而设计。
3. 神经检索器-排序器: 搜索质量的核心。虽然细节是专有的,但其架构可能包含一个轻量级的双编码器模型(例如Sentence-BERT的蒸馏版本或来自`sentence-transformers` GitHub仓库的自定义模型)用于初始候选检索,然后由一个更复杂的交叉编码器进行最终重排序。关键在于,这些模型为推理速度进行了深度优化,可能使用了量化技术(通过`llama.cpp`或`GGUF`等库)并编译为在CPU上以最小开销运行,从而避免了对GPU的依赖以实现可扩展性。

200毫秒保证: 实现端到端(从查询提交到结构化结果返回)低于200毫秒的延迟是一项工程壮举。这需要:
- 可预测的网络路径: 将索引服务器部署在靠近智能体运行位置的主要云区域(例如AWS us-east-1, eu-west-1)。
- 查询并行化: API设计为原生支持批量查询,允许智能体在单个网络调用中发送10-100个搜索请求,Seltz后端并行执行它们并返回统一响应。这消除了困扰那些使用顺序API调用的智能体的网络往返延迟倍增问题。
- 结果格式: 结果以纯净、结构化的JSON格式(标题、URL、摘要、发布日期、置信度分数)返回,不含任何HTML、CSS或JavaScript,减少了有效负载大小和智能体的解析时间。

| 搜索解决方案 | 典型延迟 (p95) | 设计目标 | 批量查询支持 | 输出格式 |
| :--------------------- | :--------------------- | :------------------- | :--------------------- | :------------------- |
| Seltz API | <200 毫秒 | AI智能体 | 原生、并行 | 结构化JSON |
| SerpAPI / Serper | 500-1500 毫秒 | 人机交互应用 | 否(顺序) | 半结构化 / 原始HTML |
| Google Custom Search | 300-800 毫秒 | 网站搜索 | 否 | 复杂JSON/HTML |
| 自托管Elasticsearch | 50-100 毫秒(仅检索) | 企业搜索 | 需自定义实现 | Elastic DSL |

数据要点: 上表凸显了Seltz对延迟和以机器为中心的设计的专注。虽然自托管Elasticsearch可以实现较低的检索延迟,但它缺乏网络规模的索引和排序智能。Seltz低于200毫秒的保证,结合原生批量支持,意味着在智能体循环中的关键搜索操作上实现了3-5倍的延迟改进。

主要参与者与案例研究

AI智能体的基础设施层正在迅速成型,Seltz将自己定位在一个特定细分市场:高速、外部知识检索。

直接与间接竞争者:
- Perplexity AI: 虽然主要面向消费者的搜索界面,但其`pplx-api`提供了AI驱动的搜索端点。然而,它针对的是与人类的对话式、单次查询交互,而非低延迟、高吞吐量的智能体工作负载。
- Firecrawl (GitHub: `mendableai/firecrawl`): 一个将网站转换为LLM就绪数据(Markdown、结构化数据)的开源项目。它是爬取特定站点的补充工具,但并未提供基于广泛、新鲜网络索引的托管式低延迟搜索API。
- Brave Search API: 提供了一种注重隐私的Google替代方案,延迟尚可。然而,其API设计和定价并非为智能体的突发性、并行查询模式量身定制。
- 定制化解决方案: 拥有内部智能体计划的大型企业(例如摩根士丹利、彭博社)很可能在其内部数据湖和授权金融新闻源之上构建专有的搜索网关。Seltz的目标是为那些没有雄厚资源构建此类系统的长尾公司提供更优的托管服务。

更多来自 Hacker News

多智能体 AI 系统革命性重塑自动化漏洞发现格局网络安全格局正经历由多智能体大语言模型系统驱动的根本性变革。传统的漏洞扫描严重依赖静态签名和基于规则的引擎,往往产生高误报率,需要大量人工分类并延误修复工作,导致安全团队负担过重且响应滞后。新兴范式引入了协作式 AI 智能体,战略性地在扫描Webflow 祭出“代理优先”架构,无代码 Web 开发迎来范式革命Webflow 正在执行一次基础设施的根本性 pivot,其战略重心已从视觉设计工具转向成为新兴代理经济的首要编排层。这一转型重新定义了网站的本质:从静态的展示层转变为动态的、机器可读的接口,具备自主协商交易的能力。通过直接将语义元数据嵌入后 Web 时代:AI Agent 弃用 HTTPS 转向轻量级协议支撑人工智能的数字基础设施正在经历一场静默却深刻的转型,这场变革虽未大张旗鼓,却影响深远。随着自主 Agent 成为在线信息的主要消费者,专为人类视觉消费设计的现代 Web 遗留架构正日益显得过时,无法适应自动化流程的高吞吐要求。沉重的 J查看来源专题页Hacker News 已收录 4054 篇文章

相关专题

AI agents789 篇相关文章autonomous AI113 篇相关文章

时间归档

April 20263042 篇已发布文章

延伸阅读

AI智能体:终极生产力工具,还是危险赌局?自主AI智能体正从被动聊天机器人进化为能决策的行动实体,由此催生了一个深刻的悖论:其价值与风险密不可分。AINews深入调查,这些系统究竟会成为人类最强大的工具,还是最危险的赌注。Ravix的静默革命:将Claude订阅转变为全天候AI员工一类新型AI智能体工具正在涌现,其核心并非构建新基础设施,而是重新利用现有订阅服务。Ravix将Claude Code订阅转化为24/7自主运行的AI员工,无需额外API成本,从根本上改变了用户获取和部署自动化的方式。这既是技术突破,也是众AI智能体失控:能力与管控之间的危险鸿沟将自主AI智能体投入生产系统的竞赛,已引发一场根本性的安全危机。当这些“数字员工”获得前所未有的操作能力时,行业对其能力的扩张热情已远超可靠控制框架的发展速度,为我们的技术基础设施埋下了系统性漏洞。超越Claude Code:智能体AI架构如何重塑智能系统以Claude Code为代表的先进AI智能体系统的崛起,标志着人工智能发展进入关键转折点。前沿焦点已从单纯的模型能力,转向以记忆管理、工具编排与多智能体协作为核心的架构创新,这正定义着下一代智能系统的形态。

常见问题

这次公司发布“Seltz's 200ms Search API Redefines AI Agent Infrastructure with Neural Acceleration”主要讲了什么?

A fundamental shift is underway in artificial intelligence, moving beyond raw model capability toward the specialized infrastructure required for reliable, performant AI agents. Se…

从“Seltz search API pricing vs SerpAPI”看,这家公司的这次发布为什么值得关注?

Seltz's technical proposition rests on a radical re-architecture of the search stack, optimized for a single user: the AI agent. Traditional search APIs (e.g., Google Custom Search, SerpAPI) are built for human-paced int…

围绕“how to integrate Seltz with LangChain agent”,这次发布可能带来哪些后续影响?

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。