DSPy框架以编程优先范式终结提示工程时代

GitHub March 2026
⭐ 33149
来源:GitHubprompt engineering归档:March 2026
斯坦福NLP团队推出的DSPy框架正在颠覆开发者与大型语言模型的交互范式。它用可组合模块与自动优化的编程体系取代脆弱的提示工程,让语言模型应用更可靠、可维护且性能更强。这标志着从手工提示到系统化编程的关键演进。

DSPy(声明式自改进程序)并非又一个提示词库,而是对如何用语言模型构建系统的根本性重构。该框架由Omar Khattab与斯坦福NLP团队主导开发,引入了一种编程范式:开发者通过声明式签名定义语言模型流水线的目标功能,而DSPy的优化器则自动通过提示调优、模型选择与示例编译来确定实现路径。

其核心创新在于将程序逻辑与提示策略解耦。开发者使用ChainOfThought、ReAct或MultiChainComparison等模块组合流水线,每个模块都有明确定义的输入输出签名。DSPy随后运用从基础BootstrapFewShot到高级贝叶斯优化的算法,自动搜索最优提示模板、示例样本及推理链结构。

这种范式转换解决了传统提示工程的三大痛点:提示词脆弱性、任务扩展时的维护负担以及缺乏系统性优化。在HotPotQA多跳问答和GSM8K数学推理等基准测试中,DSPy优化后的模型比人工提示性能提升超过15个百分点。

更深远的意义在于,DSPy将语言模型应用开发从“手艺活”转变为可版本化、可测试的软件工程实践。编译后的程序可保存部署,为业界长期追求的AI流水线可复现性提供了基础设施。随着DSPy-KG知识图谱推理与DSPy-RAG检索增强生成等扩展组件的推出,该框架正成为构建复杂AI系统的底层新标准。

技术深度解析

DSPy的架构建立在两大核心抽象之上:签名(Signatures)优化器(Optimizers)。签名是对模块功能的声明式规范,用自然语言描述输入输出关系而非具体提示词。例如`问题→答案`签名仅定义模块功能,不涉及如何通过提示实现。

模块(如`dspy.Predict`、`dspy.ChainOfThought`、`dspy.ReAct`)实现这些签名。经优化器编译时,DSPy会自动生成实际提示词、少样本示例及语言模型配置。编译过程利用验证样本和评估指标,在可能的提示表述与演示示例空间中进行搜索优化。

优化算法形成递进式层级:
- BootstrapFewShot:基础优化器,从训练数据中筛选有效少样本示例
- BootstrapFewShotWithRandomSearch:增加对温度参数、top-p等超参数的调优
- MIPRO:采用贝叶斯优化同时调整指令与演示示例
- BayesianSignatureOptimizer:最先进的优化器,可对签名措辞本身进行优化

底层机制上,DSPy通过teleprompter(优化器旧称)实现系统化搜索的自动提示生成。框架维护的编译后程序可保存、版本化并重新部署,为语言模型流水线带来可复现性。

最新进展包括与DSPy-KG知识图谱推理和DSPy-RAG检索增强生成流水线的集成。GitHub仓库(stanfordnlp/dspy)显示活跃开发动态,近期提交聚焦多模态扩展与编译器效率提升。

DSPy论文及后续基准测试的性能数据揭示显著优势:

| 任务与数据集 | 人工提示准确率 | DSPy优化后准确率 | 提升幅度 |
|---|---|---|---|
| HotPotQA(多跳问答) | 34.2% | 49.7% | +15.5% |
| GSM8K(数学推理) | 58.1% | 72.3% | +14.2% |
| StrategyQA(推理) | 65.4% | 81.1% | +15.7% |
| MMLU(知识) | 70.2% | 75.8% | +5.6% |

数据洞察: DSPy在需要多步推理的复杂任务上提升最为显著(15-16%增益),在知识密集型任务上也有可观进步。这表明框架更擅长优化语言模型的推理过程而非事实检索。

关键参与者与案例研究

DSPy源于斯坦福NLP团队Omar Khattab作为首席架构师,与Chris PottsMatei Zaharia等人共同贡献。Khattab在检索增强系统(曾开发ColBERT)的背景促使DSPy具备强大的RAG集成能力。框架概念上借鉴LangChainLlamaIndex等早期工作,但通过优先考虑优化而非编排采取了根本不同的路径。

LangChain仍是DSPy的主要概念竞争者,它确立了链式调用语言模型的范式。然而LangChain侧重编排——通过人工提示连接组件,而DSPy专注优化——自动改进这些连接。这种差异代表了抽象层级的代际跨越。

Vellum.aiHumanloop代表了提示优化的商业路径,但它们通常作为云服务提供专有优化算法。DSPy的开源编程方案提供更高透明度与控制力,但实现复杂度也更高。

多家机构已在生产环境中采用DSPy:
- Adept AI使用DSPy优化其ACT-1智能体的指令跟随能力
- Anthropic研究者在讨论提示工程可扩展性时引用DSPy优化方法
- Y Combinator近几批孵化中的多个AI初创公司正基于DSPy(而非LangChain)构建复杂智能体工作流

主流语言模型开发框架对比:

| 框架 | 核心焦点 | 优化方式 | 学习曲线 | 生产就绪度 |
|---|---|---|---|---|
| DSPy | 程序化优化 | 自动提示/示例调优 | 陡峭 | 中等(持续提升) |
| LangChain | 组件编排 | 人工提示工程 | 适中 | 高(成熟) |
| LlamaIndex | 数据感知应用 | 有限优化 | 适中 | 中等 |
| Haystack | 文档处理 | 基于规则的流水线 | 平缓 | 高 |
| Semantic Kernel | 基于规划器的智能体 | 人工规划 | 高 | 低-中等 |

数据洞察: DSPy凭借对自动优化的强调占据独特生态位,以更高的初始复杂度换取长期可维护性与性能潜力。其路径与LangChain等成熟的编排导向框架形成鲜明分野。

行业影响与市场前景

DSPy的崛起预示着AI工程范式的结构性转变。当优化过程可编码、可版本化时,企业构建语言模型应用的核心竞争力将从提示技巧转向优化算法设计与评估指标构建。这可能导致两类技术团队的分化:一类专注底层优化器开发(需机器学习与编译原理交叉背景),另一类专注业务签名设计与流水线集成。

开源生态的响应速度将成为关键变量。虽然LangChain凭借先发优势建立了庞大工具集成网络,但DSPy的模块化架构允许其通过适配器兼容现有组件。近期Hugging Face与DSPy的集成实验表明,开源社区正在积极弥合编排与优化范式间的鸿沟。

商业层面,DSPy可能催生新的工具市场:
1. 云编译服务:为DSPy程序提供分布式优化计算资源
2. 签名市场:针对垂直领域(法律、医疗)的预优化签名模板
3. 优化器即服务:将MIPRO等高级优化器封装为API

风险同样存在:编译过程可能引入不可预测的提示策略,在合规敏感场景需严格审计;优化器对计算资源的需求可能限制中小企业采用;框架仍处于快速迭代期,API稳定性挑战生产部署。

但长远观之,DSPy代表的编程优先范式正在重塑AI工程的价值链——当提示优化成为可自动化的编译步骤,开发者的核心价值将上移至问题建模、评估体系设计与道德约束机制构建。这不仅是工具迭代,更是智能系统开发范式的根本性进化。

更多来自 GitHub

无标题SimulationLogger.jl, created by developer jinraekim, is a Julia package designed to solve a persistent pain point in sciDifferentialEquations.jl:重塑科学计算的SciML引擎DifferentialEquations.jl 不仅仅是一个库,它代表了科学家和工程师处理动态系统模拟方式的范式转变。该套件完全用 Julia 构建,充分利用了该语言兼具高级表达力和接近 C 语言性能的独特优势。它提供了数量惊人的求解器—n8n 自托管指南:Docker、Kubernetes 与私有 AI 工作流的未来n8n-io/n8n-hosting 仓库本身并非一个产品,而是一个关键赋能者:它是一套精心策划的部署模板,大幅降低了企业在自有基础设施上运行 n8n 工作流自动化引擎的门槛。该仓库目前拥有 1599 颗 Star,且每日稳定增长,反映出行查看来源专题页GitHub 已收录 1727 篇文章

相关专题

prompt engineering67 篇相关文章

时间归档

March 20262347 篇已发布文章

延伸阅读

Mr. Ranedeer AI Tutor:一个提示词,统治所有个性化学习一个名为 Mr. Ranedeer AI Tutor 的 GPT-4 提示词,正以零代码门槛重塑个性化教育。它凭借精妙的提示工程,模拟出一套完整的教学系统,在 GitHub 上狂揽近 3 万星。AINews 深入拆解其机制、局限与市场冲击。提示词即代码:GPT-Image2 如何用工程化思维重塑AI艺术生成一个名为 freestylefly/awesome-gpt-image-2 的开源项目,正将提示词工程变成一门可编码、可模板化的严谨学科。凭借5012颗GitHub星标和370多个逆向工程案例,它承诺让高质量AI图像生成走向大众——但这是否Yao Open Prompts 重新定义中文AI提示工程标准中国AI生态长期缺乏标准化的高质量提示工程资源库。Yao Open Prompts 以社区驱动的方式填补了这一空白,为中文用户优化大语言模型交互提供了系统性方案。本文深入解析这一快速增长资源的技术价值与行业影响。GPT Image 2.0提示工程:每个开发者必备的开源武器库一个名为 'awesome-gpt-image-2-api-and-prompts' 的全新开源仓库正迅速崛起,成为OpenAI GPT Image 2.0 API的权威提示库。凭借超过12,400颗星标和每日激增的关注度,它承诺释放该模型

常见问题

GitHub 热点“DSPy Framework Signals End of Prompt Engineering Era with Programming-First AI Approach”主要讲了什么?

DSPy (Declarative Self-improving Programs) is not merely another prompting library but a fundamental rethinking of how to build systems with language models. Developed primarily by…

这个 GitHub 项目在“DSPy vs LangChain performance benchmarks 2024”上为什么会引发关注?

DSPy's architecture rests on two foundational abstractions: Signatures and Optimizers. A Signature is a declarative specification of a module's transformation, written as natural language input/output descriptions rather…

从“how to implement RAG with DSPy optimization”看,这个 GitHub 项目的热度表现如何?

当前相关 GitHub 项目总星标约为 33149,近一日增长约为 0,这说明它在开源社区具有较强讨论度和扩散能力。