微软推出Prompty框架：为企业AI工程化LLM提示词制定标准

Prompty是微软在战略层面推动大语言模型提示词工程走向规范化与工业化的重要举措。其核心是定义了一种全新的文件格式（.prompty），将提示文本、元数据、参数、样本数据及评估标准封装成一个单一、可移植的资产。此举直接针对当前困扰AI开发团队的普遍问题：提示词泛滥、缺乏版本控制，以及提示词调试的黑盒状态。该框架同时提供了命令行界面与Python SDK，使开发者能够以编程方式创建、验证、运行和评估提示词。其关键创新在于将“提示词评估视为一等公民”，内置工具支持规模化测试与监控。通过引入声明式规范，Prompty将提示词从代码中脆弱的字符串转变为可配置、自文档化的工件，为团队协作、审计追踪和生产部署奠定了坚实基础。这标志着提示词管理正从早期的手工作坊模式，迈向具备工程严谨性的新阶段。

技术深度解析

Prompty的架构优雅简洁且强大，围绕声明式提示词规范这一核心理念构建。一个`.prompty`文件是一个YAML或JSON文档，包含以下几个关键部分：

* `schema`：定义Prompty规范的版本。
* `metadata`：包含作者、版本和描述字段。
* `model`：指定LLM配置（例如`azure_openai/gpt-4`，以及`temperature`、`max_tokens`等配置参数）。
* `inputs`：声明在运行时将注入提示词模板的变量。
* `template`：核心提示文本，使用模板语法（如`{{input_variable}}`）来定义动态部分。
* `sample`：可选的样本输入/输出对，用于测试和文档记录。
* `evaluation`：（计划中/实验性）用于自动化评估指标和测试套件的配置。

这种结构将提示词从代码中脆弱的字符串转变为可配置、自文档化的工件。随附的SDK提供了一个`Prompty`类，用于加载此文件、解析其输入，并针对指定的LLM执行，返回一个结构化的响应对象，其中包含发送的原始提示词、补全结果、令牌使用情况和延迟。

对于调试和评估，CLI工具`prompty`至关重要。诸如`prompty eval`等命令允许开发者针对数据集文件（CSV/JSON）运行提示词并输出指标。这使得能够大规模地对不同提示词版本或模型参数进行A/B测试。尽管仍处于早期阶段，该框架的设计暗示了未来将与Azure原生监控和MLOps管道集成，使得提示词能够与模型性能及漂移情况一同被追踪。

可以将其与斯坦福NLP的`dspy`框架进行相关比较。`dspy`采用了一种更具编程性、基于编译器的方法来优化提示词，它将提示词视为更大管道内的可调参数，并能针对给定任务自动生成和选择高性能提示词。相比之下，Prompty更侧重于*人工设计*提示词的管理、可移植性和操作可观测性。它们解决了问题的不同层面：`dspy`自动化提示词创建；Prompty标准化其生命周期。

| 对比维度 | Microsoft Prompty | DSPy (Stanford NLP) | LangChain PromptTemplate |
|------------|-----------------------|--------------------------|------------------------------|
| 核心理念 | 提示词即版本化资产 | 提示词即可调参数 | 提示词即链中的实用工具 |
| 主要优势 | 生命周期管理、可观测性、可移植性 | 自动化优化与组合 | 快速原型构建与集成 |
| 评估重点 | 使用可配置指标进行批量测试 | 端到端管道指标优化 | 内置评估功能极少 |
| 集成目标 | Azure AI生态系统 / 任何LLM API | 多框架（常与LMQL结合） | 广泛的模型/提供商支持 |
| 学习曲线 | 低至中等 | 高（需理解签名、优化器等概念） | 低 |

核心洞察： 上表揭示了提示词工程工具市场正在形成的细分格局。Prompty开辟了一个专注于治理和操作严谨性的独特利基市场，这与`dspy`的研究导向自动化以及LangChain的开发者友好链式构建形成对比。这表明企业可能会采用组合技术栈：使用LangChain进行原型设计，使用`dspy`优化关键组件，并使用Prompty对最终提示词进行版本控制、部署和监控。

关键参与者与案例研究

Prompty的发布标志着微软意图掌控生成式AI应用开发的企业工具层。它是对现有Azure AI服务的补充，例如Azure OpenAI Service、Azure AI Studio（用于模型评估和负责任AI仪表板）以及Azure Machine Learning。其逻辑终态是实现一个无缝的工作流：数据科学家在笔记本中构建提示词原型，将其打包为`.prompty`文件，在AI Studio中根据业务指标进行评估，在Git中进行版本控制，并将其部署到具有内置监控的生产端点——所有这一切都在Azure生态系统内完成。

微软内部的关键人物，如Azure AI平台企业副总裁John Montgomery，一直强调开发者工具和负责任AI的重要性。Prompty通过使提示词更加透明和可审计来践行这一愿景，这是实施治理控制的前提条件。

从竞争角度看，Prompty进入了一个已有多个成熟和新兴参与者的领域。LangChain和LlamaIndex是构建LLM应用的主导框架，两者都有各自的提示词管理抽象。然而，这些抽象通常与其各自的链式构建和检索范式紧密耦合。Prompty的无关框架性——它可以在这些框架内部、旁边或完全独立使用——是一个战略优势。它允许企业标准化提示词管理，而不必完全绑定到特定的应用框架上，为混合环境和企业治理需求提供了灵活性。

时间归档

延伸阅读

常见问题

GitHub 热点“Microsoft's Prompty Framework Standardizes LLM Prompt Engineering for Enterprise AI”主要讲了什么？

Prompty represents Microsoft's strategic move to formalize and industrialize the practice of prompt engineering for large language models. At its core, Prompty defines a new file f…

这个 GitHub 项目在“microsoft prompty vs langchain prompt template”上为什么会引发关注？

Prompty's architecture is elegantly simple yet powerful, built around the concept of a declarative prompt specification. A .prompty file is a YAML or JSON document structured into several key sections: schema: Defines th…

从“how to evaluate LLM prompts with prompty cli”看，这个 GitHub 项目的热度表现如何？

当前相关 GitHub 项目总星标约为 1172，近一日增长约为 0，这说明它在开源社区具有较强讨论度和扩散能力。