技术深度解析
Council of High Intelligence的核心是一个构建在多个LLM API之上的复杂编排层。其架构可分解为三个关键组件:人格注册表、模型多样性调度器和审议引擎。
人格注册表: 18个人格中的每一个都由结构化的提示模板定义,包括:
- 原型: 高级角色(例如,亚里士多德的“哲学家”、费曼的“物理学家”、托瓦尔兹的“工程师”)
- 认知风格: 关于推理方法的指令(例如,“第一性原理”、“苏格拉底式提问”、“成本效益分析”)
- 知识库: 精心策划的领域特定参考资料(例如,亚里士多德的《尼各马可伦理学》、费曼的讲义、托瓦尔兹的Linux内核设计哲学)
- 偏见档案: 关于强调或弱化什么的明确指令(例如,“优先考虑经验证据”、“对权威持怀疑态度”、“专注于实际实施”)
模型多样性调度器: 这是该项目技术上最有趣的组件。调度器并非将所有人格路由到同一个LLM,而是基于兼容性矩阵将每个人格分配给特定提供商。例如:
- 亚里士多德 → GPT-4o(擅长结构化逻辑论证)
- 费曼 → Claude 3.5 Sonnet(擅长直观解释和隐喻)
- 卡尼曼 → Gemini Ultra(擅长概率推理和偏见检测)
- 托瓦尔兹 → Llama 3 70B(开源、务实、过滤较少)
调度器还实现了一种“轮换”机制:如果某个模型受到速率限制或输出质量低下,它会回退到次要模型。这确保了鲁棒性,但也引入了变异性——同一个人格可能因其路由的模型不同而表现不同。
审议引擎: 审议遵循结构化的多轮协议:
1. 第一轮(初始立场): 每个人格生成对用户查询的初始响应。
2. 第二轮(交叉质询): 每个人格会看到3-5个随机选择的其他人格的响应,并要求对其进行批评、识别缺陷或在此基础上构建。
3. 第三轮(综合): 一个“主持人”人格(元代理)总结辩论,突出共识点和分歧点,并生成最终的综合建议。
4. 可选第四轮(魔鬼代言人): 一个指定的“逆向思维”人格(例如,第欧根尼或尼采)对综合结论提出反驳。
性能指标: 虽然该项目尚未发布正式基准,但我们可以根据典型使用情况估算成本和延迟:
| 指标 | 估算值 | 备注 |
|--------|----------|-------|
| 每次会话的Token数 | 50,000–150,000 | 取决于查询复杂度和轮数 |
| 每次会话的API成本 | $1.50–$5.00 | 以GPT-4o为主,Claude为辅 |
| 每轮延迟 | 30–90秒 | 并行调用减少了总时间 |
| 成功率(连贯输出) | ~85% | 失败原因包括模型拒绝或角色不符的输出 |
数据要点: 每次会话的成本虽不菲,但与人类顾问的时薪相当。延迟对于异步决策是可接受的,但对于实时使用来说太慢。
GitHub仓库: 该项目可在`0xnyk/council-of-high-intelligence`获取(982颗星,日增280颗)。代码库基于Python,使用`asyncio`进行并发API调用,使用`pydantic`进行结构化输出验证。提示模板存储为YAML文件,便于自定义。
关键参与者与案例研究
该项目的创建者0xnyk是一位独立开发者,拥有多智能体系统和提示工程背景。该项目没有机构支持,这既是优势(敏捷、不受约束),也是劣势(扩展资源有限)。
竞争方法: Council of High Intelligence处于几种新兴趋势的交汇点:
| 方法 | 示例 | 关键区别 |
|----------|---------|----------------|
| 单模型角色扮演 | 带有自定义指令的ChatGPT | 无模型多样性;单一视角 |
| 多智能体框架 | AutoGen, CrewAI | 侧重于任务分解,而非审议 |
| 集成提示 | 混合专家模型(MoE) | 统计平均,而非结构化辩论 |
| 人在回路中 | Delphi, Moral Machine | 需要人类判断;速度较慢 |
数据要点: Council of High Intelligence在结合角色扮演、模型多样性和结构化辩论方面是独一无二的。目前没有其他开源项目提供这种精确的组合。
案例研究:企业战略决策
一位初创公司创始人使用该议会来决定是否从B2C转向B2B。各人格产生了一场细致的辩论:
- 史蒂夫·乔布斯(B2C倡导者): “专注于消费者愉悦,而非企业官僚主义。”
- 沃伦·巴菲特(B2B倡导者): “来自合同的经常性收入更”