技术深度解析
教皇的宣言虽非技术文档,却直指定义现代AI的架构与工程选择。其核心是对“优化思维”的批判——即倾向于将AI系统视为纯粹的效用函数,最大化准确率、参与度或吞吐量等指标,却无视人类代价。
对齐问题再审视
技术界长期纠结于“对齐问题”:如何确保AI系统符合人类价值观。梵蒂冈的介入将其重新定义为深刻的道德挑战,而非狭隘的工程难题。当前的对齐技术——基于人类反馈的强化学习、宪法AI和红队测试——大多是反应性的。它们试图在模型训练后修补有害行为。教皇的宣言要求从设计之初就采取主动的、价值驱动的构建方式。
以大型语言模型的架构为例。它们在海量人类文本语料上训练,这些语料不可避免地编码了偏见——种族、性别、文化、经济方面的偏见。宣言对“人类尊严”的强调,直接挑战了未经同意或补偿就抓取互联网数据的做法,而这是GPT-4、Claude和Llama等模型构建的核心环节。技术解决方案——差分隐私、联邦学习和基于同意的数据来源——已经存在,但很少被优先采用,因为它们会降低训练的规模和速度。
开源与闭源:道德维度
宣言含蓄地介入了开源辩论。虽然Meta的Llama 3和Mistral的Mixtral等开源模型实现了访问民主化,但它们也使执行伦理标准变得更加困难。一个集中的闭源模型可以被审计和监管;但上千个微调变体则无法做到。梵蒂冈对“全球团结”的呼吁,暗示了对透明、可审计系统的偏好——这些系统既不受单一企业控制,也不至于无法治理。这是一种微妙的立场,既不完全赞同某些AI研究者“一切开放”的精神,也不完全认同OpenAI和谷歌的“围墙花园”做法。
以人类尊严为基准
当前的基准测试衡量的是狭隘的认知技能。教皇的框架要求新的指标:跨人口群体的公平性、对就业的影响、环境成本以及对人类自主性的尊重。以下是根据公开的公平性审计和偏见报告,当前领先模型在标准基准测试与AINews构建的假设性“人类尊严指数”上的表现对比。
| 模型 | MMLU(准确率) | HumanEval(Pass@1) | 偏见分数(越低越好) | 环境成本(每次训练运行的tCO2e) | 预估HDI分数(1-10) |
|---|---|---|---|---|---|
| GPT-4o | 88.7 | 87.2 | 0.12 | ~5,000 | 6.5 |
| Claude 3.5 Sonnet | 88.3 | 84.6 | 0.09 | ~3,000 | 7.2 |
| Gemini Ultra 1.0 | 90.0 | 82.0 | 0.15 | ~10,000 | 5.8 |
| Llama 3 70B | 82.0 | 74.0 | 0.11 | ~1,500 | 6.0 |
| Mistral Large | 81.2 | 68.0 | 0.08 | ~1,000 | 7.0 |
数据要点: 原始性能最高的模型,往往具有更高的偏见分数和环境成本。Claude 3.5和Mistral Large虽然在纯基准测试上略逊一筹,但在HDI上得分更高。这表明,优化人类尊严可能需要接受小幅的性能折衷——这正是教皇宣言明确支持的一种权衡。
关键参与者与案例研究
该宣言直接牵涉到主要AI实验室及其领导者。这是对由Marc Andreessen等人以及OpenAI内部某些派系所倡导的“有效加速主义”运动的挑战,该运动主张AI开发应尽可能快地推进,不受监管阻碍。
OpenAI与利润动机的张力
OpenAI从非营利组织向利润上限实体的转变,正是教皇所指出的那种张力的典型案例。该公司的使命——“确保通用人工智能惠及全人类”——如今与其创收需求持续冲突。宣言含蓄地问道:一家营利性企业能否真正将人类尊严置于股东价值之上?近期OpenAI的董事会风波——据报道安全关切被商业利益否决——正是这一冲突的写照。
Google DeepMind与安全文化
DeepMind凭借其长期发布安全研究的传统,或许最接近梵蒂冈的愿景。其“宪法AI”方法将伦理原则硬编码到训练过程中,与宣言呼吁的主动价值对齐相吻合。然而,DeepMind现已完全整合进谷歌,而谷歌的主要收入来自广告——这是一个AI即将以可能不总是尊重用户自主性的方式加以变革的行业。
欧盟的监管路径
欧盟的《人工智能法案》试图建立基于风险的监管框架,这与教皇宣言中“共同利益”的呼吁有共鸣之处。但梵蒂冈的立场更为激进:它要求将人类尊严作为不可妥协的基线,而非仅仅是风险缓解策略。这可能会激励欧盟在最终文本中采取更强硬的立场,尤其是在禁止实时生物特征监控和情感识别系统方面。