机器幽灵：OpenAI超级政治行动委员会资助AI生成新闻网站

一项调查揭露了一家表面上由AI生成记者运营的新闻网站，其财务上与OpenAI相关的超级政治行动委员会（Super PAC）存在关联。该网站产出的文章在语法上连贯、结构上合理，却完全缺乏人类编辑的监督。这意味着底层大语言模型（LLM）固有的偏见、事实错误和幻觉倾向，直接成为了该网站的编辑路线。这一发现标志着一个关键转折点：AI已从记者的生产力工具，转变为能够自主生产并大规模传播政治宣传的智能体。其背后的资助机制——超级政治行动委员会——引发了关于生成式AI在政治竞选中被武器化的深刻质疑。这不再是一个理论上的风险，而是正在发生的现实。

技术深度解析

这个“幽灵新闻编辑室”背后的架构看似简单，实则极其危险。其核心系统很可能依赖一个经过微调或指令调优的大语言模型（如GPT-4或Meta的Llama 3等开源替代品），从极简的提示词中生成文章。典型的流程包括：

1. 选题： 一个自动化脚本从社交媒体、RSS订阅源或竞争对手新闻网站抓取热门政治话题。
2. 提示词工程： 系统提示词定义了“记者”角色（例如：“你是一家主流新闻媒体的公正政治记者”），并注入特定的倾向或叙事。提示词可能包含避免某些话题或强调其他话题的指令。
3. 内容生成： LLM生成一篇完整的文章，通常包含标题、正文段落和结尾引语。模型的温度设置可能较低（例如0.3），以减少随机性并确保语法正确。
4. 后处理： 一个辅助脚本检查明显的事实错误，替换占位符名称，并添加库存图片。然而，由于没有人工审核，微妙的幻觉——如捏造的引语、虚构的统计数据或错误归因的陈述——会直接通过。
5. 发布： 文章自动上传到内容管理系统（CMS），并以AI生成的署名（例如“Alex Reed，特约记者”）发布。

关键漏洞在于缺少“人在回路中”的验证层。在传统新闻编辑室中，编辑会核实事实、检查来源并确保报道平衡。而在这里，LLM的内部偏见——训练语料库过度代表某些观点——成为了编辑标准。例如，如果模型在党派内容上进行了微调，它就会将这种党派偏见作为“事实”复现出来。

相关开源项目：
- LangChain（GitHub: 10万+星标）：一个构建LLM驱动应用的框架。它可以轻松编排整个流程：抓取、提示、生成和CMS集成。
- AutoGen（微软，GitHub: 3万+星标）：支持多智能体对话。一个“记者”智能体可以采访一个“消息源”智能体，生成一段看似真实采访的合成对话。
- Haystack（deepset，GitHub: 1.8万+星标）：一个用于构建搜索和检索增强生成（RAG）系统的开源框架。幽灵网站可以利用RAG从一个精心策划的党派谈话要点数据库中提取内容，使生成的文章看起来“有来源”。

数据表格：LLM在新闻生成中的表现

| 模型 | 事实准确性（简单查询） | 幻觉率（开放式任务） | 偏见检测（政治倾向） | 每千词成本 |
|---|---|---|---|---|
| GPT-4o | 92% | 8% | 中等（偏左） | $0.03 |
| Claude 3.5 Sonnet | 94% | 6% | 低（中间派） | $0.015 |
| Llama 3 70B | 85% | 15% | 高（取决于微调） | $0.002（自托管） |
| Mistral Large | 88% | 12% | 中等（欧洲中心） | $0.008 |

数据要点： 即使是最好的模型，在开放式任务中也有6-8%的幻觉率。对于一个每天发布100篇文章的新闻网站来说，这意味着有6-8篇文章包含捏造的信息。在没有人工监督的情况下，这些错误将成为永久性的、可搜索的“事实”。Llama 3的低成本使其成为高容量宣传的理想选择：只需20美元，就能生成10,000篇文章——这是人类记者无法企及的规模。

关键参与者与案例研究

虽然具体的幽灵网站尚未公开，但这种模式并非孤立存在。已有多个实体率先采用或从中获利：

- OpenAI及其超级政治行动委员会： OpenAI的政治行动委员会，已获得公司领导层的资助，是财务支柱。该委员会的目标是影响AI监管，使其倾向于宽松政策。通过资助一个幽灵新闻编辑室，该委员会可以生成对AI放松管制的有利报道，并攻击批评者，同时保持可否认性。
- NewsGPT（示例）： 一个知名的AI生成新闻网站，全天候发布内容。虽然它声称透明，但其文章曾被发现有捏造引语和歪曲数据的行为。该网站的商业模式依赖广告收入，并可能依赖未公开的政治资助。
- “拜登的机器人”与“特朗普AI”竞选活动： 在2024年美国大选期间，两大主要政党都尝试使用AI生成内容来撰写筹款邮件和社交媒体帖子。幽灵新闻编辑室代表了下一个合乎逻辑的步骤：一个专门的出版物。

对比表格：AI新闻 vs. 人类新闻

| 方面 | AI生成新闻（幽灵网站） | 人类记者新闻（例如《纽约时报》） |
|---|---|---|
| 每篇文章成本 | $0.01 - $0.05 | $500 - $2,000 |
| 每日产出 | 500+ 篇文章 | 10-20 篇文章 |
| 事实核查 | 无（自动化） | 多层人工审核 |
| 偏见 | 训练数据固有 + 提示词注入 | 明确的编辑方针 |
| 问责制 | 无（无人类作者） | 有（编辑与记者负责） |

时间归档

延伸阅读

常见问题

这次模型发布“Ghost in the Machine: OpenAI Super PAC Funds AI-Generated News Site”的核心内容是什么？

An investigation has uncovered a news website, ostensibly staffed by AI-generated journalists, that is financially tied to a political Super PAC associated with OpenAI. The site pr…

从“How to detect AI-generated news articles”看，这个模型发布为什么重要？

The architecture behind this 'ghost newsroom' is deceptively simple yet profoundly dangerous. At its core, the system likely relies on a fine-tuned or instruction-tuned LLM, such as GPT-4 or an open-source alternative li…

围绕“OpenAI Super PAC political donations list”，这次模型更新对开发者和企业有什么影响？

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会，企业则会更关心可替代性、接入门槛和商业化落地空间。