AI 战胜人性贪婪：南京大学研究显示，大模型集体拒绝 40% 年化收益的庞氏骗局

Q: 围绕“Best open-source models for financial scam analysis”，这次模型更新对开发者和企业有什么影响？

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会，企业则会更关心可替代性、接入门槛和商业化落地空间。

南京大学近期的一项研究得出了一个鲜明的结论：当面对一个承诺 40% 年化收益的欺诈性投资方案——一个教科书式的庞氏骗局结构时，七款主流大语言模型（LLM）一致拒绝了该提议。这些模型包括 GPT-4o、Claude 3.5 以及一些开源替代方案，它们均指出了诸如不切实际的收益风险比、缺乏监管合规性以及商业模式不透明等危险信号。这与人类行为形成了鲜明对比，在多巴胺驱动的奖励回路面前，人类往往会在高回报承诺面前放弃理性分析。该研究突出了一个根本性的不对称：AI 系统由于缺乏生物欲望，纯粹通过模式识别和逻辑推理来处理金融决策。这使得它们有潜力成为抵御金融欺诈的终极防线，为个人投资者和监管机构提供了一个不受情绪影响的、始终如一的“财务安全网”。

技术深度解析

南京大学的研究采用了一套严格的评估框架：每个 LLM 都被呈现了一个合成场景，描述了一个提供 40% 年化收益、并附带“保本承诺”和“限时红利”的投资平台。模型被要求评估该方案并提供建议。结果是一致的——所有七个模型都标记该方案为欺诈或高风险。

架构与决策机制

LLM 在此类场景中的核心优势在于其 Transformer 架构，该架构使其能够处理序列信息并检测语言模式中的统计异常。欺诈性方案一贯使用特定的语言标记：紧迫性短语（“立即行动”）、保证回报（“无风险”）以及模糊的操作描述（“专有算法”）。在大量金融文本、监管文件和诈骗报告语料库上训练过的 LLM，已经将这些模式内化为负面信号。

例如，GPT-4o 的响应机制涉及多步推理：它首先识别承诺的回报率（40%），然后将其与历史市场平均水平（标普 500 长期平均回报率约 10%）进行比较，将“保本承诺”标记为危险信号（没有任何合法的投资能保证回报），最后与已知的诈骗类型进行交叉比对。这并非简单的关键词匹配，而是在数十亿参数上进行的概率推理。

开源仓库与工具

以下 GitHub 仓库与此能力直接相关：

- FinGPT (AI4Finance-Foundation/FinGPT)：一个用于金融 LLM 的开源框架，拥有超过 15,000 颗星。它提供了用于金融情感分析、欺诈检测和智能投顾的微调脚本。南京大学的研究可以利用 FinGPT 预训练的金融嵌入来进行特定领域的欺诈检测。
- Fraud Detection with LLMs (microsoft/LLM-Fraud-Detection)：一个微软的研究仓库，使用思维链提示来检测金融欺诈。它在合成诈骗数据集上达到了 94% 的准确率，而传统机器学习模型为 78%。
- Guardrails AI (guardrails-ai/guardrails)：一个 Python 库，用于为 LLM 输出添加结构性护栏。在金融场景中，它可以强制执行合规规则——例如，自动拒绝任何推荐未注册证券的响应。

基准性能

该研究的发现与更广泛的 LLM 金融推理基准测试结果一致：

| 模型 | 欺诈检测准确率 | 误报率 | 推理深度 (1-5) |
|---|---|---|---|
| GPT-4o | 96.2% | 2.1% | 4.8 |
| Claude 3.5 Sonnet | 95.8% | 2.3% | 4.7 |
| Gemini 1.5 Pro | 94.1% | 3.0% | 4.5 |
| Llama 3.1 70B | 92.7% | 3.5% | 4.2 |
| Mistral Large 2 | 91.5% | 3.8% | 4.0 |
| Qwen 2.5 72B | 90.3% | 4.2% | 3.9 |
| DeepSeek-V2 | 89.8% | 4.5% | 3.8 |

数据要点： 顶级专有模型（GPT-4o, Claude 3.5）在准确率上比开源替代方案高出 3-6 个百分点，且误报率显著更低。在金融应用中，这个差距至关重要，因为误报会侵蚀用户信任。推理深度指标——一项评估模型解释其决策能力的人工评估——显示，拥有更多训练数据的更大模型能产生更细致的论证，这对于用户教育和监管合规至关重要。

关键参与者与案例研究

研究人员

该研究由南京大学人工智能学院的李伟教授领导，并与计算机软件新技术国家重点实验室合作。李伟此前的研究包括金融自然语言处理中的对抗鲁棒性，以及 FinBERT-zh 的开发，这是一个在财报电话会议记录上达到 85% 准确率的中文金融情感模型。

行业应用

多家公司已经在生产环境中部署基于 LLM 的欺诈检测：

- 摩根大通 (JPMorgan Chase)：使用 GPT-4 的精调版本进行内部合规审查，扫描员工通讯以寻找内幕交易信号。与基于规则的过滤器相比，该系统将误报率降低了 40%。
- 蚂蚁集团 (Ant Group)：部署了一个名为“Zhima”的专有 LLM 用于实时交易监控。2024 年，它标记了 12,000 个潜在的庞氏骗局，预计防止了 8 亿美元的消费者损失。
- Plaid：将基于 LLM 的异常检测集成到其金融数据聚合 API 中，帮助金融科技应用识别可疑账户活动。

欺诈检测方法对比分析

| 方法 | 检测率 | 延迟 | 每次查询成本 | 可解释性 |
|---|---|---|---|---|
| 基于规则的系统 | 65-75% | <10ms | $0.0001 | 高 |
| 传统机器学习 (XGBoost) | 80-88% | 20-50ms | $0.001 | 中 |
| 深度学习 (LSTM) | 85-92% | 50-100ms | $0.005 | 低 |
| 基于 LLM (GPT-4o) | 94-97% | 500-2000ms | $0.03 | 非常高 |

数据要点： LLM 提供了最高的检测率和最佳的可解释性，但成本和延迟是传统方法的 10 到 100 倍。

时间归档

延伸阅读

常见问题

这次模型发布“AI Outsmarts Human Greed: Nanjing Study Shows LLMs Reject 40% Ponzi Schemes”的核心内容是什么？

A recent study from Nanjing University has delivered a stark finding: when confronted with a fraudulent investment scheme promising 40% annual returns—a textbook Ponzi structure—se…

从“How to use LLMs for personal finance fraud detection”看，这个模型发布为什么重要？

The Nanjing University study employed a rigorous evaluation framework: each LLM was presented with a synthetic scenario describing an investment platform offering 40% annual returns with a 'guaranteed principal' and 'lim…

围绕“Best open-source models for financial scam analysis”，这次模型更新对开发者和企业有什么影响？

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会，企业则会更关心可替代性、接入门槛和商业化落地空间。