滴滴安全算法揭秘:为何百万级误报是信任的代价

June 2026
归档:June 2026
在成都安全开放日上,滴滴出行首次向公众开放其网约车安全指挥中心,揭示了一套刻意优先召回率而非精准度的算法。该系统每日标记数百万订单,其中仅极小部分代表真实威胁,背后是庞大的GPU算力与4000多名人工审核员的支持。

2025年6月27日,滴滴出行在成都举办首届安全开放日,首次公开了支撑每日数千万网约车订单的安全基础设施。与通常优化准确率的推荐系统不同,滴滴的安全算法被设计为最大化召回率——刻意接受海量误报,以避免遗漏任何真实风险。经过多轮大语言模型筛查后,绝大多数被标记的订单最终被证实是安全的,真实威胁估计仅为数千分之一。为维持这种极端安全姿态,滴滴部署了庞大的GPU计算资源用于实时预筛查,并雇佣了超过4000名专职安全人员手动审核风险工单。这一策略揭示了科技行业中一个常被忽视的真相:在安全领域,计算成本是廉价的,而信任的代价极其昂贵。

技术深度解析

滴滴的安全算法代表了一种与主导多数AI讨论的推荐系统截然不同的设计哲学。推荐引擎可能追求95%的精确率——即每100条推荐中有95条相关——而滴滴的安全系统则运行在相反的极端。核心指标是召回率:系统成功捕获的真实阳性事件的比例。公司明确接受了在其他领域将是灾难性的精确率。

架构概览:

安全流水线包含三个主要阶段:
1. 实时特征提取: 每笔订单生成数百个特征——路线偏移、停留时间、速度异常、司机行为历史、乘客风险评分、时段、天气状况和实时交通数据。这些特征通过基于Apache Flink构建的分布式流处理框架实时计算,在高峰时段每秒处理超过10,000个事件。

2. 多模型集成筛查: 初始阶段使用轻量级梯度提升决策树(LightGBM)过滤掉明显安全的订单,将候选池减少约99%。剩余的约1%订单随后通过一系列深度神经网络,包括一个基于Transformer的模型,该模型分析过去30分钟驾驶的序列行为模式。最后,一个大语言模型(可能是经过微调的7B参数开源模型,如Qwen2.5-7B或专有变体)对应用内文本消息、语音通话转录和路线描述进行语义分析,以识别可疑模式。

3. 人在回路审核: 所有自动检查均通过的订单被升级给4000多名安全操作员。这些操作员有60秒时间通过一个仪表盘审查案例,该仪表盘显示司机档案、乘客历史、实时GPS轨迹以及LLM的推理摘要。他们可以清除订单、升级到专门团队或触发紧急协议。

误报经济学:

| 指标 | 数值 |
|---|---|
| 每日处理订单数 | ~3000万 |
| 初始过滤器标记的订单 | ~30万 (1%) |
| 通过LLM筛查的订单 | ~3万 (0.1%) |
| 升级至人工审核的订单 | ~3000 (0.01%) |
| 确认的高风险订单 | ~10-30 (0.00003% - 0.0001%) |
| 误报率(人工审核) | ~99.0% - 99.7% |

数据要点: 这些数字揭示了一个非凡的成本结构。每检测到一个真实风险,系统大约要处理1000个误报通过人工审核。按每次人工审核估计成本0.50美元(包括管理费用、福利和基础设施),每个真实风险的识别成本约为500美元——这还不包括GPU计算成本。这不是效率问题;这是一个刻意的设计选择。

GPU基础设施:

滴滴运营着一个专用的GPU集群用于安全处理,与其推荐和地图工作负载分开。消息来源显示该集群包括约2000块NVIDIA A100 GPU,并正在向H100单元迁移。仅LLM筛查每天就消耗估计15-20 petaflops的计算量。对于一个按设计会产生大部分误报的系统来说,这是一项巨大的投资。该公司已在GitHub上开源了其安全流水线的部分组件,仓库名为`didi/safety-engine`,已获得超过3200颗星,包括特征提取框架和一个匿名化安全事件的基准数据集。

要点: 滴滴的架构是将“纵深防御”应用于AI安全的教科书式案例。多阶段级联是必不可少的,因为没有任何单一模型能够同时实现所需的召回率和可接受的误报率。这种权衡是明确的:计算是廉价的,信任是昂贵的。

关键参与者与案例研究

滴滴并非唯一采用这种方法的公司,但其规模和透明度是独一无二的。与其他主要网约车平台的比较揭示了不同的理念:

| 公司 | 安全方法 | 人工审核员 | 误报容忍度 | 关键差异化因素 |
|---|---|---|---|---|
| 滴滴出行 | 极端召回优先,多阶段AI + 4000+人工 | 4000+ | 非常高(99%+误报) | 政府强制透明度,最大车队 |
| Uber | 风险评分模型,中等召回率;自动化安全功能如RideCheck | ~1500(估计) | 中等 | 更依赖应用内安全工具包和实时监控 |
| Lyft | 类似Uber,但更强调社区安全功能 | ~500(估计) | 低-中等 | 规模较小,允许每趟行程更多人工监督 |
| Grab(东南亚) | 混合方法,结合当地法规合规层 | ~2000(估计) | 高 | 必须处理8个国家多样化的监管环境 |

数据要点: 滴滴在人工审核员上的投资是其最接近竞争对手的2-3倍。

时间归档

June 20262878 篇已发布文章

延伸阅读

Vivo折叠屏的豪赌:AI原生设计能否击败OpenAI与字节跳动?Vivo正在重新定义折叠屏手机——它不再只是一块更大的屏幕,而是AI代理的物理化身。本文深度解析其技术架构、竞争格局与市场风险,探讨这一战略究竟是重塑智能手机的破局之举,还是一场代价高昂的弯路。YodaOS:Rokid 以 AI 原生操作系统重写智能眼镜规则Rokid 发布 YodaOS,这是首个为 AI 驱动的智能眼镜从零构建的操作系统。这并非渐进式更新,而是对眼镜如何感知、决策和交互的根本性重塑,推动行业摆脱“手机配件”的陷阱。Da Xiao Robotics Raises Hundreds of Millions: The Golden Triangle of State Capital, Auto, and Chip GiantsDa Xiao Robotics has secured hundreds of millions of dollars in an angel+ round just four months after its previous rais自进化智能体的皇帝新衣:一把无法被愚弄的标尺AI行业正狂热追逐自进化智能体,却始终缺少一把衡量真实进步的标尺。AINews推出GDPevo基准测试,通过量化外部验证的价值增长,揭开了炒作与真实能力之间的鸿沟。

常见问题

这次公司发布“Inside Didi's Safety Algorithm: Why Millions of False Positives Are the Price of Trust”主要讲了什么?

On June 27, 2025, Didi Chuxing held its inaugural Safety Open Day in Chengdu, pulling back the curtain on the safety infrastructure that underpins tens of millions of daily ride-ha…

从“Didi safety algorithm false positive rate”看,这家公司的这次发布为什么值得关注?

Didi's safety algorithm represents a fundamentally different design philosophy from the recommendation systems that dominate most AI discourse. While a recommendation engine might aim for 95% precision — meaning 95 out o…

围绕“Didi safety open day 2025 Chengdu”,这次发布可能带来哪些后续影响?

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。