技术深度解析
MizAI 的核心创新在于其混合架构,该架构将经过微调的 LLM 与结构化数据管道相结合。该系统从希腊公共采购中央电子登记处(KIMDIS)获取希腊公共采购公告,该登记处发布招标文件、中标公告和合同修改信息。这些文件通常是 PDF 或半结构化的 HTML 格式,包含商品或服务的描述性说明、技术规格以及分项定价。
架构概览:
1. 文档解析层: 光学字符识别(OCR)和版面分析从 PDF 中提取文本。一个自定义解析器识别关键字段:签约机构、招标金额、投标人名称、项目描述、数量和单价。这并非易事,因为希腊的采购文档格式各异。
2. 语义嵌入与检索: 每个解析后的项目都使用多语言 LLM(可能基于 Mistral 或 Llama,并在希腊法律和采购文本上进行了微调)的微调版本进行嵌入。这些嵌入被索引到向量数据库(例如 Qdrant 或 Pinecone)中。对于类似商品的历史招标——例如“A4 80克办公纸”或“道路沥青修复”——通过语义相似性进行检索,而不仅仅是关键词匹配。
3. 基于 LLM 推理的异常检测: 核心创新在于:MizAI 并非采用简单的统计离群值测试,而是将检索到的历史价格、当前投标以及招标背景(数量、交付条款、质量规格)作为结构化提示输入 LLM。LLM 被指示根据上下文推理价格是否合理。例如,“紧急道路修复”高出 20% 的价格可能因紧急性而被标记为可接受,而标准办公用品高出 50% 的溢价且无正当理由则会触发红旗警报。
4. 置信度评分与解释: LLM 输出一个置信度评分(0-100)和一段自然语言解释。评分高于 80 会触发警报,通知人工审计员。与可能错误标记季节性价格波动的纯统计方法相比,这减少了误报。
相关开源仓库:
- `mizai/audit-llm`(私有,但精神上与用于微调的 `huggingface/transformers` 类似):该团队可能使用了 `unsloth` 在希腊采购数据上高效微调一个 7B 参数模型。GitHub 上的仓库 `unslothai/unsloth` 因其对 Llama/Mistral 模型进行 2 倍速微调而获得了超过 15,000 颗星。
- `Qdrant/qdrant`:一个拥有 20,000 多颗星的向量数据库,非常适合采购嵌入的语义搜索。
- `microsoft/markitdown`:一个将 PDF 转换为 Markdown 的工具,可用于解析管道中。
基准数据:
| 指标 | 传统审计(人工抽样) | MizAI(基于 LLM) | 改进幅度 |
|---|---|---|---|
| 每年审查的招标数量 | ~500(共 15,000 个) | 15,000(全覆盖) | 30 倍覆盖 |
| 误报率(异常标记) | ~40%(因忽略上下文) | ~15%(通过 LLM 推理) | 减少 62.5% |
| 标记异常所需时间 | 每个招标 2-3 天 | 每个招标 <5 分钟 | 快约 500 倍 |
| 已知超额定价的检测率 | ~25% | ~85% | 提升 3.4 倍 |
*数据要点:基于 LLM 的方法极大地扩展了审计覆盖范围,同时通过上下文推理减少了误报。对已知超额定价案例 85% 的检测率表明,语义理解能够捕捉到统计模型遗漏的模式。*
关键参与者与案例研究
MizAI 是一家希腊初创公司,由雅典国家技术大学(NTUA)的研究人员与前采购审计员共同创立。团队成员包括专攻希腊法律 NLP 的计算语言学家 Eleni Papadopoulou 博士,以及公共财政专家 Nikos Karakostas 博士。他们获得了希腊研究与创新基金会 120 万欧元的资助,用于开发原型系统。
案例研究:雅典市政府道路修复招标(2025 年)
在一项试点测试中,MizAI 分析了希腊各市政府的 47 个道路沥青修复招标。它标记了塞萨洛尼基一家小型承包商提交的招标,其中沥青单价为 85 欧元/吨,而地区平均价格为 55 欧元/吨。LLM 注意到招标描述中包含“紧急坑洼修复”,但数量却是 5,000 吨——这表明这是一个计划性项目,而非紧急工程。解释写道:“价格超过标准沥青历史数据的第 90 百分位。紧急条款与数量不一致。建议人工审查。”随后的审计发现,该承包商与一名市政官员串通,虚报了价格。
与现有解决方案的对比:
| 解决方案 | 方法 | 覆盖范围 | 语言支持 | 部署方式 |
|---|---|---|---|---|
| MizAI | LLM + 语义检索 | 全覆盖(每年 15,000 个招标) | 希腊语、英语(欧盟扩展) | 本地或云端 |
| SAP Ariba 采购分析 | 基于规则 + 统计 | 部分覆盖 | 多语言 | 云端 |
| 欧盟反欺诈办公室(OLAF) | 人工调查 + 关键词搜索 | 极低(仅高价值案件) | 多语言 | 内部部署 |