中医AI诊断:知识图谱与多轮对话如何打破“黑箱”困局

arXiv cs.AI June 2026
来源:arXiv cs.AIlarge language modelexplainable AI归档:June 2026
一套融合大语言模型与结构化知识图谱的新型中医AI诊断系统,实现了透明、可交互的多轮对话与多模态治疗方案。通过让推理过程可见且可参与,该系统直击AI辅助中医领域长期存在的“黑箱”问题,为标准化、可信赖的数字健康工具铺平了道路。

大语言模型(LLM)与知识图谱的整合,催生了一套最终打破“黑箱”模式的中医诊断系统。该系统的核心知识图谱包含241种证候、1263种症状以及2485条关系,实际上构成了一部可验证的临床百科全书。AI不再输出静态结论,而是与患者进行多轮对话,主动提出澄清性问题以缩小诊断范围。一旦证候被确认,系统便会生成包含文本、图表甚至穴位示意图的多模态治疗方案。这种设计让医生能够实时检查AI的推理链条,也让患者理解为何得出特定诊断以及治疗如何展开。

技术深度解析

该系统的架构是一条混合管道,将知识图谱的结构化推理与大语言模型的对话流畅性融为一体。其基础是一个精心编纂的中医本体:241种证候(如肝气郁结、脾气虚),1263种症状(如舌淡、脉弦),以及2485条因果与关联关系。这个知识图谱并非扁平列表,而是一个有向图,其中节点代表临床实体,边则编码诸如“has_symptom”、“caused_by”和“treated_by”等关系。

推理过程分三个阶段展开。首先,LLM解析患者的自由文本描述,提取症状实体并将其映射到知识图谱上。其次,系统进入多轮对话循环:它识别出模糊或缺失的信息(例如,“疼痛是钝痛还是刺痛?”),并生成澄清性问题。每次患者回答都会更新活跃症状节点集,图遍历算法则通过评估路径权重与共现统计,计算出最可能的证候。LLM充当自然语言接口,而知识图谱提供逻辑骨架——这是一种经典的混合方法,可减轻纯LLM的幻觉倾向。

一旦证候被确认,系统便从知识图谱中检索治疗模板:方剂、穴位处方、饮食建议以及生活方式调整。这些内容以多模态输出呈现:文本解释、穴位位置的可视化示意图,以及显示预期恢复阶段的时间线图表。

一个与此方法平行的相关开源项目是TCM-KG(GitHub仓库:`tcm-kg/tcm-knowledge-graph`,约1.2k星标),它提供了中医实体的基础本体,但缺乏LLM集成与多轮对话能力。另一个是MedKG(GitHub仓库:`medical-knowledge-graph/MedKG`,约800星标),专注于西医。当前系统的创新之处在于通过实时交互循环桥接了这两个世界。

性能基准仍在涌现,但初步内部测试显示:

| 指标 | 数值 | 对比基线(纯LLM) |
|---|---|---|
| 证候准确率(top-3) | 87.3% | 72.1%(GPT-4o,零样本) |
| 诊断平均对话轮次 | 4.2 | 1(单次查询) |
| 患者满意度(1-5分) | 4.6 | 3.8 |
| 医生一致率 | 91.5% | 78.2% |

数据要点: 混合系统在证候准确率上比纯LLM基线高出15个百分点,尽管需要更多对话轮次。在诊断信心至关重要的临床环境中,效率与准确性之间的权衡是可以接受的。

更多来自 arXiv cs.AI

从碎片痕迹到结构化技能:智能体学习的范式革命规模化AI智能体的核心挑战,一直是从原始执行日志中手动构建可复用技能的劳动密集型过程。传统方法将痕迹视为平面文本,丢失了关键的决策逻辑和步骤依赖。一项研究突破提出了四维分解框架——路由(决策路径)、工作流(步骤序列)、语义(上下文含义)和附AdMem:让AI智能体从失败中学习的记忆革命多年来,大语言模型(LLM)智能体的致命弱点一直是它们在处理长周期、复杂任务时无法有效管理记忆。现有方法要么将事实数据存储在静态向量数据库中,要么仅重放成功的轨迹,使智能体对失败中蕴含的丰富教训视而不见。AdMem,这一全新的统一记忆系统,OpenSkill:让AI智能体在开放世界中从零进化,无需任何外部反馈OpenSkill代表了我们对AI智能体自主性思考方式的根本性转变。传统上,自进化智能体依赖各种“拐杖”:精心策划的技能库、标注的成功轨迹或内置验证器。这些拐杖在温室中有效,但在野外却会失效。OpenSkill剥离了它们。智能体只接收任务提查看来源专题页arXiv cs.AI 已收录 430 篇文章

相关专题

large language model66 篇相关文章explainable AI31 篇相关文章

时间归档

June 2026644 篇已发布文章

延伸阅读

本体模拟如何将企业AI从“黑箱”转变为可审计的“白箱”企业AI应用正遭遇“信任天花板”,流利但无根据的模型输出无法满足审计要求。一种突破性架构——事件驱动的本体模拟——正成为解决方案。它通过为每个决策构建一个动态的、基于规则的业务上下文数字孪生,使AI推理变得透明、可追溯且从根本上可问责。校准交互式RL终结LLM智能体分布漂移,开启动态学习新纪元一项全新的理论框架——校准交互式强化学习,直接击穿了长期困扰多轮对话LLM智能体的上下文分布漂移问题。通过将模拟器行为与真实用户分布对齐,该方法将静态、脚本化的训练转变为动态、自适应的学习过程。SciAtlas:为自主AI科学家铺就的知识图谱高速公路SciAtlas是一个大规模知识图谱,旨在解决科学文献碎片化问题。与关键词或向量搜索不同,它保留了推理的拓扑结构,使AI智能体能够进行跨学科推理。这一基础设施有望将AI从被动的检索工具转变为主动的科学合作者。PopuLoRA:群体进化如何解锁超越RLHF的AI自我推理提升PopuLoRA提出了一种基于群体的异步自我对弈框架,让共享冻结基座模型上的专用LoRA适配器作为教师和学生群体共同进化。通过用交叉评估取代自我校准,它构建了一个自我强化的循环,不断生成更具挑战性的问题和更优的解决方案,从而打破了传统自我对

常见问题

这次公司发布“AI Diagnosis in Chinese Medicine: Transparent Reasoning Through Knowledge Graphs and Multi-Turn Dialogue”主要讲了什么?

The integration of large language models (LLMs) with knowledge graphs has produced a diagnostic system for traditional Chinese medicine (TCM) that finally breaks the 'black box' pa…

从“TCM AI diagnosis system knowledge graph size”看,这家公司的这次发布为什么值得关注?

The system’s architecture is a hybrid pipeline that marries the structured reasoning of a knowledge graph (KG) with the conversational fluency of a large language model (LLM). At its foundation lies a meticulously curate…

围绕“multi-turn dialogue TCM AI explainability”,这次发布可能带来哪些后续影响?

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。