技术深度解析
该系统的架构是一条混合管道,将知识图谱的结构化推理与大语言模型的对话流畅性融为一体。其基础是一个精心编纂的中医本体:241种证候(如肝气郁结、脾气虚),1263种症状(如舌淡、脉弦),以及2485条因果与关联关系。这个知识图谱并非扁平列表,而是一个有向图,其中节点代表临床实体,边则编码诸如“has_symptom”、“caused_by”和“treated_by”等关系。
推理过程分三个阶段展开。首先,LLM解析患者的自由文本描述,提取症状实体并将其映射到知识图谱上。其次,系统进入多轮对话循环:它识别出模糊或缺失的信息(例如,“疼痛是钝痛还是刺痛?”),并生成澄清性问题。每次患者回答都会更新活跃症状节点集,图遍历算法则通过评估路径权重与共现统计,计算出最可能的证候。LLM充当自然语言接口,而知识图谱提供逻辑骨架——这是一种经典的混合方法,可减轻纯LLM的幻觉倾向。
一旦证候被确认,系统便从知识图谱中检索治疗模板:方剂、穴位处方、饮食建议以及生活方式调整。这些内容以多模态输出呈现:文本解释、穴位位置的可视化示意图,以及显示预期恢复阶段的时间线图表。
一个与此方法平行的相关开源项目是TCM-KG(GitHub仓库:`tcm-kg/tcm-knowledge-graph`,约1.2k星标),它提供了中医实体的基础本体,但缺乏LLM集成与多轮对话能力。另一个是MedKG(GitHub仓库:`medical-knowledge-graph/MedKG`,约800星标),专注于西医。当前系统的创新之处在于通过实时交互循环桥接了这两个世界。
性能基准仍在涌现,但初步内部测试显示:
| 指标 | 数值 | 对比基线(纯LLM) |
|---|---|---|
| 证候准确率(top-3) | 87.3% | 72.1%(GPT-4o,零样本) |
| 诊断平均对话轮次 | 4.2 | 1(单次查询) |
| 患者满意度(1-5分) | 4.6 | 3.8 |
| 医生一致率 | 91.5% | 78.2% |
数据要点: 混合系统在证候准确率上比纯LLM基线高出15个百分点,尽管需要更多对话轮次。在诊断信心至关重要的临床环境中,效率与准确性之间的权衡是可以接受的。