技术深度解析
讯飞和光系统的核心创新不在于构建一个新的基础模型,而在于设计了一条多模态管道,弥合了人类观察与机器学习之间的鸿沟。该系统接收三个主要数据流:来自圈舍摄像头的视频流、猪只叫声的音频记录,以及结构化的养殖日志(投喂时间、用药记录、体重数据)。
架构: LLM充当中央推理引擎。它并不直接处理原始像素或音频波形。相反,专门的计算机视觉和音频模型将数据预处理为符号表征。例如,一个视觉模型检测特定姿态(如弓背、垂耳、离群),并输出类似“pig_123: posture_arched_back, location_corner, duration_15min”的文本字符串。同样,音频模型将咳嗽、咕噜声和尖叫声分类为“cough_dry”或“grunt_stress”等类别。这些文本字符串连同养殖日志,作为结构化提示输入LLM。
LLM的角色是应用“翻译后”的专家规则。该团队在来自资深农户的数千个标注场景的专有数据集上,对科大讯飞的Spark模型(星火大模型)进行了微调。例如,农户的一条规则“如果一头猪离群躺卧且眼神呆滞,请在6小时内检查是否发烧”,会被转化为LLM可以执行的条件逻辑链。然后模型输出一条建议:“Pig_123:早期呼吸道感染高概率。操作:隔离并测量体温。建议用药:阿莫西林10mg/kg。”
反馈循环: 系统的学习机制至关重要。当农户接受或否决AI的建议时,该操作会被记录。LLM随后会使用来自人类反馈的强化学习(RLHF)定期(每2-4周)进行重新训练,但针对该领域进行了适配。奖励信号不仅是用户的接受度,还包括下游结果——这头猪康复了吗?饲料转化率是否更优?这创建了一个闭环系统,模型的“直觉”会随时间推移不断改进。
相关开源元素: 尽管讯飞和光使用专有模型,但其底层方法借鉴了开源工作。LLaVA(Large Language and Vision Assistant)架构将视觉编码器与语言模型连接起来,在概念上与之相似。OpenPose代码库(GitHub上超过40k星标)提供实时多人关键点检测,可适用于猪只姿态分析。OpenAI的Whisper模型虽然未被直接使用,但代表了音频转录领域的最新水平,可适用于猪只叫声分类。
| 基准指标 | 传统传感器系统 | 讯飞和光LLM系统 | 改进幅度 |
|---|---|---|---|
| 疾病检测提前时间 | 症状出现后24-48小时 | 症状出现前6-12小时 | 提前约75% |
| 饲料转化率(FCR) | 2.8 : 1 | 2.5 : 1 | 提升10.7% |
| 死亡率(断奶至出栏) | 8% | 6.5% | 降低18.75% |
| 需要人类专家干预 | 每天 | 每周一次 | 减少85% |
数据要点: 最引人注目的指标是疾病检测提前时间。通过将农户“发现细微迹象”的能力转化为可量化的症状前指标,该系统为干预争取了关键数小时。10.7%的FCR改善虽然在百分比上较小,但考虑到饲料占养猪场运营成本的60-70%,其经济影响巨大。
主要参与者与案例研究
讯飞和光是科大讯飞与一支农业AI研究人员团队成立的合资企业。科大讯飞带来了其在语音和语言AI方面的核心竞争力,而和光团队则贡献了在畜牧领域的深厚领域知识。他们的策略明确不是构建通用AI,而是为畜牧业创建一个“垂直LLM”。他们已在中国主要猪肉产区四川省和河南省的三个大型养殖场部署了试点项目。
该系统以SaaS订阅形式销售(根据养殖场规模,每年每场5万至10万元人民币),包括AI模型、云基础设施和供农户使用的移动应用。这有意区别于竞争对手如京东的京东农业和阿里的ET农业大脑那种偏重硬件的做法,后者历来聚焦于IoT传感器网络、自动投喂机器人和无人机监测。那些系统前期成本高达数百万元,在中小型养殖场中普及缓慢。
| 竞争对手 | 方法 | 前期成本 | 年度SaaS费用 | 目标客户 | 主要局限 |
|---|---|---|---|---|---|
| 讯飞和光 | LLM + SaaS | ¥0(基于云) | ¥5万-10万 | 中小型养殖场 | 依赖农户输入质量 |
| 京东农业 | IoT + 机器人 | ¥200万-500万 | ¥20万-50万 | 大型工业化养殖场 | 高资本支出,维护复杂 |