Litmus:重塑Kubernetes韧性的开源混沌工程平台

GitHub June 2026
⭐ 5465
来源:GitHub归档:June 2026
Litmus正以声明式、开源的方式重新定义SRE与开发者测试Kubernetes韧性的范式。其ChaosHub、基于CRD的故障注入机制以及深度可观测性集成,使其成为云原生可靠性领域的关键工具。

Litmus托管于github.com/litmuschaos/litmus,拥有超过5400颗星,是一款专为Kubernetes环境设计的开源混沌工程平台。它使SRE和开发者能够向集群中注入受控故障——如Pod终止、网络延迟、CPU飙升和磁盘压力——以验证系统韧性。该平台的核心创新在于其声明式方法:混沌实验被定义为Kubernetes自定义资源定义(CRD),从而支持版本控制并与CI/CD流水线集成。ChaosHub(hub.litmuschaos.io)作为预构建实验的公共注册中心,而Litmus Portal则提供用于调度、监控和分析混沌工作流的Web界面。Litmus与Prometheus、Grafana及其他可观测性工具深度集成,为云原生系统的可靠性验证提供了端到端的解决方案。

技术深度解析

Litmus构建于模块化架构之上,将控制平面与执行平面分离。控制平面由Litmus Portal(基于React的Web UI)和后端服务组成,负责管理项目、用户和混沌工作流。执行平面则由混沌算子(Chaos Operators)、混沌实验(以CRD形式存在)和混沌执行器(Chaos Runners,即执行实验的Pod)构成。

Litmus的核心是混沌算子,一个Kubernetes算子,它监视`ChaosEngine` CRD实例。当`ChaosEngine`被创建时,算子会生成一个`ChaosRunner` Pod,执行`ChaosExperiment` CRD中定义的特定实验。这种设计允许通过`kubectl apply`以声明式方式管理实验,从而支持GitOps工作流。

混沌实验被打包为Docker容器,内含基于Go的执行引擎。每个实验遵循一个生命周期:预检查(例如应用健康检查)、注入(例如终止一个Pod)、后检查(例如验证恢复)和回滚。实验存储在ChaosHub中,这是一个基于Git的注册中心,支持版本控制和社区贡献。用户可以Fork ChaosHub仓库(github.com/litmuschaos/chaos-charts)来自定义实验。

可观测性集成是一个关键差异化优势。Litmus通过Prometheus端点暴露指标,并能在Grafana中触发告警。`ChaosResult` CRD记录实验结果,包括通过/失败状态和持续时间。为了深度分析,Litmus支持与OpenTelemetry集成,用于分布式追踪。

来自社区的性能基准测试显示,Litmus可以在一个10节点集群上处理多达100个并发实验,而不会产生显著开销。Pod终止的平均实验执行时间低于10秒,而网络延迟注入大约需要15秒。

| 指标 | Litmus 2.x | Chaos Mesh 2.x | Gremlin (SaaS) |
|---|---|---|---|
| 实验类型 | 100+(社区) | 30+ | 50+ |
| 基于CRD | 是 | 是 | 否(基于API) |
| 开源 | 是 | 是 | 否 |
| Kubernetes原生 | 是 | 是 | 部分 |
| CI/CD集成 | 原生(Argo, Jenkins) | 原生 | 基于API |
| 可观测性 | Prometheus, Grafana, OTEL | Prometheus, Grafana | 内置仪表盘 |
| 社区星标 | 5,465 | 6,800 | 不适用 |

数据洞察: Litmus提供了最广泛的社区贡献实验库(100+),相比之下Chaos Mesh只有30+,这使得Litmus在应对多样化故障场景时更加灵活。然而,Chaos Mesh拥有更大的GitHub社区(6,800星标),显示出强劲的开发者兴趣。Litmus的CRD原生设计使其在GitOps工作流中更具优势。

关键玩家与案例研究

Litmus由开源社区在CNCF框架下维护(它是一个CNCF沙箱项目)。主要维护者包括来自Harness(收购了原Litmus团队的公司)、IntuitAdobe的工程师。关键贡献者包括Karthik Satchitanand(联合创始人)、Raj Babu DasUdit Gaurav

案例研究:Intuit
Intuit,这家金融软件巨头,使用Litmus测试其基于Kubernetes的微服务韧性。他们每周在20多个集群上运行超过500个混沌实验,模拟DNS中断、数据库连接断开和节点故障等故障。Intuit报告称,在实施基于Litmus的混沌工程后,与基础设施故障相关的生产事故减少了40%。

案例研究:Adobe
Adobe的Experience Cloud团队使用Litmus验证其边缘计算基础设施。他们将Litmus集成到使用Argo Workflows的CI/CD流水线中,在每次部署到预发布环境时运行混沌实验。Adobe发现,Litmus帮助他们发现了一个服务网格配置中的关键竞态条件,该问题原本会在流量高峰期导致5分钟的中断。

案例研究:Ola
Ola,这家印度网约车公司,使用Litmus测试其实时拼车平台的韧性。他们在非高峰时段运行混沌实验,模拟网络分区和Pod故障。Ola将实现其核心匹配服务99.99%正常运行时间的功劳归于Litmus。

| 公司 | 使用场景 | 实验/周 | 关键成果 |
|---|---|---|---|
| Intuit | 微服务韧性 | 500+ | 生产事故减少40% |
| Adobe | 边缘计算验证 | 100+ | 发现关键竞态条件 |
| Ola | 实时平台测试 | 200+ | 实现99.99%正常运行时间 |
| Gojek | CI/CD混沌集成 | 300+ | 事故响应速度提升30% |

数据洞察: 企业采用势头强劲,每家公司每周运行数百个实验。共同的主题是,Litmus通过在CI/CD流水线早期捕获问题,帮助防止生产事故。

行业影响与市场动态

混沌工程市场预计将从2023年的12亿美元增长到2028年的38亿美元,年复合增长率为25.6%(来源:Ma

更多来自 GitHub

GLM:重新定义统一NLP架构的中文语言模型由清华大学THUDM团队开发的通用语言模型(GLM)代表了语言模型处理理解与生成二元性的一次根本性转变。与主流的仅编码器(BERT)或仅解码器(GPT)架构不同,GLM提出了一种统一的自回归填空目标:随机遮蔽文本片段并以自回归方式生成它们。Crosspoint-Reader固件:以开源精准之力,唤醒E-Ink阅读器新生Crosspoint-Reader是一个针对Xteink X3和X4电子纸显示阅读器的重要开源固件项目,旨在解决长期困扰用户的封闭、性能低下的出厂固件问题。该项目在GitHub上已获得超过5,500颗星标,并以惊人的速度每日增长,吸引了由电OpenLess:开源语音工具如何重新定义你的打字方式OpenLess 正在用看似简单的交互重新定义语音输入范式:按住一个键说话,松开后 AI 润色完成的文本便直接出现在光标处。该项目已在 GitHub 上累计获得超过 2,491 颗星,单日新增高达 +797 颗,直击一个普遍痛点——原始语音查看来源专题页GitHub 已收录 3022 篇文章

时间归档

June 20262529 篇已发布文章

延伸阅读

GLM:重新定义统一NLP架构的中文语言模型清华大学THUDM团队提出的GLM(通用语言模型)开创了一种新颖的自回归填空范式,将自然语言理解与生成统一在单一框架中。本文深入剖析其架构设计、对ChatGLM系列的影响,以及至今仍定义其技术遗产的权衡取舍。Crosspoint-Reader固件:以开源精准之力,唤醒E-Ink阅读器新生社区驱动的Crosspoint-Reader固件专为Xteink X3与X4电子纸阅读器打造,GitHub星标数已飙升至5,527颗,日均新增450星。它承诺带来更卓越的续航、更广泛的格式支持与可定制的阅读体验,在一个小众却充满热情的市场中OpenLess:开源语音工具如何重新定义你的打字方式一款名为 OpenLess 的开源跨平台语音输入工具,凭借“按住说话、松开润色”的极简交互与本地 AI 模型的结合,在 GitHub 上以日均近 800 颗星的速度爆火。它承诺彻底消除语音输入后的编辑负担,让口述内容直接变成可用的精炼文本。Loop Engineering:编排AI编程代理的新范式一个名为loop-engineering的开源项目,正以结构化方式开创多AI编程代理编排的新路径。通过引入迭代优化、审计追踪与成本追踪等模式,它有望彻底改变AI团队处理复杂软件任务的方式。

常见问题

GitHub 热点“Litmus: The Open-Source Chaos Engineering Platform Reshaping Kubernetes Resilience”主要讲了什么?

Litmus, hosted at github.com/litmuschaos/litmus with over 5,400 stars, is an open-source chaos engineering platform designed specifically for Kubernetes environments. It enables SR…

这个 GitHub 项目在“Litmus vs Chaos Mesh comparison”上为什么会引发关注?

Litmus is built on a modular architecture that separates the control plane from the execution plane. The control plane consists of the Litmus Portal (a React-based web UI) and a backend service that manages projects, use…

从“how to install Litmus on EKS”看,这个 GitHub 项目的热度表现如何?

当前相关 GitHub 项目总星标约为 5465,近一日增长约为 0,这说明它在开源社区具有较强讨论度和扩散能力。