BigCache：Allegro 如何打造 Go 语言最高效的 GB 级缓存

BigCache 是由欧洲最大电商平台之一 Allegro 开发的高性能内存缓存库，专为在 Go 语言中存储 GB 级数据而设计，同时最大限度降低垃圾回收器（GC）的影响。其核心创新在于分片机制：BigCache 将缓存划分为 256 个独立分片，每个分片拥有独立的锁和一块连续的字节数组（FIFO 环形缓冲区）。这一设计避免了创建数百万个微小堆对象——否则会频繁触发 GC 暂停，严重拖累性能。BigCache 将所有条目以序列化字节形式存储在这些预分配的数组中，从根本上消除了每个条目的堆分配。最终，该缓存能以亚毫秒级延迟处理每秒数百万次读写操作。

技术深度解析

BigCache 的架构堪称 Go 内存管理的教科书级案例。它解决的根本问题是 Go 的 GC 行为：当程序分配数百万个小对象（例如缓存条目）时，垃圾回收器必须在标记阶段逐一扫描它们。这会导致长达数百毫秒的“停止世界”暂停，彻底摧毁实时系统的延迟保障。

分片与锁竞争

BigCache 将缓存划分为 256 个分片。每个分片使用 `sync.RWMutex` 独立加锁，支持跨分片的并发读写。分片索引通过 `hash(key) % 256` 计算。这极大降低了锁竞争：在多线程环境下，两个 goroutine 碰撞到同一分片的概率约为 1/256。

零分配存储

BigCache 并未将每个条目存储为独立的 Go 结构体（这会导致堆分配），而是为每个分片使用预分配的连续字节数组。该数组本质上是一个 FIFO 环形缓冲区。添加新条目时，数据被追加到缓冲区末尾；若缓冲区已满，则覆盖最旧的条目。这一设计有两个关键优势：

1. 无逐条目堆分配：所有数据存在于一个大型切片中。无论存在多少缓存条目，GC 每个分片只看到一个对象。
2. 缓存友好的内存访问：连续内存提升了 CPU 缓存局部性，减少了 L1/L2 缓存未命中。

条目格式

缓冲区中的每个条目是一个二进制块，包含：
- 16 字节头部（哈希、状态、键长度、值长度）
- 键字节
- 值字节

读取时，BigCache 即时反序列化值。这意味着缓存存储的是原始字节，而非 Go 对象。调用方负责序列化/反序列化（例如使用 `encoding/gob`、`json` 或 `protobuf`）。

淘汰与过期

BigCache 采用简单的 FIFO 淘汰策略：缓冲区满时，覆盖最旧的条目。没有 LRU 或 LFU。过期机制是全局性的：创建缓存时设置单一 TTL。读取时跳过早于 TTL 的条目，但不会主动移除，直到其槽位被覆盖。这种简单性是有意为之——它保持了代码库的精简（单个 Go 文件），避免了优先级队列或定时清理的复杂性。

基准测试表现

下表对比了 BigCache 与其他流行 Go 缓存方案在真实负载下的表现：1000 万条目，每条键 100 字节、值 500 字节，运行在 8 核机器上。

| 库 | 写入操作/秒 | 读取操作/秒 | GC 暂停（平均） | 内存开销 |
|---|---|---|---|---|
| BigCache v3.0 | 1,850,000 | 2,100,000 | 1.2 ms | 12% |
| FreeCache v1.6 | 1,200,000 | 1,500,000 | 3.8 ms | 18% |
| Go-Cache v2.1 | 450,000 | 600,000 | 45 ms | 35% |
| Ristretto v0.1 | 900,000 | 1,100,000 | 8.5 ms | 22% |

数据要点： BigCache 在吞吐量和 GC 暂停时间上均优于所有替代方案。1.2 ms 的平均 GC 暂停与 Go-Cache 的 45 ms 相比微不足道——后者对延迟敏感的应用而言将是灾难性的。同样使用分片的 FreeCache，由于其更复杂的淘汰逻辑，仍然面临更高的开销。

GitHub 仓库

官方仓库是 GitHub 上的 `allegro/bigcache`。截至 2025 年 5 月，它拥有 8,123 颗星和 1,200 多个复刻。代码库极为精简：约 1,500 行 Go 代码，零外部依赖。最新版本（v3.0）增加了对自定义哈希函数的支持，并提升了并发读取性能。仓库还包含一套全面的基准测试套件，用户可运行以验证其硬件上的性能。

关键参与者与案例研究

Allegro：起源故事

Allegro 是波兰最大的电商平台，每天处理数百万笔交易。其工程团队于 2016 年构建了 BigCache，以解决一个具体问题：基于 Go 的广告投放系统在缓存用户画像和广告定向数据时，GC 暂停长达 500 ms。这些暂停导致实时竞价中错失出价，直接影响收入。BigCache 将 GC 暂停降至 2 ms 以下，使 Allegro 能够将其广告平台扩展至每秒处理 150 万次请求。

与分布式缓存的对比

许多团队默认使用 Redis 或 Memcached 进行缓存，但 BigCache 为单节点场景提供了极具吸引力的替代方案。

| 特性 | BigCache | Redis（本地模式） | Memcached |
|---|---|---|---|
| 语言 | Go（原生） | C（通过 Go 客户端） | C（通过 Go 客户端） |
| 延迟（p99） | 50-100 µs | 200-500 µs | 150-300 µs |
| 网络开销 | 无（进程内） | TCP/Unix 套接字 | TCP/Unix 套接字 |
| 数据持久化 | 无 | RDB/AOF | 无 |
| 最大数据量 | RAM 限制 | RAM + 交换空间 | RAM 限制 |
| 淘汰策略 | FIFO | 8 种策略（LRU、LFU 等） | LRU |
| 集群支持 | 否 | 是（Redis Cluster） | 否 |

数据要点： 对于单节点进程内缓存，BigCache 的延迟比 Redis 和 Memcached 低 2-5 倍。

时间归档

延伸阅读

常见问题

GitHub 热点“BigCache: How Allegro Engineered Go's Most Efficient GB-Scale Cache”主要讲了什么？

BigCache is a high-performance, in-memory cache library written in Go, developed by Allegro, one of Europe's largest e-commerce platforms. It is specifically engineered to store gi…

这个 GitHub 项目在“BigCache vs Redis latency benchmark”上为什么会引发关注？

BigCache's architecture is a masterclass in Go memory management. The fundamental problem it solves is Go's GC behavior: when a program allocates millions of small objects (e.g., cache entries), the garbage collector mus…

从“BigCache Go GC optimization technique”看，这个 GitHub 项目的热度表现如何？

当前相关 GitHub 项目总星标约为 8123，近一日增长约为 0，这说明它在开源社区具有较强讨论度和扩散能力。