当《我的世界》遇上扩散模型:Terrain-Diffusion-MC 如何重写程序化生成规则

GitHub May 2026
⭐ 505📈 +102
来源:GitHub归档:May 2026
一款名为 Terrain-Diffusion-MC 的全新开源项目,将扩散模型应用于《我的世界》地形生成,开创了生成式 AI 与体素游戏融合的新范式。早期成果展现出前所未有的多样性与真实感,但该项目对算力要求极高,目前仍处于实验阶段。

由开发者 xandergos 创建的 Terrain-Diffusion-MC,标志着游戏程序化生成领域的一次激进变革。它摒弃了传统的 Perlin 噪声、元胞自动机或手工规则,转而使用一个在数千个《我的世界》世界切片上训练的条件扩散模型。该模型以低分辨率高度图或语义掩码为输入,逐块生成完整的 3D 体素地形。其结果极具自然主义风格——连绵起伏的丘陵、河谷、洞穴网络以及生物群系过渡,都呈现出有机而非算法的质感。项目上线一天内便在 GitHub 上获得超过 500 颗星,显示出 AI 与游戏开发社区的强烈兴趣。然而,当前实现远未达到生产就绪状态:推理过程对计算资源消耗巨大,且训练脚本尚未公开。

技术深度解析

Terrain-Diffusion-MC 基于条件潜在扩散模型(LDM)架构构建,与 Stable Diffusion 类似,但针对 3D 体素数据进行了适配。其核心创新在于将《我的世界》地形表示为大小为 16×16×256(一个 Minecraft 区块)的 3D 张量,其中每个体素是一个代表方块类型(如石头、泥土、草、水、空气)的分类变量。模型使用空间压缩因子为 8×8×8 的 3D 变分自编码器(VAE)将输入压缩到潜在空间,将 16×16×256 的输入缩减为 2×2×32 的潜在表示。扩散过程随后在这个潜在空间中运行,对以 2D 高度图或 4 通道语义图(生物群系、海拔、湿度、温度)为条件的高斯噪声张量进行去噪。

去噪 U-Net 使用 3D 卷积和交叉注意力层来对输入进行条件化。训练数据集通过抓取数千个《我的世界》世界(包括自然生成和玩家建造的)并提取对齐的区块切片构建而成。每个切片都与其对应的高度图和从世界种子中提取的生物群系标签配对。该模型在单个 NVIDIA A100 80GB GPU 上训练了约 50 万步,耗时约两周。

| 指标 | Terrain-Diffusion-MC | 传统 Perlin 噪声 | GPT-4o 生成(假设) |
|---|---|---|---|
| 每区块推理时间 | 3.2 秒(A100) | 0.001 秒(CPU) | 不适用 |
| 显存需求 | 8.2 GB | 0 MB | 不适用 |
| 多样性(每 100 区块中独特方块模式占比) | 98% | 45% | 不适用 |
| 用户可控性 | 高(条件式) | 低(基于种子) | 不适用 |
| 开源 | 部分 | 是 | 否 |

数据洞察: Terrain-Diffusion-MC 以速度和内存效率为代价,换取了显著更高的多样性和可控性。传统方法速度快 3000 倍,但生成的地形重复且可预测。这种权衡在预生成或创意工具场景下可以接受,但不适用于实时游戏。

该模型还支持修复(inpainting):给定一个部分建造的区块,它可以连贯地填充缺失的方块。这是通过在反向扩散过程中对潜在表示进行掩码实现的,类似于 Stable Diffusion 的修复工作方式。代码库(位于 github.com/xandergos/terrain-diffusion-mc)包含一个用于交互式生成的 Gradio 演示,但训练脚本尚未发布。社区已经分叉了该仓库,以增加对更大区块(32×32×256)和多 GPU 推理的支持。

关键参与者与案例研究

该项目是 xandergos 的创意结晶,这位化名开发者拥有计算机图形学和生成模型背景。他们之前的工作包括一个基于 NeRF 的《我的世界》渲染器和一个用于生成《我的世界》结构的 GAN。Terrain-Diffusion-MC 是他们迄今为止最雄心勃勃的项目。

该项目处于多个关键参与者的交汇点:
- Mojang(微软): 《我的世界》的官方开发商尚未公开评论,但内部研究团队已经探索过 AI 辅助的世界生成。Mojang 的程序化生成系统使用多层 Perlin 噪声堆栈,结合生物群系和结构,是游戏史上最成功的系统之一。Terrain-Diffusion-MC 可能通过提供更优的替代方案来威胁其专有系统。
- OpenAI: 虽然未直接参与,但该项目依赖于由 OpenAI 的 DALL-E 2 推广、后被 Stable Diffusion 采用的扩散模型范式。其条件化机制受到 OpenAI 的 GLIDE 模型启发。
- NVIDIA: 该项目在 A100 GPU 上训练,推理过程显著受益于 NVIDIA 的 Tensor Core。NVIDIA 自身在 3D 生成模型(如 GET3D、EG3D)方面的研究为基于体素的扩散提供了基础。
- 社区模组制作者: 《我的世界》模组社区已经将该模型集成到一个名为 "DiffusionCraft" 的 Fabric 模组中,该模组在玩家探索时实时生成地形。早期反馈指出了“恐怖谷”效应——地形看起来真实,但有时包含不可能的方块结构(例如漂浮的水)。

| 工具/项目 | 类型 | GitHub 星数 | 关键特性 |
|---|---|---|---|
| Terrain-Diffusion-MC | 扩散模型 | 505(日增 +102) | 条件式 3D 体素生成 |
| Minecraft Procedural(原版) | 基于规则 | 不适用 | 实时、无限世界 |
| WorldPainter | 工具 | 不适用 | 手动地形编辑 |
| TerrainGen | 基于 GAN | 1,200 | 2D 高度图生成 |

数据洞察: Terrain-Diffusion-MC 是首个将扩散模型应用于体素地形的开源项目。其快速的星数增长表明需求强劲,但在成熟度和可用性方面仍远落后于既有工具。

行业影响与市场动态

程序化内容生成(PCG)市场预计将从 2024 年的 21 亿美元增长到 2030 年的 58 亿美元(年复合增长率 18.4%)。Terrain-Diffusion-MC 可能通过实现既高质量又可控制的 AI 驱动 PCG 来加速这一增长。像 Mojang、Epic Games 这样的游戏工作室,以及独立开发者,都可能从中受益。然而,该技术目前的高计算成本限制了其应用场景。随着硬件效率的提升和模型蒸馏技术的发展,我们有望在 2-3 年内看到基于扩散的地形生成被用于游戏开发管线。

更多来自 GitHub

This Open-Source Tool Automates China Software Copyright Filing, Slashing Costs to ZeroFor Chinese developers and small businesses, applying for a software copyright (软著) has long been a tedious and costly p无标题The BrowserOS Agent, hosted at github.com/browseros-ai/old-browseros-agent, is a specialized submodule within the BrowseBrowserOS:开源智能体浏览器,或将重塑网页交互方式BrowserOS横空出世,在发布首日便获得超过11000个GitHub星标,这标志着市场对AI浏览器领域的开源替代方案有着极度渴望。该项目将自己定义为“智能体浏览器”——在这种浏览器中,AI智能体不再是侧边栏插件,而是能够规划、执行和推理查看来源专题页GitHub 已收录 2243 篇文章

时间归档

May 20262815 篇已发布文章

延伸阅读

This Open-Source Tool Automates China Software Copyright Filing, Slashing Costs to ZeroA new open-source project, fokkyp/softwarecopyright-skill, automates the generation of China software copyright applicatBrowserOS Agent: The Modular AI That Wants to Control Your BrowserBrowserOS Agent, a submodule of the larger BrowserOS project, aims to turn your browser into an operating system for AI BrowserOS:开源智能体浏览器,或将重塑网页交互方式开源“智能体浏览器”BrowserOS在一天内狂揽超过11000个GitHub星标,它直接将AI智能体融入浏览体验,作为ChatGPT Atlas和Perplexity Comet等专有工具的免费替代方案,承诺实现自主网页导航、数据提取和任Steam Deck原生Spotify控制来了:MusicControl插件如何填补掌机游戏的关键空白一款名为MusicControl的Decky Loader插件,让Steam Deck用户无需切屏或使用笨拙的变通方案,即可在快捷访问菜单中直接原生控制Spotify播放。AINews深入解析其技术实现、竞争格局,并揭示这款看似简单的插件如

常见问题

GitHub 热点“Minecraft Meets Diffusion: How Terrain-Diffusion-MC Rewrites Procedural Generation”主要讲了什么?

Terrain-Diffusion-MC, created by developer xandergos, represents a radical departure from traditional procedural generation in gaming. Instead of relying on Perlin noise, cellular…

这个 GitHub 项目在“Terrain-Diffusion-MC vs Perlin noise comparison”上为什么会引发关注?

Terrain-Diffusion-MC is built on a conditional latent diffusion model (LDM) architecture, similar to Stable Diffusion but adapted for 3D voxel data. The core innovation is representing Minecraft terrain as a 3D tensor of…

从“How to run Terrain-Diffusion-MC locally”看,这个 GitHub 项目的热度表现如何?

当前相关 GitHub 项目总星标约为 505,近一日增长约为 102,这说明它在开源社区具有较强讨论度和扩散能力。