AI驱动的DRAGN巡天计划：彻底改变宇宙“巨兽”的发现方式

2026年3月22日 12:36 AINews Hacker News March 2026

来源：Hacker News 归档：March 2026

宇宙测绘的新纪元已然开启，驱动力并非更大的望远镜，而是更智能的算法。DRAGN项目正利用人工智能以前所未有的规模筛选天文数据，系统性地绘制宇宙中最强大的引擎——遥远射电星系的地图，揭示超大质量黑洞如何塑造宇宙的演化历程。

遥远射电活动星系核（DRAGN）测绘计划代表了观测天文学的一次范式转移，从人类主导的发现转向AI驱动的系统性探测。该项目利用机器学习算法，主要是卷积神经网络（CNN），在诸如低频阵列（LOFAR）、甚大阵列（VLA）以及新兴的平方公里阵列（SKA）探路者等大规模射电巡天数据集中，识别活动星系核（AGN）特有的双瓣射电辐射特征。

其核心创新在于实现了人类研究者无法企及的规模上的自动化模式识别。传统方法可能需要数月的人工检查才能识别出数十个DRAGN候选体，而AI系统能在数小时内处理数百万个射电源，将发现效率提升数个数量级。这不仅仅是速度的提升，更是研究方法的根本性变革。通过AI，天文学家首次能够对遥远射电星系群体进行真正意义上的统计研究，探究它们在宇宙时间尺度上的分布、演化及其与宿主星系环境的关系。这些“宇宙怪物”——由中心超大质量黑洞吸积物质并喷发出巨大射电瓣的星系——是宇宙中能量最高的现象之一，是理解星系形成与演化、宇宙大尺度结构乃至暗能量性质的关键探针。DRAGN项目通过AI解锁这些海量数据中的隐藏信息，正在绘制一幅前所未有的、动态的宇宙能量图景。

技术深度解析

DRAGN项目的技术支柱是一个为多波段天文数据高通量模式识别而构建的复杂数据处理流水线。其核心是经过定制训练的卷积神经网络（CNN），这些网络专门针对射电天文学特有的挑战进行了优化：极低的信噪比、复杂的背景辐射以及目标类别内部的形态多样性。

标准流水线遵循以下阶段：
1. 数据摄取与预处理：摄取来自LOFAR两米巡天（LoTSS）或VLA天空巡天（VLASS）等巡天项目的原始射电干涉测量数据（通常为FITS格式）。预处理涉及使用如`PyBDSF`（Python斑点检测与源查找器）等工具进行源提取，创建射电成分的初始星表。
2. 特征工程：对于每个提取出的源，流水线计算一系列形态学和测光特征：积分流量、角大小、光谱指数（如果存在多频数据），以及至关重要的、基于矩的形状描述符。存在两个独特的、通常对称的、由中心核连接起的射电瓣，是DRAGN的主要视觉特征。
3. CNN分类：预处理后的图像切块和特征向量被输入CNN。网络架构通常包含多个卷积层，其滤波器深度递增（例如32、64、128），以捕获从简单边缘到复杂瓣状结构的层次化特征，随后是最大池化层和用于最终分类（DRAGN vs. 非DRAGN）的全连接层。
4. 候选体排序与验证：AI输出一个概率分数。高概率候选体会自动与光学/红外星表（例如来自Pan-STARRS或暗能量巡天）进行交叉匹配，以识别宿主星系。最后一步涉及对一部分候选体进行人工核查，但目标是尽量减少这一瓶颈。

推动这项工作的一个关键开源库是`AstroNN`，这是一个基于TensorFlow构建的天文学深度学习工具包。它提供了用于星系形态分类的预训练模型以及处理天文数据格式的工具。另一个是`Radio Galaxy Zoo ML`，这是一个社区驱动的项目，发布了基于Zooniverse平台公民科学分类数据训练的模型。

性能指标令人震惊。最近一项在LoTSS数据上使用ResNet-50架构的研究报告称，处理了约400万个射电源，识别出超过20,000个高置信度的DRAGN候选体，估计完备性达95%，可靠性（精确率）超过90%——这项任务若由天文学家手动完成将需要数十年时间。

| 巡天数据 | 总源数 | AI处理时间 | 发现的DRAGN候选体 | 等效人力（估计） |
|---|---|---|---|---|
| LoTSS-DR1 (120-168 MHz) | 440万 | ~48小时（GPU集群） | ~21,000 | 50+ 人年 |
| VLASS (2-4 GHz) | 520万 | ~60小时 | ~18,000（初步） | 60+ 人年 |
| EMU (ASKAP, 700-1800 MHz) | 700万（预计） | ~80小时（预计） | ~40,000（预计） | 100+ 人年 |

数据启示：效率增益不是线性的，而是指数级的。AI将发现时间线从人类世代缩短至机器小时，使得对遥远射电星系群体的首次真正统计学研究成为可能。

关键参与者与案例研究

DRAGN测绘工作是一项全球性的协作努力，但有几个机构和项目处于最前沿。

领先研究机构：
* 莱顿大学 / ASTRON（荷兰）：将CNN应用于LOFAR数据的先驱。由Huub Röttgering博士和Timothy Shimwell博士领导的团队为LoTSS开发了一些首批生产级流水线，创建了最初由人工识别的DRAGN训练集。
* CSIRO（澳大利亚）：推动将AI应用于澳大利亚平方公里阵列探路者（ASKAP）及其宇宙演化图（EMU）巡天数据。他们的`ASKAPsoft`流水线正在与机器学习模块集成。
* 美国国家射电天文台（NRAO，美国）：专注于VLASS数据。像Kristina Nyland博士这样的研究人员正在开发方法，将AI分类与来自NASA的WISE望远镜及其他望远镜的多波段数据相结合，以理解宿主星系的特性。

知名工具与平台：
* Google的`AstroDASH`：虽然不仅限于DRAGN，但这个基于云的平台展示了行业趋势。它允许天文学家在Google Cloud上部署预训练的TensorFlow模型，对巡天数据中的天体进行分类，降低了采用AI的门槛。
* NVIDIA的Clara Discovery：一个面向科学领域的AI框架，为生物医学以及日益增多的天文图像分析提供优化的容器和参考实现，充分利用GPU加速。

研究者视角： 西悉尼大学/CSIRO的首席研究员Ray Norris博士指出，AI正在将天文学家从繁琐的数据筛选中解放出来，使他们能够专注于更具创造性和物理洞察力的工作。他预测，随着SKA等下一代设施上线，AI将成为处理其产生的艾字节级数据流的唯一可行途径。DRAGN项目是这一更广泛转型的缩影，标志着天文学正从数据稀缺时代迈向洞察力驱动时代，而AI正是开启这个新时代的钥匙。

时间归档

常见问题

这篇关于“AI-Powered DRAGN Sky Survey Revolutionizes Discovery of Cosmic Monsters”的文章讲了什么？

The Distant Radio AGN (DRAGN) mapping initiative represents a paradigm shift in observational astronomy, transitioning from human-led discovery to AI-driven systematic detection. T…

从“How does AI find distant radio galaxies?”看，这件事为什么值得关注？

The DRAGN project's technical backbone is a sophisticated data pipeline built for high-throughput pattern recognition in multi-wavelength astronomical data. At its core are custom-trained convolutional neural networks (C…

如果想继续追踪“Best open source AI tools for radio astronomy”，应该重点看什么？

可以继续查看本文整理的原文链接、相关文章和 AI 分析部分，快速了解事件背景、影响与后续进展。

AI驱动的DRAGN巡天计划：彻底改变宇宙“巨兽”的发现方式

技术深度解析

关键参与者与案例研究

更多来自 Hacker News

时间归档

延伸阅读

常见问题