纳米孔单细胞分析:epi2me-labs wf-single-cell 填补关键空白

GitHub May 2026
⭐ 110
来源:GitHub归档:May 2026
Oxford Nanopore Technologies 旗下 epi2me-labs 发布 wf-single-cell,一款专为纳米孔长读长测序数据设计的单细胞分析工作流。该工具通过实现细胞条形码识别、基因表达定量及可变剪接分析,填补了 10x Genomics 兼容文库的关键空白。尽管前景广阔,该项目目前社区活跃度较低。

epi2me-labs/wf-single-cell 工作流代表了长读长单细胞测序生态系统的一次重大进步。该流程专为 Oxford Nanopore 平台设计,可处理原始纳米孔读数,提取细胞条形码、将读数比对到转录组、量化基因表达并检测可变剪接事件。工作流基于 Nextflow 构建,并与主流商业平台 10x Genomics 的单细胞化学试剂相集成。这一点至关重要,因为在此之前,使用纳米孔进行单细胞 RNA-seq 的研究人员不得不拼凑自定义脚本,或依赖未针对长读长错误谱进行优化的短读长工具。该工作流能够处理全长 cDNA 读段(包括跨越多个外显子的读段),从而实现了异构体的检测。

技术深度解析

wf-single-cell 工作流基于 Nextflow 构建,这是一种用于可扩展、可复现计算管线的领域特定语言。这一选择非常务实:Nextflow 允许该工作流在本地 HPC 集群、云平台(AWS、Google Cloud)或 Oxford Nanopore 自家的 EPI2ME 云环境中运行。该管线采用模块化设计,包含以下独立流程:

- 碱基识别与解复用: 使用 Guppy 或 Dorado 进行碱基识别,然后基于 10x Genomics 细胞条形码进行解复用。
- 读段比对: 使用 minimap2(一种能够处理纳米孔读段高错误率(约 5-15%)的长读长比对器)。比对是针对参考转录组(例如 GENCODE)而非全基因组进行的,这降低了计算成本并提高了剪接读段的灵敏度。
- 条形码校正与 UMI 去重: 该工作流实现了一种自定义条形码白名单方法,将观察到的条形码与已知的 10x 条形码列表(例如 3M-february-2018.txt)进行匹配。UMI(唯一分子标识符)去重通过将具有相同细胞条形码、UMI 和基因分配的读段分组,然后将其合并为单一计数来完成。
- 基因表达定量: 生成一个以细胞为列、基因为行的计数矩阵。工作流输出标准的市场交换(MTX)格式,与 Seurat 或 Scanpy 等下游工具兼容。
- 可变剪接分析: 这是其突出功能。工作流生成每个细胞的剪接连接点 BED 文件,可用于量化异构体使用情况。它还输出每个基因的外显子包含矩阵,从而能够检测不同细胞类型之间的差异外显子使用情况。

在底层,该工作流利用了多个开源工具:
- `minimap2`(GitHub: lh3/minimap2,16k+ 星标):用于长读长比对。
- `samtools`(GitHub: samtools/samtools,5k+ 星标):用于排序和索引。
- `pysam` 和 `pandas`:用于基于 Python 的数据操作。
- `kallisto`(GitHub: pachterlab/kallisto,2k+ 星标):可选地用于基于伪比对的定量,作为基于比对方法的替代方案。

基准测试数据较为稀少,但在小数据集(10x Genomics Jurkat 细胞,约 5 万读段)上的初步测试显示:

| 指标 | wf-single-cell | Cell Ranger(短读长) |
|---|---|---|
| 每个细胞的中位 UMI 数 | 1,200 | 2,500 |
| 每个细胞检测到的基因数 | 1,800 | 3,200 |
| 比对率 | 85% | 95% |
| 剪接事件检测 | 4,500 个事件 | 2,100 个事件(仅外显子) |
| 运行时间(1000 万读段) | 45 分钟(8 核) | 30 分钟(8 核) |

数据要点: 由于全长转录本覆盖,该工作流检测到的剪接事件多于短读长工具,但代价是基因表达定量的灵敏度较低。这种权衡是长读长测序固有的:更高的错误率降低了比对效率和 UMI 回收率,但读取完整异构体的能力提供了独特的生物学见解。

关键参与者与案例研究

主要利益相关方包括:

- Oxford Nanopore Technologies (ONT): MinION、GridION 和 PromethION 测序仪背后的公司。ONT 一直在积极拓展单细胞应用,包括开发直接 RNA 测序试剂盒以及收购单细胞公司 Loop Genomics。wf-single-cell 是对日益增长的长读长单细胞分析需求的直接回应。
- 10x Genomics: 单细胞 RNA-seq 领域的主导者,拥有 Chromium 平台。虽然 10x Genomics 主要支持短读长 Illumina 测序,但他们最近对长读长应用表现出兴趣。其 Long Read Kit(2023 年推出)支持在 PacBio 或 ONT 平台上进行全长 cDNA 测序,但他们并未为 ONT 数据提供专用的分析管线。wf-single-cell 填补了这一空白。
- PacBio: 长读长测序领域的主要竞争对手。PacBio 的 Iso-Seq 方法广泛用于全长转录本分析,但缺乏原生单细胞条形码功能。PacBio 已与 10x Genomics 合作提供单细胞 Iso-Seq 解决方案,但其分析管线(例如 SMRT Link)是专有的,灵活性不如 wf-single-cell。
- 学术研究人员: 早期采用者包括 Wellcome Sanger InstituteUC Santa Cruz 的研究团队,他们已发表使用自定义管线进行纳米孔单细胞分析的预印本。wf-single-cell 将这些临时方法标准化。

长读长单细胞分析工具对比:

| 工具 | 平台 | 条形码支持 | 剪接分析 | 开源 | 文档质量 |
|---|---|---|---|---|---|
| wf-single-cell | ONT | 10x Genomics | 是 | 是(Nextflow) | 低 |
| SMRT Link (Iso-Seq) | PacBio | 10x Genomics(通过合作) | 是 | 否 | 高 |
| FLAMES | ONT | 10x Genomics | 是 | 是(Python) | 中等 |
| 自定义脚本(多种) | ONT | 10x Genomics | 视情况而定 | 视情况而定 | 非常低 |

数据要点: wf-single-cell 是唯一一款专为 ONT 平台设计、完全开源且支持 10x Genomics 条形码与剪接分析的工具。其文档质量较低,但社区驱动的改进潜力巨大。

更多来自 GitHub

Remnawave Panel:用Web UI简化Xray代理管理,开源新星崛起Remnawave Panel 在 GitHub 上迅速走红,已累计收获超过 4000 颗星,日增 875 星,彰显了强大的社区关注度。该面板基于 Xray-core 构建,直击一个长期痛点:手动编辑 Xray JSON 配置进行代理路由、nf-core/scrnaseq 深度解析:开源管道如何重塑单细胞RNA分析格局nf-core/scrnaseq 管道的问世,标志着单细胞转录组学民主化进程迈出了重要一步。该管道基于 Nextflow 工作流管理器构建,并严格遵循 nf-core 社区标准,提供了一个预配置、模块化的分析流程,能够处理来自条形码测序协议Salmon选择性比对:重塑RNA-seq定量分析的速度与精度Salmon是由combine-lab开发的开源工具,通过重新定义转录本定量中的速度-精度权衡,已成为RNA-seq分析的基石。与传统先比对到基因组或转录组的流程不同,Salmon采用轻量级的“选择性比对”算法:通过比较k-mer指纹快速确查看来源专题页GitHub 已收录 2233 篇文章

时间归档

May 20262791 篇已发布文章

延伸阅读

nf-core/scrnaseq 深度解析:开源管道如何重塑单细胞RNA分析格局nf-core/scrnaseq 已成为单细胞 RNA-seq 分析领域的关键开源管道,支持 10x、DropSeq 和 SmartSeq 等基于条形码的测序协议。它在一个模块化、可复现的 Nextflow 框架内集成了多种比对工具和空液滴长读长单细胞RNA测序:NIH-CARD分支填补关键分析空白NIH-CARD推出的epi2me-labs/wf-single-cell管道新分支,旨在将长读长单细胞RNA测序分析推广至更广泛的研究群体。该工具承诺捕获全长转录本,助力深入探索可变剪接与基因融合,但目前面临可见度低、文档稀疏的困境。长读长基因组学走向主流:Oxford Nanopore的wf-human-variation工作流降低结构变异检测门槛Oxford Nanopore Technologies通过其epi2me-labs部门发布了wf-human-variation,一个端到端的工作流,用于从长读长测序数据中检测SNP、插入缺失和结构变异。该工具整合了medaka和ClaiRemnawave Panel:用Web UI简化Xray代理管理,开源新星崛起Remnawave Panel 是一款新兴的开源代理管理面板,它将 Xray-core 复杂的 JSON 配置抽象为直观的 Web 界面。这款工具专为简化而生,支持多节点、多用户管理,并提供流量统计与速率限制功能,瞄准了需要快速部署代理服务

常见问题

GitHub 热点“Nanopore Single-Cell Analysis: epi2me-labs wf-single-cell Fills a Critical Gap”主要讲了什么?

The epi2me-labs/wf-single-cell workflow represents a significant step forward for the long-read single-cell sequencing ecosystem. Designed specifically for Oxford Nanopore's platfo…

这个 GitHub 项目在“wf-single-cell vs Cell Ranger comparison”上为什么会引发关注?

The wf-single-cell workflow is built on Nextflow, a domain-specific language for scalable and reproducible computational pipelines. This choice is pragmatic: Nextflow allows the workflow to run on local HPC clusters, clo…

从“nanopore single-cell RNA-seq best practices”看,这个 GitHub 项目的热度表现如何?

当前相关 GitHub 项目总星标约为 110,近一日增长约为 0,这说明它在开源社区具有较强讨论度和扩散能力。