Nature | 新方法moscot:单细胞时空图谱的“导航系统”
《Nature》最新研究提出了一种名为moscot的计算框架,通过最优输运(OT)技术,首次实现了多模态单细胞数据在时间和空间维度的精准映射。该方法不仅突破了传统OT方法的局限,还能处理百万级细胞的发育轨迹重建、空间转录组数据增强及多切片对齐,并在小鼠胚胎发育、肝脏和大脑研究中验证了其高效性,为解析复杂生命过程提供了全新工具。
引言
1、当前痛点:
单模态限制:现有OT工具仅支持单一数据类型(如基因表达),无法整合多组学信息(如染色质可及性、蛋白质表达)。
算力瓶颈:传统OT计算复杂度高(时间/内存随细胞数平方增长),难以应用于百万级单细胞图谱。
工具碎片化:不同OT方法实现差异大,接口不统一,阻碍新问题的拓展应用。
2、moscot的突破:
多模态兼容:支持基因、蛋白、空间坐标等多维度数据联合分析。
超强扩展性:通过低秩近似和GPU加速,计算效率提升数个量级。
统一框架:提供标准化接口,适配时空、跨模态等多种生物学问题。
方法解析:moscot如何工作?
1、核心算法
三大OT模型:
-
Wasserstein型:对齐相同特征空间的细胞(如时间序列)。
-
Gromov-Wasserstein型:跨不同空间的数据对齐(如空间切片)。
-
混合型(FGW):融合基因表达相似性与空间距离(时空联合分析)。
多模态整合:通过共享潜在表征(如PCA降维)统一多组学数据。
2、性能优化
低秩近似:将耦合矩阵约束为低秩,降低计算复杂度至线性。
即时编译(JAX):支持GPU加速,百万级细胞分析可在笔记本电脑完成。
3、下游应用
细胞命运预测、空间注释迁移、驱动基因识别,并与CellRank等工具无缝衔接。
小鼠胚胎发育重建
成功追踪170万细胞跨越20个时间点的发育轨迹,准确性媲美定制化工具TOME,且生长率预测更符合生物学实际(如凋亡率<10%)。
空间数据增强与对齐
将小鼠肝脏CITE-seq数据(含91,000细胞)映射至36.7万空间位点,精准识别中央静脉(CV)和门静脉(PV)区域,并实现大脑冠状切片的百万级细胞对齐。
时空动态解析
整合基因表达与空间坐标,构建小鼠胚胎心脏与脑发育轨迹,预测关键转录因子(如心脏发育的Gata4、神经元分化的Neurod2)。
胰腺内分泌谱系揭秘
通过多组学数据发现δ和ε细胞共享祖细胞,实验验证NEUROD2为ε细胞分化的关键调控因子,为糖尿病研究提供新靶点。
参考资料
Klein, D., Palla, G., Lange, M. et al. Mapping cells through time and space with moscot. Nature 638, 1065–1075 (2025).
代码链接:https://moscot-tools.org