2022年7月30日,浙江大学长三角智慧绿洲创新中心未来健康实验室范骁辉教授团队与浙江大学医学院附属杭州市第一人民医院徐骁教授团队、浙江大学计算机学院陈华钧教授团队合作在Nature Communications杂志在线发表 “Knowledge-graph-based cell-cell communication inference for spatially resolved transcriptomic data with SpaTalk” 的研究论文。
细胞间通讯(cell-cell communication),也被称为细胞间相互作用,指的是一个细胞产生信号,通过介质传递到另一个细胞,进而调控靶细胞并产生生长、增殖、分化、凋亡等一系列生物学效应的过程。精准识别细胞间通讯是理解疾病发生发展和研发干预药物的关键环节,日益受到业界重视。
随着近些年的发展,空间转录组(spatially resolved transcriptomics)测序技术的快速发展已被广泛应用于探究细胞的空间异质性,因其既实现了转录组测序,又保留了细胞及其基因的空间位置信息。目前,空间转录组测序技术按照原理主要分为两大类。第一类是基于高通量RNA成像的技术,包括STARmap、MERFISH、seqFISH等,实现了单细胞分辨率的空间转录组测序;第二类基于空间条形码的技术,包括10X Visium、Slide-seq、HDST、Stereo-seq等,实现了空间区域(spot)的全转录组测序。显然,空间转录组测序技术的迅猛发展为研究细胞间通讯的空间异质性提供了技术支持和数据来源,如何利用空间转录组数据推断细胞间通讯成为了相关领域的重要挑战。
该研究通过引入知识图谱、非负线性回归、随机游走等人工智能算法开发了一种基于空间转录组测序数据的细胞间通讯推断方法SpaTalk(该方法详见https://github.com/ZJUFanLab/SpaTalk)。该方法整合了配受体的空间邻近原则以及配受体与下游靶点共表达的研究策略,对空间上显著相邻的配受体和受体细胞内的信号通路分别进行图网络和知识图谱建模及评分,从而在受限空间内推断配受体相互作用介导的细胞间通讯。
图1. SpaTalk工作流程、算法原理及可视化
SpaTalk一共分为两个步骤:(1)第一步是将单细胞转录组测序数据作为参考图谱解析空间转录组数据中的细胞组成,进而重构出已知细胞类型和空间坐标的单细胞图谱。针对单细胞分辨率的空转数据,SpaTalk通过非负线性回归识别出空转数据中每个单细胞的类型;针对区域分辨率的空转数据,SpaTalk通过非负线性回归识别出每个区域中不同细胞类型的比例,并以此利用空间映射将参考图谱中的单细胞还原到不同的空间区域。(2)第二步是利用知识图谱对配体-受体-下游转录因子-靶基因进行建模,通过置换检验、随机游走等算法筛选出在空间上显著相邻且受体细胞下游信号激活的配受体互作对。
结果显示,SpaTalk不仅可准确解析出基准测试数据的细胞比例,优于其他解卷积方法;还可准确推断出介导空间细胞间通讯的配受体互作对及其激活的下游信号通路,准确率高于其他的细胞间通讯推断方法。相比于现有的其他方法,SpaTalk首次在单细胞水平实现了细胞间配受体互作对的比较和可视化,应用案例也进一步表明SpaTalk在空间单细胞分辨率下解析正常生理、病理过程中关键细胞间通讯的独特优势。
该研究受到国家自然科学基金、国家重点研发计划和浙江省自然科学基金等项目资助,并得到了阿里云支持。
原文链接:https://doi.org/10.1038/s41467-022-32111-8