单细胞论文记录(part9)--Spatial charting of single-cell transcriptomes in tissues _Script

从来好事天生俭，自古瓜儿苦后甜。这篇文章主要讲述单细胞论文记录(part9)--Spatial charting of single-cell transcriptomes in tissues相关的知识，希望能为你提供帮助。
学习笔记，仅供参考，有错必纠
Authors：Wei Runmin，He Siyuan, Nicholas E. Navin
Journal：Nature Biotechnology
Year：2022

文章目录

??Spatial charting of single-cell transcriptomes in tissues??

??abstract??
??Introduction??
??Results??

??Overview of CellTrek toolkit.??
??Benchmarking and simulations.??
??Spatial cell charting of the mouse hippocampus??

Spatial charting of single-cell transcriptomes in tissues abstract
单细胞RNA测序方法可以剖析单细胞的转录组，但不能保存空间信息. 相反，空间转录组学检测可以剖析组织切片中的空间区域，但不具有单细胞分辨率. 在这里，我们开发了一种名为CellTrek的计算方法，它结合了这两个数据集，通过共嵌入(coembedding)和度量学习(metric learning)实现单细胞空间映射. 我们使用模拟和原位杂交数据集对CellTrek进行了基准测试，证明了其准确性和稳健性. 然后我们将CellTrek应用于现有的小鼠大脑和肾脏数据集，并表明CellTrek可以检测到不同细胞类型和细胞状态的拓扑模式. 我们在两个导管原位癌组织上进行了单细胞RNA测序和空间转录组学实验，并应用CellTrek来识别局限于不同导管的肿瘤亚克隆，以及邻近肿瘤区域的特定T细胞状态. 我们的数据显示，CellTrek可以准确地绘制不同组织类型中的单细胞，以解决它们的空间组织.
Introduction
单细胞RNA测序(scRNA-seq)方法大大扩展了我们对不同类型细胞的基因表达及其在发育和疾病中的作用的了解. 然而，scRNA-seq在组织解离步骤中失去了细胞的空间信息，而空间信息对于理解细胞微环境和cell-cell相互作用至关重要. 虽然空间测序方法，包括空间转录组学(ST)和Slide-seq，可以剖析整个组织切片的基因表达空间，但它们仅限于测量有细胞混合物的小区域，不能轻易提供单细胞信息. 为了解决这个问题，已经设计了一些计算方法(例如cell2location、RCTD)来将ST点分解为不同细胞类型的比例. 然而，空间deconvolution方法只限于推断每个spot的细胞类型比例，不能达到单细胞分辨率. 此外，deconvolution方法在进一步将细胞类型解析为更细化的细胞状态，反映不同的生物学功能. 最后，大多数deconvolution方法只能预测分类标签，不能在空间分辨率上推断出连续的细胞信息.
在这里，我们介绍了CellTrek一个计算工具包，它可以根据scRNA-seq和ST数据直接将单细胞映射回它们在组织切片中的空间坐标. 这种方法有别于ST deconvolution，能够更灵活和直接地研究具有空间形态的单细胞数据. CellTrek工具箱还提供了两个下游分析模块，包括用于空间共定位分析的SColoc和用于空间共表达分析的SCoexp. 我们使用模拟和原位数据集对CellTrek进行了基准测试. 然后我们将CellTrek应用于现有的来自正常小鼠大脑和肾脏组织的数据集，以及我们从两个人类导管原位癌(DCIS)样本中产生的数据，以研究单细胞分辨率下的细胞类型/状态的空间组织.
Results
Overview of CellTrek toolkit.CellTrek首先将ST和scRNA-seq数据整合到一个共享的特征空间. 利用ST数据，CellTrek训练一个多变量随机森林(RF)模型，利用共享降维特征预测空间坐标. ST数据的空间非线性插值被引入以提高空间分辨率. 将训练好的模型应用于coembedded 数据，得出RF距离矩阵，由空间坐标监督，衡量ST点和单细胞之间的表达相似性. 基于RF距离矩阵，CellTrek在阈值化后使用互近邻(MNN)产生一个稀疏的spot-cell图. 最后，CellTrek将细胞的空间坐标从它们的邻居点转移过来. 为了提高兼容性，CellTrek可以接受任何从其他方法（例如novoSpaRc）计算的细胞定位概率/距离矩阵作为细胞空间图的输入. 此外，我们还提供了一个图形用户界面（GUI），用于对所得到的CellTrek进行交互式可视化.

为了再现不同细胞类型之间的空间关系，我们开发了一个下游的计算模块，SColoc，它将CellTrek的结果总结为一个图形抽象. 提供了三种方法，Kullback-Leibler（KL），Delaunay triangulation（DT）和K-nearest neighbor distance(KD)，以计算细胞类型之间的空间差异性. 基于异质性矩阵，SColoc可以构建一个最小生成树（MST），代表简化的空间细胞接近度. 上述步骤将在引导样本上反复执行，以产生consensus matrices. 此后，图形将通过具有可调整边缘阈值和颜色映射功能的GUI进行渲染. 此外，SColoc提供了一个K-distance指标，用于测量细胞与所选参考组的空间距离.
为了研究不同的表达是否分布在不同的地形区域，我们开发了SCoexp，它使用CellTrek的坐标来检测感兴趣的细胞内的共表达基因模块. 首先，SCoexp计算出一个空间内核的权重矩阵. 利用这个权重矩阵，SCoexp计算空间加权基因共表达矩阵. 此后，SCoexp利用consensus clustering(CC)或加权相关网络分析(WGCNA)来识别基因模块. 对于确定的模块，我们可以计算模块得分并研究其空间组织.
Benchmarking and simulations.【单细胞论文记录(part9)--Spatial charting of single-cell transcriptomes in tissues】To benchmark the performance of CellTrek, we exploited three spatial datasets:
(1) a simulated scRNA-seq dataset with customized spatial patterns (Supplementary Fig. 2a,b)
(2) a fluorescence in situ hybridization (FISH)-based single-cell dataset of the Drosophila embryo (Supplementary Fig. 2d,e)
(3) a seqFISH dataset of mouse embryo (Supplementary Fig. 2g,h)
We generated three corresponding ST datasets with each spot aggregating the five spatially nearest cells (Supplementary Fig. 2c,f,i).
我们将CellTrek应用于scRNA-seq和ST数据，重建其空间细胞图(spatial cellular maps). 然后我们将CellTrek与另外两种细胞图谱方法进行比较:
(1) NVSP-CellTrek，它使用基于参考的novoSpaRc–一种空间重建方法来计算细胞空间概率矩阵，然后使用CellTrek来产生空间图.
(2) Seurat坐标转移(SrtCT)，使用数据转移方法将ST坐标转移到单细胞.
CellTrek和NVSP-CellTrek都重建了模拟数据的原始空间模式，而SrtCT只重建了一个粗略的空间细胞关系. 与NVSP-CellTrek相比，CellTrek绘制了更多的细胞，空间密度更高. 为了定量评估这些方法，我们用KL比较了细胞图谱结果的空间密度和不同细胞类型的原始空间分布. CellTrek和NVSP-CellTrek在低KL下都取得了良好的性能，而SrtCT显示出与参考分布的差异要大得多. 在果蝇胚胎数据中，CellTrek准确地重建了原始空间布局，在三种方法中KL值最小.
我们进一步调查了CellTrek结果中几个已知的果蝇胚胎发生基因，发现空间模式与以前的研究一致. 在小鼠胚胎数据中，我们发现CellTrek和NVSP-CellTrek准确地重建了原始的空间结构，而CellTrek在第5、9和17组显示出稍高的KL. 为了研究CellTrek是否能揭示小鼠胚胎发育的空间模式，我们选择了一组肠管细胞，发现一些标记基因的空间表达模式. 然后我们用Monocle2进行了轨迹分析，结果显示，伪时间反映了肠管细胞沿前后轴的空间发育轨迹.
接下来我们评估了CellTrek在三种不同模拟设置下的模拟数据的性能：(1) read counts, (2) spatial randomness and (3) tissue densities. 我们使用KL和Pearson’s相关性来评估CellTrek map和参考物之间细胞空间坐标的性能. 在不同的模拟条件下，CellTrek取得了良好的空间重建性能，与互换分布相比，显示出较低的KL值和较高的相关度. 然而，增加空间随机性将影响CellTrek的性能并降低统计学意义，而减少读数或spot/cell密度将导致稀疏的细胞图. 总的来说，这些数据表明，CellTrek是一种在不同实验条件下进行单细胞空间绘图的稳健方法.
Spatial cell charting of the mouse hippocampus我们还将CellTrek应用于Slide-seq v.2和scRNA-seq数据的小鼠海马数据. Slide-seq数据的无监督聚类确定了12个具有高度组织空间结构的聚类(G01-G12). CellTrek将单细胞映射到它们的空间位置，这与Slide-seq的类别一致. 值得注意的是，G06与Cornu Ammonis（CA）区域相匹配，而CellTrek显示了主要细胞CA1、CA2和CA3的顺序映射，而这是单独的Slide-seq聚类所不能解决的. 这些结果表明，CellTrek可以广泛地应用于不同的空间基因组平台，实现更精细的空间细胞分辨率.