1. 首页
  2. 数据库
  3. 其它
  4. scShapes:用于建模和识别单细胞RNA测序数据中差异分布的统计框架 源码

scShapes:用于建模和识别单细胞RNA测序数据中差异分布的统计框架 源码

上传者: 2021-03-11 11:24:03上传 ZIP文件 28.96KB 热度 27次
scShapes 我们提出了一种新的统计框架,用于通过使用广义线性模型(GLM)对基因表达读取计数进行建模,从而确定治疗条件之间单细胞RNA测序(scRNA-seq)数据中的差异分布。 我们使用对数链接函数和基于模型的差异归一化,在每种治疗条件下使用误差分布泊松(P),负二项式(NB),零膨胀泊松(ZIP)和零膨胀负二项式(ZINB)独立地对每个基因建模在测序深度上。 由于我们框架中考虑的所有四个分布都属于同一分布家族,因此我们首先执行Kolmogorov-Smirnov(KS)测试以选择属于ZINB分布家族的基因。 然后,将使用GLM对通过KS测试的基因进行建模。 通过计算贝叶斯信息准则和似然比检验统计量来完成模型选择。 尽管大多数用于差异基因表达分析的方法旨在检测表达平均值的变化,但是单细胞数据是由过度分散和缺失驱动的,这些缺失和分布要求统计分布能够处理多余的零。 通过对基因表达分
下载地址
用户评论