Table of Contents
1
说在前面的话
1.1
关于本项目
1.2
视频
1.3
GitHub
1.4
Docker 镜像
1.4.1
运行镜像
1.4.2
下载数据或其它文件
1.4.3
RStudio
1.5
手动安装
1.6
许可
1.7
准备知识
1.8
联系我们
2
scRNA-seq介绍
2.1
Bulk RNA-seq
2.2
scRNA-seq
2.3
工作流程
2.4
计算分析
2.5
挑战
2.6
实验方法
2.7
如何选择合适的平台
3
scRNA-seq原始数据处理
3.1
FastQC
3.1.1
解决方案并下载报告
3.2
移除接头和低质量碱基
3.2.1
Solution
3.3
文件格式
3.3.1
FastQ
3.3.2
BAM
3.3.3
CRAM
3.3.4
手动查看文件
3.3.5
Genome (FASTA, GTF)
3.4
测序文库拆分
3.4.1
鉴定含有细胞的液滴/微孔
3.5
使用STAR比对read
3.5.1
STAR比对命令
3.6
Kallisto和Pseudo-Alignment
3.6.1
k-mer是什么?
3.6.2
为什么比对k-mer而不是reads?
3.6.3
Kallisto伪比对模式
3.6.4
Kallisto Pseudo-Alignment命令
3.6.5
理解Kallisto输出结果
4
构建表达矩阵
4.1
质量控制
4.2
Reads 比对
4.3
比对示例
4.4
Mapping QC
4.5
Reads定量
4.6
唯一分子标识符
4.6.1
UMI介绍
4.6.2
比对条形码序列
4.6.3
Barcodes计数
4.6.4
错误校正
4.6.5
下游分析
5
R/Bioconductor介绍
5.1
安装R包
5.1.1
CRAN
5.1.2
Github
5.1.3
Bioconductor
5.1.4
源码安装
5.2
安装说明:
5.3
数据类型/类
5.3.1
数值
5.3.2
字符/字符串
5.3.3
逻辑值
5.3.4
因子
5.3.5
检查数据类型
5.4
基本数据结构
5.5
更多信息
5.6
数据类型
5.6.1
什么是整洁的数据
5.6.2
什么是Rich data?
5.7
Bioconductor,
SingleCellExperiment
和
scater
5.7.1
Bioconductor
5.7.2
SingleCellExperiment
类
5.7.3
scater
包
5.8
ggplot2介绍
5.8.1
ggplot2是什么?
5.8.2
ggplot2j原则
5.8.3
使用
aes
映射函数
5.8.4
Geoms
5.8.5
绘制2个以上细胞的数据
5.8.6
绘制热图
5.8.7
主成分分析
6
Tabula Muris
6.1
介绍
6.2
下载数据
6.3
读取Smartseq2数据
6.4
构建scater对象
6.5
读取10X数据
6.6
创建scater对象
6.7
进阶练习
7
表达矩阵质控
7.1
UMI表达质控
7.1.1
介绍
7.1.2
Tung数据集
7.1.3
细胞质控
7.1.4
细胞过滤
7.1.5
手工过滤和自动过滤比较
7.1.6
基因分析
7.1.7
保存数据
7.1.8
大作业
7.2
Reads表达质控
7.3
数据可视化
7.3.1
介绍
7.3.2
PCA plot
7.3.3
tSNE可视化
7.3.4
大作业
7.4
Reads数据可视化
7.5
识别混淆因子
7.5.1
介绍
7.5.2
和组成分的相关性
7.5.3
解释变量
7.5.4
其它混淆因子
7.5.5
练习
7.6
识别READS中混淆因子
7.7
标准化理论
7.7.1
介绍
7.7.2
文库大小
7.7.3
标准化
7.7.4
Effectiveness
7.8
UMI标准化练习
7.8.1
Raw
7.8.2
CPM
7.8.3
scran
7.8.4
下采样
7.8.5
基因/转录本长度标准化
7.8.6
练习
7.9
Reads标准化练习
7.10
处理混淆因子
7.10.1
介绍
7.10.2
移除不需要的变异
7.10.3
Combat
7.10.4
mnnCorrect
7.10.5
GLM
7.10.6
Harmony
7.10.7
评价和比较混淆因子去除策略
7.10.8
大作业
7.11
处理Reads中混淆因子
8
生物学分析
8.1
聚类介绍
8.1.1
介绍
8.1.2
降维
8.1.3
聚类方法
8.1.4
聚类的挑战
8.1.5
scRNA-seq数据的工具
8.1.6
比较聚类结果
8.2
聚类示例
8.2.1
Deng 数据集
8.2.2
SC3
8.2.3
tSNE + kmeans
8.2.4
SINCERA
8.3
特征选择
8.3.1
识别基因与null模型
8.3.2
Correlated Expression
8.3.3
比较不同的方法
8.4
伪时间分析
8.4.1
Deng数据初探
8.4.2
TSCAN
8.4.3
monocle
8.4.4
Diffusion maps
8.4.5
SLICER
8.4.6
Ouija
8.4.7
方法比较
8.4.8
Expression of genes through time
8.5
Imputation
8.5.1
scImpute
8.5.2
DrImpute
8.5.3
MAGIC
8.6
差异表达分析
8.6.1
Bulk RNA-seq
8.6.2
Single cell RNA-seq
8.6.3
分布的差异
8.6.4
scRNA-seq数据模型
8.7
差异表达分析实战
8.7.1
介绍
8.7.2
Kolmogorov-Smirnov test
8.7.3
Wilcox/Mann-Whitney-U Test
8.7.4
edgeR
8.7.5
Monocle
8.7.6
MAST
8.7.7
Slow method(>1h)
8.8
比较/组合scRNA-seq数据集
8.8.1
介绍
8.8.2
Datasets
8.8.3
scmap
8.8.4
细胞间映射
8.8.5
Metaneighbour
8.8.6
mnnCorrect
8.8.7
典型相关分析 (Seurat)
8.9
检索scRNA-seq数据
8.9.1
About
8.9.2
数据集
8.9.3
基因索引
8.9.4
Marker基因
8.9.5
搜索基因列表
8.9.6
In-silico gating
8.9.7
sessionInfo()
9
Seurat
9.1
构建Seurat对象
9.2
标准预处理流程
9.2.1
质控和选择细胞
9.3
数据标准化
9.4
检测高可变基因
9.5
缩放数据并删除不需要的变异来源
9.6
线性降维
9.7
统计显著主成分
9.8
聚类
9.9
非线性降维
9.10
运行UMAP
9.11
差异表达分析
9.12
确定cluster细胞类型
9.13
细分细胞类型
9.14
sessionInfo()
10
“理想”scRANA-seq流程
10.1
实验设计
10.2
reads处理
10.3
准备表达矩阵
10.4
生物学解释
11
进阶练习
12
相关资源
12.1
scRNA-seq protocols
12.2
External RNA Control Consortium (ERCC)
12.3
scRNA-seq分析工具
12.4
scRNA-seq公共数据集
13
References
碱基吃柠檬
scRNA-seq数据分析
12
相关资源
12.1
scRNA-seq protocols
SMART-seq2
CELL-seq
Drop-seq
UMI
STRT-Seq
12.2
External RNA Control Consortium (ERCC)
ERCCs
12.3
scRNA-seq分析工具
用于单细胞数据分析的软件包:
awesome-single-cell
Tallulah Andrews的单细胞分析脚本:
scRNASeqPipeline
12.4
scRNA-seq公共数据集
Hemberg实验室公共数据集