scRNA-seq数据分析
2019-07-20
1 说在前面的话
本项目是将github上经典的scRNA-seq分析教程进行汉化,源项目参见hemberg-lab/scRNA.seq.course
1.1 关于本项目
随着技术发展的日新月异,现在对单个细胞进行高通量测序(scRNA-seq)获得其全基因组的表达谱数据成为可能。scRNA-seq的主要优势是其单细胞水平的分辨率和基因组范围检测能力可以解决其他方法难以解决的问题,比如bulk RNA-seq和RT-qPCR。然而,为了分析scRNA-seq数据,需要新的方法,并且一些针对bulk RNA-seq实验开发的方法的潜在假设也不再适用。
在本课程中,我们将讨论使用scRNA-seq可以解决的一些问题以及可用的计算和统计方法。 本课程通过University of Cambridge的Bioinformatics training unit进行教学,但该页面的材料适用于任何有兴趣了解scRNA-seq数据计算分析的人。 本课程每年讲授两次,每次授课前材料都会更新。
计算工具的数量正在迅速增加,我们正在尽最大努力跟上最新进展。 本课程的主要限制之一是我们倾向使用在R中实现且运行速度相当快的工具。 此外,我们还承认某种程度上偏向于我们或我们的朋友和同事开发的方法。
1.4 Docker 镜像
本课程提供包含所有必须软件的Docker镜像,可通过运行Docker镜像重复本课程的结果。
1.4.1 运行镜像
首先确保您的系统上安装了Docker。如果没有,请参照以下说明进行安装。运行本课程的Docker镜像(使用最新版而不是v3.13)。
docker run -p 8888:8888 -e PASSWORD="jupyter" quay.io/hemberg-group/scrna-seq-course:v3.13
然后按照以下提供的说明操作, 比如:
要访问NoteBook,在浏览器中打开此文件:
file:///home/jovyan/.local/share/jupyter/runtime/nbserver-6-open.html
或复制粘贴以下网址:
http://(a9ee1aad5398 or 127.0.0.1):8888/?token=22debff49d9aae3c50e6b0b5241b47eefb1b8f883fcb7e6d
Jupyter session会在web浏览器中打开(我们推荐使用Chrome浏览器)
1.4.1.1 Windows用户
Windows操作系统中容器的IP地址与127.0.0.1
(localhost
)不同。查找IP地址请运行:
docker-machine ip default
1.4.2 下载数据或其它文件
请点击New -> Terminal
打开一个终端,在新的终端窗口运行:
./poststart.sh
如果您想在Docker镜像外下载数据,您依然可以使用相同poststart.sh
脚本,但是您需要在您的计算机上安装AWS CLI。
Alternatively, you can browse and download the files in you web-browser by visiting this link
1.4.3 RStudio
返回到Jupyter浏览界面,将url中的tree
更改为rstudio
。RStudio server会打开课程文件,软件和数据文件夹。
1.5 手动安装
如果您没有使用本课程的Docker镜像,那么为了能够运行本课程所有的代码块,您需要克隆或下载GitHub仓,并在course_files
文件夹中启动R session,然后您还需要手动安装所有必须的软件。
或者您可以只安装感兴趣章节列出的软件。
1.6 许可
本课程所有资料均遵循GPL-3协议。 欢迎任何人浏览材料来学习scRNA-seq数据的分析。 如果您打算将这些材料用于您自己的教学,除了提供合适的引用外,如果您告诉我们,我们将不胜感激。
1.7 准备知识
本课程面向那些基本熟悉Unix和R脚本语言的人。同时我们还假设您熟悉传统bulk RNA-seq数据的比对和分析,以及常用的计算工具。
我们推荐在参加本课程前参加Introduction to RNA-seq and ChIP-seq data analysis 或者 Analysis of high-throughput sequencing data with Bioconductor