单细胞分析的环境配置(Seurat)
本文为单细胞分析系列文章的第二篇。主要讲述如何在Linux环境下安装Seurat和jupyter等开发环境的操作过程。
一、Linux基本指令学习
这一部分的内容可以参考《Linux指令速查手册》。常用指令如下:
- 列出文件:
ls - 切换目录:
cd <目录名称> - Linux文件权限:可读(r),可写(w),可执行(x)。使用
ls -l可以清晰查看每个文件的权限和属性 chmod +x指令 赋予一个文件可执行权限(就像Windows上运行一个exe)
二、安装conda环境
Anaconda是一个著名的数据科学分析环境,也可以理解为一个专门用于数据科学分析的Python包管理器。Miniconda是其精简版,只包括了Python和conda本身,去除了一些预装的软件包。在Linux服务器上,我们常常使用的是后者。
可以从Anaconda的 官方下载地址 下载安装包,但是一个更为方便的方法是使用镜像站(如 TUNA清华源 )。镜像站中的文件下载链接类似 Miniconda3-py313_25.9.1-1-Linux-x86_64.sh ,其中py313表示核心python版本为3.13,25.9.1则对应着发布时间, Linux-x86_64 则是系统和CPU架构,一般的服务器选择 x86_64 架构的即可,除非学校有特殊说明(例如华为鲲鹏系列的ARM服务器)。选择尽可能新的版本下载。
注意到,上述安装包是 .sh 格式,这意味着其为自解压、自安装文件,因此安装过程很简单,只需要直接运行即可。
下面是Linux上运行的具体指令:
1 | wget https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/Miniconda3-py313_25.9.1-1-Linux-x86_64.sh # 或者其他的下载链接 |
- 安装程序运行起来之后,会有一些选项,按提示操作即可。
- 首先是用户协议(RELU),使用方向键可以滚动阅读文本,按q退出阅读,之后输入yes即可同意协议。
- 接下来会选择安装位置。如果没有特殊需求,可以直接按回车键(ENTER),即使用默认设置。
- 安装过程会持续几分钟,一般来说屏幕上会有进度条。进度条走完以后还会询问是否改写bashrc配置文件,这里用它的默认选项就行。
随后是一点后续工作,包括激活conda环境以及conda换源。
- 激活conda环境:
conda activate。 如果提示找不到conda指令(一般意味着bashrc中的环境变量设置还没有生效),则可以运行~/miniconda3/bin/conda activate,原理是使用conda的实际路径去运行conda;也可以重启或者重新SSH登录以解决。 - conda换源:conda安装软件包时,需要从服务器上下载安装包,而anaconda官方服务器在海外,访问速度很慢,因此国内建立了许多镜像站,方便conda的软件包下载。修改软件源的目的是提高软件包的下载速度,方法可以参考这一教程,或者见下图(原理上就是修改
~/.condarc这个文件的内容,让几个channel都指向国内镜像站)。


三、使用conda安装Seurat
这一部分主要讲如何实操,关于背后的原理不再赘述。
1 | ## step1: 创建R环境 |
另外,在 anaconda.org/ 这个网站上,可以查询软件包的包名、版本号以及提供安装的channel列表(如下图),例如我们搜索seurat这个包,检索到的包名为 r-seurat ,在 r 、 conda-forge 、bioconda 这三个channel上均有提供,但版本号各有不同,因此我们可以通过指定channel或者版本号来自定义安装。

四、使用conda安装jupyter和Irkernel
这一步主要是方便我们在jupyter notebook中(以及vscode中),直观的运行R代码并查看结果。相比于Rscript需要完整运行才能看结果,或者Rmarkdown这种代码与结果分开存储的格式,jupyter notebook(.ipynb)的代码和结果存储在一起,非常直观方便了属于是。
不过需要注意,jupyter notebook原生只支持python,如果想要运行R代码,需要安装和配置Irkernel
下面是具体过程,总共分为两个步骤。
step1:在Linux shell中运行下面的代码
1 | # 先安装jupyter |
step2:然后进入r,运行
1 | IRkernel::installspec() |
五、在jupyter中运行Seurat分析代码
这一部分内容敬请期待下期推送。