单细胞分析的环境配置(Seurat)

本文为单细胞分析系列文章的第二篇。主要讲述如何在Linux环境下安装Seurat和jupyter等开发环境的操作过程。

一、Linux基本指令学习

这一部分的内容可以参考《Linux指令速查手册》。常用指令如下:

  • 列出文件: ls
  • 切换目录: cd <目录名称>
  • Linux文件权限:可读(r),可写(w),可执行(x)。使用 ls -l 可以清晰查看每个文件的权限和属性
  • chmod +x 指令 赋予一个文件可执行权限(就像Windows上运行一个exe)

二、安装conda环境

Anaconda是一个著名的数据科学分析环境,也可以理解为一个专门用于数据科学分析的Python包管理器。Miniconda是其精简版,只包括了Python和conda本身,去除了一些预装的软件包。在Linux服务器上,我们常常使用的是后者。

可以从Anaconda的 官方下载地址 下载安装包,但是一个更为方便的方法是使用镜像站(如 TUNA清华源 )。镜像站中的文件下载链接类似 Miniconda3-py313_25.9.1-1-Linux-x86_64.sh ,其中py313表示核心python版本为3.13,25.9.1则对应着发布时间, Linux-x86_64 则是系统和CPU架构,一般的服务器选择 x86_64 架构的即可,除非学校有特殊说明(例如华为鲲鹏系列的ARM服务器)。选择尽可能新的版本下载。

注意到,上述安装包是 .sh 格式,这意味着其为自解压、自安装文件,因此安装过程很简单,只需要直接运行即可。

下面是Linux上运行的具体指令:

1
2
3
wget https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/Miniconda3-py313_25.9.1-1-Linux-x86_64.sh # 或者其他的下载链接
chmod +x Miniconda3-py313_25.9.1-1-Linux-x86_64.sh # 授予可执行权限。文件名要和刚刚下载的一致
bash ./Miniconda3-py313_25.9.1-1-Linux-x86_64.sh # 运行安装程序
  • 安装程序运行起来之后,会有一些选项,按提示操作即可。
  • 首先是用户协议(RELU),使用方向键可以滚动阅读文本,按q退出阅读,之后输入yes即可同意协议。
  • 接下来会选择安装位置。如果没有特殊需求,可以直接按回车键(ENTER),即使用默认设置。
  • 安装过程会持续几分钟,一般来说屏幕上会有进度条。进度条走完以后还会询问是否改写bashrc配置文件,这里用它的默认选项就行。

随后是一点后续工作,包括激活conda环境以及conda换源。

  • 激活conda环境: conda activate 。 如果提示找不到conda指令(一般意味着bashrc中的环境变量设置还没有生效),则可以运行 ~/miniconda3/bin/conda activate ,原理是使用conda的实际路径去运行conda;也可以重启或者重新SSH登录以解决。
  • conda换源:conda安装软件包时,需要从服务器上下载安装包,而anaconda官方服务器在海外,访问速度很慢,因此国内建立了许多镜像站,方便conda的软件包下载。修改软件源的目的是提高软件包的下载速度,方法可以参考这一教程,或者见下图(原理上就是修改 ~/.condarc 这个文件的内容,让几个channel都指向国内镜像站)。

image.png

image.png

三、使用conda安装Seurat

这一部分主要讲如何实操,关于背后的原理不再赘述。

1
2
3
4
5
6
## step1: 创建R环境
conda create -n r
conda install conda-forge::mamba # 安装mamba解析器,以加快包安装速度
## step2: 为R环境安装软件
mamba install -n r r::r-base # 意思是安装r这个channel上的r-base包
mamba install -n r conda-forge::r-seurat # 意思是安装conda-forge这个channel上的r-seurat包

另外,在 anaconda.org/ 这个网站上,可以查询软件包的包名、版本号以及提供安装的channel列表(如下图),例如我们搜索seurat这个包,检索到的包名为 r-seurat ,在 rconda-forgebioconda 这三个channel上均有提供,但版本号各有不同,因此我们可以通过指定channel或者版本号来自定义安装。

image.png

四、使用conda安装jupyter和Irkernel

这一步主要是方便我们在jupyter notebook中(以及vscode中),直观的运行R代码并查看结果。相比于Rscript需要完整运行才能看结果,或者Rmarkdown这种代码与结果分开存储的格式,jupyter notebook(.ipynb)的代码和结果存储在一起,非常直观方便了属于是。

不过需要注意,jupyter notebook原生只支持python,如果想要运行R代码,需要安装和配置Irkernel

下面是具体过程,总共分为两个步骤。

step1:在Linux shell中运行下面的代码

1
2
3
4
# 先安装jupyter
mamba install -n r conda-forge::jupyter
# 再安装jupyter的R内核
mamba install -n r r::r-irkernel

step2:然后进入r,运行

1
IRkernel::installspec()

五、在jupyter中运行Seurat分析代码

这一部分内容敬请期待下期推送。