快速上手Cellranger

Cell Ranger

Cell Ranger是用于10x单细胞转录组数据处理一套Linux工具集,包含数据比对,生成表达矩阵,聚类分析和图形可视化等多个功能。一般用cell ranger进行上游分析。

官网:https://www.10xgenomics.com/support/software/cell-ranger/latest

由于测序仪器的测序能力远大于测试样本序列量,为避免仪器浪费,因此一个lane同时测定多个样品成为很自然的思路。然而为了区分多种样品的序列,就必须要给不同样品加上特定的“标签”,从而可以在后续数据分析时将不同样品数据分开,而这个“标签”就是barcode。10xBarcode是一段16nt的核苷酸序列(序列空间350万),在每一个Gel Beads中的Barcode序列都是一致的,在后面Barcode与细胞融合形成水凝珠之后,可以保证一个细胞的所有基因序列都带着相同的Barcode序列,也就可以认定这些序列来自同一个细胞。所以我们通常说Barcode序列是用来标记细胞的。Cellranger主要就是用于区分barcode的识别与所连reads的定量。

UMI(unique molecular identifier分子标签)

UMI是一段12nt的核苷酸序列(序列空间100万),但与Barcode序列不同的是,一个Gel Beads中UMI序列是不同的。UMI序列的空间很大,远多于需要检测的原始细胞的mRNA数量,(即使一种mRNA有多条,也是达不到UMI的序列空间的)。所以每一条mRNA都会带上一个独特的UMI。UMI的最大作用是去重和绝对定量。

可以这样理解:barcode是每个凝胶微珠的身份证号码;UMI是每个DNA标签分子的身份证号码

软件下载

mkdir cellranger #在目标路径下新建文件夹
cd cellranger#下载软件
wget -O cellranger-8.0.0.tar.gz "https://cf.10xgenomics.com/releases/cell-exp/cellranger-8.0.0.tar.gz?Expires=1714073771&Key-Pair-Id=APKAI7S6A5RYOXBWRPDA&Signature=CHmp~VHwcV2qCWGIk-wiR-LIT2FVFVny09DXCrksxPRGxI8llh6N87Z2kd4RQin5TH57AlpIjfh5iMdDw54pB3u7oMzANtgdQLd1AUA8FlPzikAvW6Kv02yCwvlpiGnFUwzYnr3aJuATgdgOJLT6RGJumRGt2PQVim45u1jkJ~DeahmRIuntllk8QJ4sOIHqAPvYoPTQ47NN5HXlqMIbw1K8-W7SHMTIXJ4PDudwblqf6xCJltxcLob1P2vD9nwutSsJrdvyaEblv1ZjPGFg5fXkw0Yk8H0He4MRGdhxDTLRgP2~Svneje4yglVQCu~Xe5Yd-UybpW6mhHiTx0GFdg__"#解压
tar -zxvf cellranger-8.0.0.tar.gz#添加环境量
export PATH=./path/cellranger/cellranger-8.0.0:$PATH#进入cellranger
cellranger

成功后返回如下:

图片

常用命令-mkgtf&mkref 建立索引文件

GTF文件(共9列):是对基因组进行注释的

mkgtf:Raw gtf—mkgtf—filtered gtf,从网上下载的GTF文件几乎包含所有基因,可以利用此命令将不需要的信息过滤掉。

常用命令-mkfastq 格式转换

可以用cellranger mkfastq将BCL格式文件转换为fastq文件。

BCL:测序仪得到的初始格式(测序公司才用的到,普通用户用不到)。

注意:在定量之前,必须先将格式按照要求修改,cell range对格式要求严格,正确格式如下:

[Sample Name]_S1_L00[Lane Number]_[Read Type]_001.fastq.gzRead Type:
T1:Sample index read(optional)
T2:Sample index read(optional)
R1:Read1
R2:Read2eg:
Test_S1_L001_R1_001.fastq.gz
Test_S1_L001_R2_001.fastq.gz

常用命令-count:对原始数据进行比对定量,最后得到基因-细胞的表达矩阵

图片

语法:

cellranger count--id #输出目录名--transcriptome #基因组索引文件路径--fastqs #FASTQ数据存放路径--sample #需要运行的样本名称--include-introns #定量时是否包含内含子(7.0版本默认为True)#下面非必选项--lanes #指定lane编号--no-bam #不输出Bam文件--nosecondary #不进行下游分析(仅定量)--ocalcores #指定最大核心数--localmem #指定最大内存(GB)

例如:

cellranger count--id sample_test--transcriptome /home/wangyan/cellranger/refdata-gex-GRCh38-2020-A--fastqs /home/wangyan/cellranger/sample_fastqs--sample Sample_1--include-introns false

如果运行成功会出现以下这串代码:

图片

输出的文件包括以下内容:

图片

其中的reanalyze input文件可以用于下游的Seurat分析。

如果在前面的命令中设置了--nosecondary fasle,则cellranger不进行进一步下游分析:

图片

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/9389.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

VMware Fusion和centos 8的安装

资源 本文用到的文件:centos8镜像 , VMware 软件包 , Termius 文件链接: https://pan.baidu.com/s/1kOES_ZJ8NGN-BnJl6NC7Sg?pwd63ct 安装虚拟机 先 安装 vmware ,然后打开,将下载的 iso 镜像拖入 拖入镜像文件iso Continue, 然后随便选…

PL端:LED闪烁

实验环境 vivado2024.1 实验任务 LED闪烁 引脚关系 硬件配置 新建一个vivado实验 创建 Verilog HDL 文件点亮 LED 点击 Project Manager 下的 Add Sources 图标(或者使用快捷键 AltA) 编辑led.v module led(input sys_clk,input rst_n,outp…

Pytorch学习--神经网络--损失函数与反向传播

一、对于损失函数的理解 计算实际输出和目标之间的差距为我们更新输出提供一定的依据 二、头文件 nn.L1Loss 大概含义: 代码: import torch from torch.nn import L1Lossoutput torch.tensor([1,2,3],dtypefloat) target torch.tensor([1,2,5],dt…

多功能声学气膜馆:打造移动歌剧院新体验—轻空间

在广场、公园,甚至是郊野之间,多功能声学气膜馆为歌剧表演带来了全新的移动体验。作为高品质演出场馆,它不仅具备卓越的声学效果,还拥有灵活的搭建与拆卸能力,使艺术表演不再受限于固定的场地,让更多人得以…

构建智能防线 灵途科技光电感知助力轨交全向安全防护

10月27日,在南京南站至紫金山东站间的高铁联络线上,一头野猪侵入轨道,与D5515次列车相撞,导致设备故障停车。 事故不仅造成南京南站部分列车晚点,还在故障排查过程中导致随车机械师因被邻线限速通过的列车碰撞而不幸身…

DMX配置文件生成工具使用举例

最新软件版本: MaintainTool-v0.0.1-20241107. 如所用软件低于该版本,本文档描述可能有所差异,请索取最新版本软件再阅读本文档. (软件右上角处查看软件版本) 一、基础知识 这里结合一个示例工程来进行说明. 所用灯带: 使用两种型号的线条灯, XT1(一米八段,即8个…

kafka安装部署--详细教程

2.1 安装部署 每次进入 linux 都会自动进入 base 环境,如何关闭 base conda deactivate 手动关闭 conda config --set auto_activate_base false 关闭自动进入 2.1.1 集群规划 bigdata01 bigdata02 bigdata03 zk zk zk kafka kafka kafka 2.1.2 集群部…

工具进阶:如何利用 MAT 找到问题发生的根本原因

深入浅出 Java 虚拟机 作者: 李国 我们知道,在存储用户输入的密码时,会使用一些 hash 算法对密码进行加工,比如 SHA-1。这些信息同样不允许在日志输出里出现,必须做脱敏处理,但是对于一个拥有系统权限的攻击…

当AI遇上时尚:未来的衣橱会由机器人来打理吗?

内容概要 在当今这个快速发展的时代,人工智能与时尚的结合正在逐渐改写我们对衣橱管理的认知。传统的衣橱管理常常面临着空间不足、穿搭单调及库存过多等挑战,许多人在挑选服饰时难以做出决策。然而,随着技术的进步,智能推荐和自…

[OpenGL]使用OpenGL实现硬阴影效果

一、简介 本文介绍了如何使用OpenGL实现硬阴影效果,并在最后给出了全部的代码。本文基于[OpenGL]渲染Shadow Map,实现硬阴影的流程如下: 首先,以光源为视角,渲染场景的深度图,将light space中的深度图存储…

Kafka中如何做到数据唯一,即数据去重?

数据传递语义 至少一次(At Least Once) ACK级别设置为-1 分区副本大于等于2 ISR里应答的最小副本数量大于等于2 可以保障数据可靠 • 最多一次(At Most Once) ACK级别设置为0 • 总结: At Least Once可以保证数据不…

惊爆:抖音小程序广告掘金计划,游戏+广告双赢新趋势!

惊爆:抖音小程序广告掘金计划,游戏广告双赢新趋势! 在当今信息爆炸的时代,抖音小程序广告掘金计划犹如一股清流,为游戏开发者、广告商以及广大用户带来了前所未有的机遇与财富。这一计划不仅融合了游戏的趣味性和广告的…

黑豹X2 armbian 编译rkmpp ffmpeg 实现CPU视频转码

硬件 arm64 4核cpu 4G内存 rk3566 1.编译rockmpp git clone https://gitee.com/hermanchen82/mpp.git 下载之后 进到 rkmpp\build\linux\aarch64目录 armbian的不需要做任何修改 直接执行 make-Makefiles.bash make && make install 编译完成后 会安装到…

《深度学习》YOLO V4 整体架构的由来及用法 详解

目录 一、关于YOLOv4 1、什么是YOLOv4 2、相较于YOLOv3 二、YOLO v4数据增强的做法 1、 Bag of freebies 2、关于数据增强 1)概念 2)种类 3、v4数据增强方法 1)马赛克数据增强 • 由来 • 关于CutMix: 2)…

【VR】PICO 手部追踪 steamvr内无法识别,依旧识别手柄的解决方案

一、问题描述 && 原因分析 1.PICO4 手部追踪 steamvr内无法识别,依旧识别手柄的解决方案 尽管平放(或关闭手柄连接)之后,在 PICO 一体机中进入了手部追踪状态, 但只要进入 steamvr,就无法正确识别…

Go 中的泛型,日常如何使用

泛型从 go 的 1.18 开始支持 什么是泛型编程 在泛型出现之前,如果需要计算两数之和,可能会这样写: func Add(a, b int) int {returb a b } 这个很简单,但是只能两个参数都是 int 类型的时候才能调用 如果想要计算两个浮点数…

年度目标5w浏览量达成

目录 前言:目标展示:达成展示: 前言: 去年定了一个目标,今年实现了,以后继续加油,争取2025可以获得15w的阅览量,3000的粉丝数量。 目标展示: 达成展示:

【Python TensorFlow】进阶指南(续篇一)

在前两篇文章中,我们介绍了TensorFlow的基础知识及其在实际应用中的初步使用,并探讨了更高级的功能和技术细节。本篇将继续深入探讨TensorFlow的高级应用,包括但不限于模型压缩、模型融合、迁移学习、强化学习等领域,帮助读者进一…

你不得不知的几种常见的向量数据库产品

产品介绍 在使用 LLM(大型语言模型)知识库时,经常会用到以下几种向量数据库: Milvus:这是一款开源的向量数据库,具有高度可扩展性和高性能。它支持多种向量相似性搜索算法,适用于大规模数据处理…

企业IT架构转型之道:阿里巴巴中台战略思想与架构实战感想

文章目录 第一章:数据库水平扩展第二章:中台战略第三章:阿里分布式服务架构HSF(high speed Framework)、早期Dubbo第四章:共享服务中心建设原则第五章:数据拆分实现数据库能力线性扩展第六章&am…