微生物多样性数据的可视化技巧

在数据中穿梭找寻答案,是我们在探索微生物世界的过程中必不可少的一环。然而,单调的数据分析报告是否让你感觉枯燥乏味?这时候数据可视化的技术可就要来大展神通咯!利用图表和图形唤醒沉睡的数据,科学与艺术的搭配,让数据变得直观明了,令你的研究结果可大放异彩!

多样性分析往往是我们在得到物种丰度表格后做的第一个基础分析,可以探究不同组之间的多样性差异,进一步延伸出更关键的科学问题。一般来说,我们可以将其分为α-多样性分析β-多样性分析

α-多样性通常用来描述单个样本中物种的丰富度和均匀度。可以揭示不同生境或实验处理条件下微生物群落的复杂性和稳定性。常用一些指数去表征,包括Shannon,Simpson以及Chao1等。β-多样性β-多样性描述的是不同样本间的物种组成差异,反映了生物群落在空间或时间上的变化。可以探究不同环境因素如何影响生物群落结构的变动。β-多样性分析通常包括计算样本间的距离(如Bray-Curtis距离或Jaccard距离),然后使用这些距离矩阵进行排序分析,如主坐标分析(PCoA)或非度量多维尺度(NMDS)。对于alpha多样性一般使用箱线图或者柱状图进行展示,并加上对应的统计检验结果。beta多样性的可视化一般是通过上面讲到的距离算法以及排序后,取结果的1/2轴进行二维散点图进行展示,将不同颜色映射到分组上,一般会加上一些辅助图形以便更好看出规律。

在区分明显的分析结果中,可以使用置信度椭圆或者点连线多边形进行平面绘制。但在区分不明显的分析结果中,一般使用质心-样品点连线的方式,以获得更好的区分度。

代码:

# alpha
ggplot()+
geom_boxplot()+
geom_signif()# 加统计检验标注

# beta
ggplot()+
geom_point()+
stat_ellipse()+# 加置信度椭圆,level参数指定阈值
geom_segment()+ # 可以绘制质心向样品点连线
geom_encircle() # 绘制外点连线

接下来我们结合一些文献图表案例讲解,如何去展示微生物多样性。  


图片

Divergent bacterial alpha diversity maturation patterns are observed in the first year of life. A Bacterial Shannon and Chao1 alpha diversity indices at 3 and 12 months of age, assessed by Mann–Whitney U test (3 months: n = 99, 12 months: n = 99). B Comparison of bacterial beta diversity using the Bray–Curtis dissimilarity index at 3 and 12 months, assessed by PERMANOVA (3 months: n = 99, 12 months: n = 99). Ellipses represent 95% CI. C Changes in bacterial alpha diversity (Shannon index) per individual from 3 to 12 months, assessed by paired t-test (increase: n = 74, decrease: n = 24; see Figure S2A for bacterial richness). D Comparison of bacterial beta diversity using the Bray–Curtis dissimilarity index by alpha diversity trend at 3 and 12 months, assessed by PERMANOVA (increase: n = 74, decrease: n = 24; see Figure S2B for bacterial richness trend). Ellipses represent 95% CI.

上面案例是关于婴儿出生后1年内肠道细菌群落的相关分析,有第3个月取样点和第12个月取样点。图1A使用箱线图展示了α多样性(Shannon指数)和物种丰富度(Chao1指数)从3个月到12个月的显著增加,而图1C是图1A的另一种表现形式,作者使用了对应关系的样本进一步揭示了α多样性的变化趋势。图1B则展示了β多样性的减少(第12个月的95%置信度椭圆小于第3个月的,越集中),说明12个月大的婴儿间微生物组成差异的降低。


在一些分析中,也可以不使用排序,而直接使用距离去表示样品间差异。

图片

Community dissimilarity in four niches between the low-Cd cultivar XS14 and hybrid cultivar YY17. In panels (a, d), asterisks labeled implies the significant difference (P < 0.05) determined by Student’s t tests. ‘NS’ represents no significant differences.

低镉品种 XS14 和杂交品种 YY17 在块土、根际土、根表面和内生圈四个生态位的细菌群落差异。图c使用Bray-Curtis距离和NMDS排序, XS14和YY17均根据生态位形成不同的簇,在两侧加上密度分布,可以直观看出在NMDS1轴上具有更好的区分。图d则是使用组内样品的Bray-Curtis距离作为Y轴,可以看出与 YY17 相比,XS14 的细菌群落在除了块土之外的生态位中差异相对较高,表明XS14在根相关生态位中拥有更复杂和多功能的微生物群落。


而对于辅助图形的选择一般倾向于使得分组间的规律更明显的类型。

图片

Legacy effects of plant communities on microbiomes. Plant community identity effects on bacterial a–d and fungal (e–h) communities in caterpillars, leaves, roots, and soil. NMDS plots are presented based on Bray–Curtis similarity. The 2D stress value for each panel ranges between 0.11–0.18. Soils originating from grass communities are presented with light green symbols, soils from forb communities with turquoise symbols and soils from mixed grass and forb communities with dark green symbols. In each panel, smaller symbols depict individual samples, centroids are depicted with larger markers. Significance of the plant community treatment effect based on a PERMANOVA is also presented in each panel. a, e represent the composition of microbiomes in soils, b, f microbiomes in caterpillars both on intact plants and on detached leaves. c, g microbiomes in roots and d, h microbiomes in leaves. The effect of plant community growth rate (fast- and slow-growing communities) is shown in Supplementary Fig. 14.

上面案例是关于植食昆虫微生物组的相关研究,基于Bray-Curtis和NMDS分析植物群落对土壤、毛虫肠道、根系、植物叶片细菌群落的影响(图a-d )以及植物群落对土壤、毛虫肠道、根系、植物叶片真菌群落的影响(图e-h)。作者这里使用了质心-样品点连线的辅助线,并放大质心点的大小,会比使用椭圆更直观地展示分组间的规律。  


下面我们使用e图的模拟数据进行绘制,看看不同的辅助图形的效果:

代码:

library('vegan')
library('ggplot2')
library('dplyr')
library("ggalt")
# NMDS结果可以通过metaMDS函数得到
# 这里直接读取模拟数据
pic_e_data = read.csv("./pic_e_sactter_data.txt",sep = "\t",header = T)
# 准备中心点数据
# 需要先计算质点,为各分组的均值
# 计算每个分组的质心
centroids <- pic_e_data %>%
group_by(group) %>%
summarise(cent_NMDS1 = mean(NMDS1), cent_NMDS2 = mean(NMDS2))

# 将质心数据添加到原始数据框中,匹配对应分组
pic_e_data <- pic_e_data %>%
left_join(centroids, by = "group")
head(pic_e_data)
# NMDS1 NMDS2 group cent_NMDS1 cent_NMDS2
#1 -1.50 0.1 g1 -0.3735294 -0.09470588
#2 -1.00 0.2 g1 -0.3735294 -0.09470588
# 绘制一个散点图,按分组group进行着色
p0 <- ggplot(pic_e_data, aes(x = NMDS1, y = NMDS2, color = group)) +
geom_point()+
labs(x = "NMDS1", y = "NMDS2") +
theme_bw() +
theme(panel.grid.major = element_blank(),
panel.grid.minor = element_blank())

# 添加0.95置信椭圆
p1 = p0 + stat_ellipse(type = "norm", level = 0.95, linetype = "dashed", size = 1)

# geom_encircle 外点连线
p2 = p0 + geom_encircle(s_shape=1, expand=0)

# 质心-样品点连线
p3 = p0 + geom_segment(aes(xend = cent_NMDS1, yend = cent_NMDS2)) +
geom_point(data = centroids, aes(x = cent_NMDS1, y = cent_NMDS2), size = 5) # 加粗显示质心

图片

可以看到,对于此数据来说想体现分组间的差异规律,最好是使用质心-样品点连线作为辅助线。


我们的旅程从数字的海洋跃起,现在正停泊在了悦目的视觉码头。通过可视化技术,您的数据不再是晦涩难懂的数字,它们将变成讲述生命故事的图符,每一张图表都展示了自然界的复杂性与和谐。快来做笔记,开始你的可视化之旅吧!

参考文献:

[1] Mercer E M, Ramay H R, Moossavi S, et al. Divergent maturational patterns of the infant bacterial and fungal gut microbiome in the first year of life are associated with interkingdom community dynamics and infant nutrition[J]. Microbiome, 2024, 12(1): 22.

[2] Hannula S E, Zhu F, Heinen R, et al. Foliarfeeding insects acquire microbiomes from the soil rather than the host plant[J]. Nature Communications, 2019, 10(1): 1254.

[3] Cheng Z, Zheng Q, Shi J, et al. Metagenomic and machine learning-aided identification of biomarkers driving distinctive Cd accumulation features in the rootassociated microbiome of two rice cultivars[J]. ISME Communications, 2023, 3(1): 1-13.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/149996.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

llamafactory0.9.0微调qwen2vl

LLaMA-Factory/data/README_zh.md at main hiyouga/LLaMA-Factory GitHubEfficiently Fine-Tune 100+ LLMs in WebUI (ACL 2024) - LLaMA-Factory/data/README_zh.md at main hiyouga/LLaMA-Factoryhttps://github.com/hiyouga/LLaMA-Factory/blob/main

2.2 信道的极限容量

奈奎斯特定理 香农定理 &#x1f30f;总结

Centos redis下载安装以及redis manager连接详细教程

一、redis下载以安装&#xff1a; 1.切换到home目录下 cd /home&#xff08;/是根目录&#xff0c;./是当前目录 ../是父目录&#xff09; 2.执行wget http://download.redis.io/releases/redis-5.0.2.tar.gz&#xff08;这里&#xff0c;不知道为什么安装6开头的版本在make的…

增强GPT4v的Grounding能力,image-level

论文地址&#xff1a;arxiv.org/pdf/2310.11441 代码地址&#xff1a;

Linux环境的JDK安装

1.搜索可用的jdk yum search jdk/(或者是要安装的版本java-11)2.安装需要的版本 yum install java-11-openjdk.x86_643.验证是否安装成功 java -version4.配置环境变量 通过yum安装的默认路径为&#xff1a;/usr/lib/jvm cd /etc/profile.d/ touch java_home.sh vim java_…

不靠学历,不拼年资,怎么才能月入2W?

之前统计局发布了《2023年城镇单位就业人员年平均工资情况》&#xff0c;2023年全国城镇非私营单位和私营单位就业人员年平均工资分别为120698元和68340元。也就是说在去年非私营单位就业人员平均月薪1W&#xff0c;而私营单位就业人员平均月薪只有5.7K左右。 图源&#xff1a;…

软件测试 -- 功能测试--测试用例设计(方法)

(测试用例写完&#xff0c;一般会进行用例评审&#xff0c;目的是对测试用例进行审查和评估&#xff0c;以确保测试用例的质量和完整性&#xff0c;从而提高测试的有效性和效率。用例评审通常由测试小组中的多个成员参与&#xff0c;包括测试人员、开发人员、业务分析师和项目经…

GPU 算力与 CUDA 版本对应关系

1. 查询 GPU 算力&#xff08;Compute Capability&#xff09; https://developer.nvidia.com/cuda-gpus#compute 2. GPU 算力与 CUDA 版本对应关系 2.1. 信息来源 1 NVIDIA Datacenter Drivers :: NVIDIA Data Center GPU Driver Documentation 2.2. 信息来源 2 https://e…

如何在openEuler上安装和配置openGauss数据库

本文将详细介绍如何在openEuler 22.03 LTS SP1上安装和配置openGauss数据库&#xff0c;包括数据库的启动、停止、远程连接配置等关键步骤。 1、安装 使用OpenEuler-22.03-LTS-SP1-x64版本的系统&#xff0c;通过命令行安装openGauss数据库。 1.1、确保系统软件包索引是最新…

ret2dl_resolve

前言&#xff1a; ret2dl_resolve 是一种利用漏洞进行攻击的技术&#xff0c;主要针对使用动态链接库的程序。它的核心原理是利用程序的重定位机制&#xff0c;通过构造特定的函数返回地址&#xff0c;来劫持控制流并执行攻击者选择的代码。以下是对 ret2dl_resolve 原理的详细…

[oeasy]python035_根据序号得到字符_chr函数_字符_character_

字符(character) 回忆上次内容 上次了解了ord函数 ord 的意思是 ordinal(序号) ord函数 可以 根据字符得到序号 那么 可以 反过来 吗&#xff1f; 根据序号 得到字符可以 吗&#xff1f;&#x1f914; ord的逆运算 首先进入游乐场 ord 根据参数"h" 得到序号104 chr…

EtherCAT转Profient协议网关简述

Profinet 转 EtherCAT 的连接与通信问题一直是许多人关注的焦点&#xff0c;也常常给人们带来诸多困惑。在此&#xff0c;我们将深入剖析这一问题&#xff0c;并为大家提供切实可行的解决方案。WL-PN-ECATM型设备在这方面表现卓越&#xff0c;能够有效解决这一难题。接下来&…

视频制作软件哪个好?前十名推荐!

在视频制作领域&#xff0c;选择合适的软件是提升创作效率和作品质量的关键。本文将根据软件的适用人群&#xff1a;新手入门和专业领域&#xff0c;以及推荐的书籍&#xff0c;为您详细介绍视频制作软件的前十名。 新手入门级别&#xff1a; 1.影忆 功能特点&#xff1a;新手入…

实现领域驱动设计(DDD)系列详解:集成限界上下文

一个项目中通常存在着多个限界上下文&#xff0c;并且我们需要在它们之间进行集成。 在上下文映射图中存在两种主要形式&#xff1a;一种是通过绘制一些简单的框图来展示它们之间的集成关系&#xff1b;另一种则是通过代码来实现这些集成关系。 到了具体的技术实现&#xff0…

设计模式之备忘录

一、备忘录设计模式概念 备忘录模式&#xff08;Memento&#xff09; 是一种行为设计模式&#xff0c; 允许在不暴露对象实现细节的情况下保存和恢复对象之前的状态。 适用场景 当你需要创建对象状态快照来恢复其之前的状态时&#xff0c; 可以使用备忘录模式。当直接访问对象的…

羽毛球场馆预约系统,便捷管理预约

全国羽毛球运动的热度不断上升&#xff0c;在健身行业中掀起了一股羽毛球热潮。同时羽毛球运动的风靡&#xff0c;也吸引了不少人入局&#xff0c;各种大大小小的羽毛球馆不断出现&#xff0c;为大众的羽毛球喜好提供了场地。 随着互联网的发展&#xff0c;羽毛球馆也开始向线…

双控开关接入NVBoard

导入NVBoard git仓库&#xff1a;https://github.com/NJU-ProjectN/nvboard 按照ysyx手册的要求&#xff0c;初始化NVBoard项目。 由于GitHub在国外&#xff0c;可能会超时无响应&#xff1a; 解决方案是修改代理。 当前的运行环境是VM VirtualBox虚拟机&#xff0c;网卡是…

豆包PixelDance:超越Runway和Sora的AI视频模型出炉

2024年9月24日&#xff0c;北京——字节跳动在火山引擎发布会上&#xff0c;震撼发布了两款AI视频模型&#xff1a;豆包视频生成的PixelDance模型和Seaweed模型&#xff0c;标志着AI视频技术迈入了一个全新的纪元。今天&#xff0c;我们将聚焦于豆包PixelDance模型&#xff0c;…

ffplay播放器研究分析

ffplay研究分析意义 ffplay.c是FFmpeg源码⾃带的播放器&#xff0c;调⽤FFmpeg和SDL API实现⼀个⾮常有⽤的播放器。 例如哔哩哔哩著名开源项⽬ijkplayer也是基于ffplay.c进⾏⼆次开发。 ffplay实现了播放器的主体功能&#xff0c;掌握其原理对于我们独⽴开发播放器⾮常有帮助…

加固与脱壳01 - 环境搭建

虚拟机 VMWare 多平台可用&#xff0c;而且可以直接激活&#xff0c;需要先注册一个账号 https://support.broadcom.com/group/ecx/productdownloads?subfamilyVMwareWorkstationPro KALI 类Ubuntu系统&#xff0c;官方提供了 vmware 版本&#xff0c;直接下载就可以使用。…