Day6:生信新手笔记 — R包安装与R包使用

R包是多个函数的集合。学生信使用R语言的原因是丰富的图表和Biocductor上面的各种生信分析R包。

一、安装和加载R包

1.设置镜像

镜像网站相当于主网站的副本,访问主网站存在障碍时,访问镜像网站也可。选择国内的镜像可加快访问速度。运行这两行代码:

options("repos"=c(CRAN="http://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
options(BioC_mirror="https://mirrors.westlake.edu.cn/bioconductor")

2.安装R包

确保电脑联网。
R包安装命令是install.packages()或者BiocManager::install()。具体使用哪一个是取决于你要安装的包存在于CRAN网站还是Biocductor。具体在哪可以搜索查询。
举个栗子,安装来自cran的stringr包:

install.packages("stringr")

安装来自Biocductor的limma包:

BiocManager::install("limma")

3.加载R包

加载R包时,使用library和require这两个函数均可。使用一个R包,需要先安装再加载,才能使用包里的函数。
R包安装成功的唯一标准是library这个包时不报错。
(只有error才是报错,warning不是报错)

设置镜像、安装、加载R包三部曲

options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) 
options(BioC_mirror="http://mirrors.tuna.tsinghua.edu.cn/bioconductor/")
install.packages("dplyr")
library(dplyr)

示例数据直接使用内置数据集iris的简化版:

test <- iris[c(1:2,51:52,101:102),]

在这里插入图片描述

二、dplyr五个基础函数

1.mutate(),新增列

mutate(test, new = Sepal.Length * Sepal.Width)

在这里插入图片描述

2.select(), 按列筛选

(1)按列号筛选

select(test,1)
select(test,c(1,5))
select(test,Sepal.Length)

在这里插入图片描述

(2)按列名筛选

select(test, Petal.Length, Petal.Width)
vars <- c("Petal.Length", "Petal.Width")
select(test, one_of(vars))

在这里插入图片描述

3.filter()筛选行

filter(test, Species == "setosa")
filter(test, Species == "setosa"&Sepal.Length > 5 )
filter(test, Species %in% c("setosa","versicolor"))

在这里插入图片描述

4.arrange(),按某1列或某几列对整个表格进行排序

arrange(test, Sepal.Length)      #默认从小到大排序
arrange(test, desc(Sepal.Length))    #用desc从大到小

在这里插入图片描述

5.summarise():汇总

对数据进行汇总操作,结合group_by使用时的实用性强。

summarise(test, mean(Sepal.Length), sd(Sepal.Length))    # 计算Sepal.Length的平均值和标准差
group_by(test, Species)
summarise(group_by(test, Species),mean(Sepal.Length), sd(Sepal.Length))

在这里插入图片描述

三、dplyr两个实用技能

1:管道操作 %>% (cmd/ctr + shift + M)

(加载任意一个tidyverse包即可用管道符号)

test %>% group_by(Species) %>% summarise(mean(Sepal.Length), sd(Sepal.Length))

在这里插入图片描述

2:count统计某列的unique值

count(test,Species)

在这里插入图片描述

四、dplyr处理关系数据

将2个表进行连接。
示例数据如下。

test1 <- data.frame(x = c('b','e','f','x'), z = c("A","B","C",'D'))
test2 <- data.frame(x = c('a','b','c','d','e','f'), y = c(1,2,3,4,5,6))

在这里插入图片描述

1.內连inner_join,取交集

inner_join(test1, test2, by = "x")

在这里插入图片描述

2.左连left_join

left_join(test1, test2, by = 'x')
left_join(test2, test1, by = 'x')

在这里插入图片描述

3.全连full_join

full_join( test1, test2, by = 'x')

在这里插入图片描述

4.半连接:返回能够与y表匹配的x表所有记录semi_join

semi_join(x = test1, y = test2, by = 'x')

在这里插入图片描述

5.反连接:返回无法与y表匹配的x表的所记录anti_join

anti_join(x = test2, y = test1, by = 'x')

在这里插入图片描述

6.简单合并

示例数据

test1 <- data.frame(x = c(1,2,3,4), y = c(10,20,30,40))
test2 <- data.frame(x = c(5,6), y = c(50,60))
test3 <- data.frame(z = c(100,200,300,400))

在这里插入图片描述
在相当于base包里的cbind()函数和rbind()函数;注意,bind_rows()函数需要两个表格列数相同,而bind_cols()函数则需要两个数据框有相同的行数。

bind_rows(test1, test2)
bind_cols(test1, test3)

在这里插入图片描述

五、函数和R包该怎么学习

快速查看函数帮助文档

?sd

在这里插入图片描述
遇到一个不认识的函数想要学习,可以查看帮助文档,能解决90%的“xx函数什么意思”、“xx参数什么意思”的问题。一个优秀程序员,能够现查现用。

Vignettes

Vignettes这个单词硬翻译会翻译成“小插图”,其实就是作者写的网页版教程,不是每个R包都有的,可以运行代码试试看,没有就是没有了。

browseVignettes("limma")

在这里插入图片描述
学习生信R语言加油!!!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/34835.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

Spring源码解读

文章目录 Spring简单容器(以BeanFactory为主)Spring高级容器(以ApplicationCOntext为主)ListableBeanFactoryobtainFreshBeanFactory()获取BeanFactorySpring源码学习:一篇搞懂@Autowire和@Resource注解的区别Spring简单容器(以BeanFactory为主) Spring高级容器(以Appl…

达梦数据库客户端安装方法

达梦数据库客户端安装方法 达梦客户端下载地址 产品下载 | 达梦数据库 下载完成后以后是这样子的 dm8_20241011_x86_win_64.zip 然后解压 解压后的结果 双击iso的文件 然后选中 然后下一步 自定义安装路径然后下一步 安装 然后直接在开始这里搜DM管理工具 然后配置连接即…

【北京迅为】iTOP-4412全能版使用手册-第五十五章 字符类GPIOS

iTOP-4412全能版采用四核Cortex-A9&#xff0c;主频为1.4GHz-1.6GHz&#xff0c;配备S5M8767 电源管理&#xff0c;集成USB HUB,选用高品质板对板连接器稳定可靠&#xff0c;大厂生产&#xff0c;做工精良。接口一应俱全&#xff0c;开发更简单,搭载全网通4G、支持WIFI、蓝牙、…

LabVIEW算法执行时间评估与Windows硬件支持

在设计和实现复杂系统时&#xff0c;准确估算算法的执行时间是关键步骤&#xff0c;尤其在实时性要求较高的应用中。这一评估有助于确定是否需要依赖硬件加速来满足性能需求。首先需要对算法进行时间复杂度分析并进行实验测试&#xff0c;了解其在Windows系统中的运行表现。根据…

D614 PHP+MYSQL +失物招领系统网站的设计与现 源代码 配置 文档

失物招领系统 1.摘要2. 系统开发的背景和意义3.功能结构图4.界面展示5.源码获取 1.摘要 随着互联网的迅速发展&#xff0c;人们的生产生活方式逐渐发生改变&#xff0c;传统的失物招领也可以通过网络处理。本网站是基PHP技术的一款综合性较强的西南民族大学PHP失物招领系统。 …

【Java】Switch语句、循环语句(for、while、do...while)

Switch语句&#xff1a;针对某个表达式的值进行判断&#xff0c;从而决定执行哪一段代码 语法格式&#xff1a; switch(表达式){ case 目标值1: 执行语句1 break; case 目标值2: …

中建海龙:科技创新引领建筑业革新,铸就行业影响力

在建筑业这个古老而又充满活力的行业中&#xff0c;中建海龙科技有限公司&#xff08;以下简称“中建海龙”&#xff09;凭借其卓越的科技实力和一系列荣誉奖项&#xff0c;正逐步确立其在建筑工业化领域的领导地位&#xff0c;并对整个行业产生了深远影响。 中建海龙自成立以来…

【认证法规】安全隔离变压器

文章目录 定义反激电源变压器 定义 安全隔离变压器&#xff08;safety isolating transformer&#xff09;&#xff0c;通过至少相当于双重绝缘或加强绝缘的绝缘使输入绕组与输出绕组在电气上分开的变压器。这种变压器是为以安全特低电压向配电电路、电器或其它设备供电而设计…

引领素养教育行业,猿辅导素养课斩获“2024影响力教育品牌”奖项

近日&#xff0c;由教育界网、校长邦联合主办&#xff0c;鲸媒体、职教共创会协办的“第9届榜样教育年度盛典”评奖结果揭晓。据了解&#xff0c;此次评选共有近500家企业提交参评资料进行奖项角逐&#xff0c;历经教育界权威专家、资深教育从业者以及专业评审团队的多轮严格筛…

内网穿透 natapp安装与使用

前言 NATAPP是一款基于ngrok的内网穿透工具。以下是对NATAPP的详细概述&#xff1a; 基本概念 定义&#xff1a;内网穿透&#xff08;NAT穿透&#xff09;是一种技术&#xff0c;它允许具有特定源IP地址和端口号的数据包能够绕过NAT设备&#xff0c;从而被正确地路由到内网主机…

TiDB如何保证数据一致性

1. 分布式事务协议 TiDB 采用了类似 Google Percolator 的分布式事务协议来处理分布式事务。这个协议基于两阶段提交&#xff08;2PC&#xff09;的思想&#xff0c;但进行了优化和改进&#xff0c;以适应分布式环境的特殊需求。在 TiDB 中&#xff0c;当一个事务需要跨多个节…

高中数学:导数-在研究函数中的应用

文章目录 一、函数单调性解题步骤图像特征与导数值的关系 二、函数的极值与最大最小值1、函数的极值极值点的求法2、函数的最大最小值最大最小值求法函数大致图像的画法 一、函数单调性 例题 解题步骤 例题 图像特征与导数值的关系 二、函数的极值与最大最小值 1、函数的极…

OceanBase数据库使用 INSERT 语句违反唯一约束冲突解决办法及两者差异分析

当在OceanBase数据库上创建带有唯一性约束的表&#xff0c;在向表中插入唯一性约束的冲突的数据时会提示因违反唯一性约束报错&#xff0c;OceanBase在其官网上提供了两种解决策略&#xff0c;但其官网并未详细说明两种策略的差异&#xff0c;于是早上对两种策略进行一些测试&a…

【人工智能的深度分析与最新发展趋势】

人工智能的深度分析与最新发展趋势 引言 人工智能&#xff08;AI&#xff09;是现代科技的重要组成部分&#xff0c;它涉及模拟人类智能的算法和技术。随着计算能力的提升和数据量的激增&#xff0c;AI的应用正在迅速渗透到各个行业。本文将深入分析人工智能的概念、技术、应…

Spring Boot + MySQL 多线程查询与联表查询性能对比分析

Spring Boot MySQL: 多线程查询与联表查询性能对比分析 背景 在现代 Web 应用开发中&#xff0c;数据库性能是影响系统响应时间和用户体验的关键因素之一。随着业务需求的不断增长&#xff0c;单表查询和联表查询的效率问题日益凸显。特别是在 Spring Boot 项目中&#xff0…

Navicat 连接 SQL Server 详尽指南

Navicat 是一款功能强大的数据库管理工具&#xff0c;它提供了直观的图形界面&#xff0c;使用户能够轻松地管理和操作各种类型的数据库&#xff0c;包括 SQL Server。本文将详尽介绍如何使用 Navicat 连接到 SQL Server 数据库&#xff0c;包括安装设置、连接配置、常见问题排…

【多模型能力测试记录】ArgoDB分布式分析型数据库与图数据库StellarDB联合查询

前言 随着数据量的爆炸性增长和业务需求的日益复杂化&#xff0c;传统的单一模型数据库已经难以满足复杂多变的业务需求。尽管当前针对不同的数据类型&#xff0c;例如关系型数据、文档数据、图数据和时序数据业内提供了多种数据库以应对存储及处理需求&#xff0c;但是在实际…

Ansible自动化运维

1 ansible介绍和架构 1.1 什么是ansible ansible是新出现的自动化运维工具&#xff0c;基于Python开发&#xff0c;集合了众多运维工具&#xff08;puppet、chef、func、fabric&#xff09;的优点&#xff0c;实现了批量系统配置、批量程序部署、批量运行命令等功能。 ansible…

玩FPGA不乏味

玩FPGA不乏味 Hello&#xff0c;大家好&#xff0c;之前给大家分享了大约一百多个关于FPGA的开源项目&#xff0c;涉及PCIe、网络、RISC-V、视频编码等等&#xff0c;这次给大家带来的是不枯燥的娱乐项目&#xff0c;主要偏向老的游戏内核使用FPGA进行硬解&#xff0c;涉及的内…

工商业光伏系统踏勘、设计、施工全流程讲解

随着全球能源结构的转型和环保意识的提升&#xff0c;光伏发电作为一种清洁、可再生的能源形式&#xff0c;正越来越受到工商业领域的青睐。商场、学校、医院、各类工厂等地&#xff0c;安装光伏发电系统不仅能降低运营成本&#xff0c;还可以为企业树立良好的环保形象。 一、前…