智慧医疗——提出了一种基于敌对领域适应症预测候选抗癌药物的方法

导言

本方法的研究背景和要点

据估计,未来每两个日本人中就有一人会患上癌症,它是现代人最难以治愈的疾病之一。众所周知,癌症的发生和发展是由于人类和其他动物的细胞生长机制遭到破坏,细胞变成了被称为癌细胞的特殊细胞。

癌症干细胞是一种特别特殊的癌细胞。干细胞是一种特化细胞,具有自我复制或转变为具有多种功能的细胞(这被称为分化)的能力。癌症干细胞既有作为癌细胞的特性(细胞调节功能被破坏),也有作为干细胞的特性。

众所周知,这些癌症干细胞对癌症转移和****复发有重大影响。特别是近年来,为治疗癌症而开发的药物改变了癌症干细胞的分化方式,并诱导它们抑制癌症的发展。

本文介绍了一种新模型的开发情况,该模型利用一种称为对抗性领域适应的技术来识别新候选药物,尤其侧重于乳腺癌和其他癌症。

模型结构

关于该模型中使用的敌域适应

领域适应是计算机视觉领域广为熟知的一种方法,用于将在一个领域(如摄影)训练的模型应用到另一个领域(如绘画)

在本文中,我们利用了这一技术的进一步发展,即对抗性域适应(详见下文)。研究表明,这种方法可用于消除不同数据集的特定偏差,并训练跨不同平台利用大量信息的模型。

学习工作流程

该模型中的任务包括两类**:主要任务(图中用主要任务表示)和对抗任务(图中用对抗任务表示)**。

前一项任务(主要任务)使用源域来学习细胞所处的四个分化阶段。在这项任务中,要对模型进行训练,使预测分化阶段的四值分类准确率尽可能高。

后一种任务(对抗性任务)学习如何区分源域和目标域。换句话说,它学习如何使这些数据集的识别准确率尽可能小。通过引入这种学习机制,可以消除每个数据集的偏差

然后,根据药物诱导分化的能力,使用训练有素的模型对源域和靶域进行评分,如图 2 所示。

然后,如图3所示,利用刚刚获得的分数来确定促进细胞分化和保持干细胞特征的合适候选药物。

最后,我们选择了六个优先代理在真实细胞上进行测试,如图 4 所示。

因此,在进行实验之前利用深度学习缩小候选药物的范围,相信可以大大降低估算候选药物所需的时间和****成本

整体模型

该图概述了模型的实际训练过程。如图所示,模型首先使用源域数据集和目标****域数据集进行训练,每个数据集使用不同的编码器。

然后将两种编码器获得的各自特征进行整合,并将其作为训练解码器的输入。

解码器的输出被用作后续任务分类器(绿色)和对抗域分类器(红色)的输入。

任务分类器****使用 MLP 层来预测它将属于四个分化阶段中的哪一个。在训练过程中,会**使用一个损失函数(****任务分类损失)来提高预测的准确性,并使用一个损失函数(领域混淆损失)**来减少领域固有的偏差。

另一方面,对抗域分类器通过使用损失函数(Adv. Domain Loss)来学习如何源域和目标域之间进行判别,从而最大限度地降低判别的准确性。

关于数据集

源域数据集是关于人类诱导多能干细胞(源自成人体细胞的干细胞,缩写为hiPSCs)的信息的系统汇编,使用一种技术(scRNA-seq)进行分析,以确定源自细胞的基因的功能。

目标域数据集(LINCS L1000)则是根据基因如何影响细胞功能,对细胞如何所有刺激做出反应进行的大规模分析和系统汇编。

后者是一个数据集,其中汇集了特定药物如何影响功能的信息,如图所示,详细说明了给细胞 A(或细胞 B)注射药物 X(或药物 Y)最终会如何影响其功能。如图所示,数据集详细说明了给细胞 A(或细胞 B)注射药物 X(或药物 Y)最终会如何影响其功能。

在这项研究中,首先利用域适应来学习细胞从源域分化的模式,然后利用这一知识来预测每种药剂诱导分化的能力

学习进度示意图。

该图显示了学习的进展情况,横轴代表学习中的历时,纵轴代表损失。源域任务分类器的损失变化以蓝色显示,该分类器的准确率变化以浅灰色显示,对抗分类器的源域准确率变化以灰色显示,目标域准确率变化以深灰色显示。

任务分类器(浅灰色)的准确率达到 86.7%。至于对抗分类器的准确率,预计使用源域的准确率(灰色)和使用目标域的准确率(深灰色)都将接近50%,因为我们的目标是尽可能降低区分两类数据集的能力,但图中确实收敛到了这一数值。从图中可以看出,它们确实趋近于该值。

领域调整前后的比较

在上图 c 中,显示了tSNE分析结果在域适应之前(左侧面板)和之后(右侧面板)的情况。蓝色、绿色、黄色和红色显示的是将源域聚类为四类后得到的分布,黑色显示的是目标域所用数据集得到的分布。

研究表明,在域适应之前,处于不同分化阶段的细胞非常分散,而在域适应之后,它们的区分度更高,目标域的分布遍布源域的分布

实验结果

该图显示了对模型预测的候选药物进行化学实验的结果。

首先,在图a中,该模型预测的前10种候选药物的DECODE得分显示为红色,表明它们**作为干细胞的特征,**而后10种候选药物的得分显示为蓝色。

DECODE 分数越高,干细胞特征就越强,从图中可以预测,优先级较高的候选药物具有较高的干细胞特征

图b显示了药物治疗前后三项指标值的比率:干细胞群数量干细胞群形成的总面积及其平均值。这表明,使用模型预测的候选药物会对干细胞特性的各项指标产生影响。

此外,论文还评估了优先候选药物对乳腺癌干细胞的影响,结果显示这些药物能抑制这些细胞的生长和自我更新能力。换句话说,这证实了每种药物都非常有效

图 c 至图 e 显示了模型预测的 30 种候选药物中抑制或促进细胞功能和细胞结构相关过程的百分比。红色表示抑制功能,绿色表示促进功能

这些数据表明,模型预测的候选药物抑制了细胞周期相关基因的功能,同时促进了细胞分化。换句话说,这表明候选药物能够以明确的方式调节癌症干细胞的特性

上图 a 至 c 说明了模型预测的药剂如何影响乳腺癌干细胞自我生长和复制的能力。

图a直观地显示了药物的作用。上下两行显示了实验中使用的癌症干细胞的代表性实例。五列中最左边的一列显示了不使用药物时干细胞特性受到的影响,左起第二列和第三列分别显示了药物"TRIPROLIDE “的浓度以及模型预测得到的药物"OTS-167**”**的浓度逐渐增加的情况。下表显示

可以看出,药物浓度越高,质量占据的比例越小(即药物抑制了癌症干细胞的功能,或者换句话说,药物作为一种治疗手段是有效的)。

图b进一步量化了这一点,显示了在使用三种不同药物时,左半边的一个癌症干细胞和右半边的另一个干细胞的特性有何不同(可以肯定的是,每个图的横轴代表药物浓度,纵轴代表癌症干细胞特性的强度)。).

未添加药物的情况显示为****蓝色,添加少量药物的情况显示为红色,添加大量药物的情况显示绿色。该图证实,绿色在纵轴上的得分往往低于蓝色或红色(即癌症干细胞功能可以被抑制,换句话说,机器学习模型预测的药物作为一种治疗方法是适当有效的)。

总结

本研究提出了一种基于对抗域适应机器学习方法的模型,用于识别与抑制癌症干细胞功能相关的候选药物。具体来说,该模型引入了一个敌对域分类器,将两个数据集区分为源域和****目标域,并引入了一个损失函数来减少两个数据集之间的偏差,以便进行训练。

根据模型的预测得分选出的候选药物通过实验显示了对受癌症不利影响的细胞功能的作用,从而证实了模型的有效性

为了进一步推动这项研究,作者希望通过临床试验评估药物的疗效和安全性,并从化学角度阐明分子机制

不仅在这篇论文中,在其他论文中,机器学习也被广泛用于缩小大量候选药物的范围,并通过这些候选药物进行成本高昂的实验验证来加速药物发现。如果有人感兴趣,我们建议您相关论文。

注:
论文地址:https://www.biorxiv.org/content/10.1101/2023.08.21.554075v1.full.pdf

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/2228.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

算法|牛客网华为机试31-40C++

牛客网华为机试 上篇:算法|牛客网华为机试21-30C 文章目录 HJ31 单词倒排HJ32 密码截取HJ33 整数与IP地址间的转换HJ34 图片整理HJ35 蛇形矩阵HJ36 字符串加密HJ37 统计每个月兔子的总数HJ38 求小球落地5次后所经历的路程和第5次反弹的高度HJ39 判断两个IP是否属于同…

C/C++ 随机数生成方法

1. 使用 rand() 和 srand() - 库: <stdlib.h> 或 <cstdlib> - 特点: 伪随机数生成器&#xff0c;简单易用。 - 示例: #include <stdlib.h> #include <time.h> int main() { srand(time(NULL)); // 初始化随机数生成器 int random_nu…

AI大模型重塑软件开发:从代码自动生成到智能测试

随着AI技术的不断发展&#xff0c;AI大模型在软件开发领域的应用日益广泛。从代码自动生成到智能测试&#xff0c;AI大模型正在深刻改变着软件开发的各个环节&#xff0c;重塑着整个开发流程。本文将探讨AI大模型的定义、应用场景、优势以及挑战&#xff0c;并展望未来的发展趋…

Java的内部类

Java内部类 什么是内部类&#xff1f; 类的五大成员&#xff1a;属性、方法、构造方法、代码块、内部类在一个类的里面&#xff0c;再定义一个类 public class Outer { // 外部类class Inner { // 内部类} }public class Test { // 外部其他类public static void main(Strin…

WPF+MVVM案例实战(二十二)- 制作一个侧边弹窗栏(CD类)

文章目录 1、案例效果1、侧边栏分类2、CD类侧边弹窗实现1、样式代码实现2、功能代码实现3 运行效果4、源代码获取1、案例效果 1、侧边栏分类 A类 :左侧弹出侧边栏B类 :右侧弹出侧边栏C类 :顶部弹出侧边栏D类 :底部弹出侧边栏2、CD类侧边弹窗实现 1、样式代码实现 在原有的…

字符串算法

字符串 1.kmp匹配算法Anya and 1100 1.kmp匹配算法 模板题链接 不懂可以看这个~详细的思路 #include <string> #include <iostream>using namespace std; const int N 1000010;string s,p;// s[]是长文本&#xff0c;p[]是模式串&#xff0c;n是s的长度&#xff…

掌控板micropython编程实现OLED显示天气信息

掌控板micropython编程实现OLED显示天气信息 上一个例子已经实现了在掌控板的OLED上显示汉字&#xff0c;本例使用掌控板的wifi访问心知天气&#xff0c;获取天气信息显示在掌控板的OLED上。 访问心知天气主页&#xff08; https://www.seniverse.com/&#xff09;&#xff0…

golang通用后台管理系统03(登录校验,并生成token)

代码 package serviceimport ("fmt"//"fmt""gin/common""gin/config"sysEntity "gin/system/entity"sysUtil "gin/system/util""github.com/gin-gonic/gin""log" )func Login(c *gin.Contex…

三维测量与建模笔记 - 2.2 射影几何

教程中H矩阵写的有问题&#xff0c;上图中H矩阵应该是&#xff08;n1) x (m1) 共点不变性,下图中黄色方块标记的点&#xff0c;在射影变换前后&#xff0c;虽然直线的形状有所变化&#xff0c;但仍然相交于同一个点。 共线不变性&#xff0c;下图黄色标记的两个点&#xff0c;在…

操作系统(10) (并发(2)------基于软件/硬件/操作系统层面解决两个进程之间的临界区问题/抢占式/非抢占式内核)

目录 1. 基于软件层面(Petersons Solution) Petersons Solution 满足三个要求: 好处: 缺点 2. 基于硬件层面 1. Disabling Interrupts (禁用中断) 概念解释&#xff1a; 代码框架&#xff1a; 要求&#xff1a; 禁用中断的好处与问题&#xff1a; 2. Test and Set Lock (…

系统架构设计师-未来信息综合技术(1)

目录 一、信息物理系统CPS 1、CPS体系结构 2、CPS的技术体系 3、CPS的应用场景 二、人工智能技术 1、人工智能关键技术 2、人工智能&#xff08;AI&#xff09;芯片 一、信息物理系统CPS 定义&#xff1a;CPS通过集成先进的感知、计算、通信、控制等信息技术和自动控制技术&a…

支持向量机背后的数学奥秘

一、基本概念与原理 1.1 支持向量机的定义 支持向量机是一种二分类模型&#xff0c;其核心思想是在样本空间中寻找一个超平面&#xff0c;将不同类别的样本分开。这个超平面被称为决策边界或分隔超平面。支持向量是距离决策边界最近的点&#xff0c;这些点决定了决策边界的位…

LeetCode 热题100 之 回溯1

1.全排列 思路分析1&#xff08;回溯&#xff09;&#xff1a;要生成一个不含重复数字的数组 nums 的所有可能全排列&#xff0c;我们可以使用回溯算法。这种算法通过递归的方法探索所有可能的排列组合&#xff0c;并在合适的时机进行回溯&#xff0c;确保不会遗漏任何排列。回…

「C/C++」C/C++ 之 变量作用域详解

✨博客主页何曾参静谧的博客&#x1f4cc;文章专栏「C/C」C/C程序设计&#x1f4da;全部专栏「VS」Visual Studio「C/C」C/C程序设计「UG/NX」BlockUI集合「Win」Windows程序设计「DSA」数据结构与算法「UG/NX」NX二次开发「QT」QT5程序设计「File」数据文件格式「PK」Parasoli…

深度学习-如何计算神经网络的输出?

给定一个包含输入层、隐藏层和输出层的神经网络架构&#xff0c;可以逐层推导出各节点的输出值。具体步骤如下&#xff1a; 输入层计算&#xff1a; 输入层有 3 个节点&#xff0c;编号为 1、2、3&#xff0c;输入向量为 x_1, x_2, x_3 。输入层节点的输出值直接就是输入向量&a…

【ESP32】ESP-IDF开发 | I2C从机接收i2c_slave_receive函数的BUG导致程序崩溃解决(idf-v5.3.1版本)

1. 问题 在调试I2C外设的demo时&#xff0c;按照官方文档的描述调用相关API&#xff0c;烧录程序后发现程序会不断崩溃&#xff0c;系统log如下。 初步分析log&#xff0c;原因是访问到了不存在的地址。一开始我以为是自己的代码问题&#xff0c;反反复复改了几次都会出现同样的…

vue3学习记录-nextTick

vue3学习记录-nextTick 1. 案例场景2. 使用方法2.1 回调方式2.2 async&#xff0c;await 3.原理 1. 案例场景 聊天框实现输入内容&#xff0c;滚动条默认滚到最底部。 <template><div class"chat_box"><div class"chat_list" ref"chat…

microsoft defender smartscreen怎么关闭

打开windows安全中心 点击基于声誉的保护设置 把检查应用和文件等开关关掉即可

【c++日常刷题】两个数字的交集、点击消除、最小花费爬楼梯

两个数字的交集⭐ 两个数组的交集_牛客题霸_牛客网 (nowcoder.com) 题目描述&#xff1a; 解题思路&#xff1a; 通过遍历num1&#xff0c;如果遍历到的元素如果在num2中能找到&#xff0c;则这是num1和num2的公告元素&#xff1b; 这里需要借助两个数组来实现&#xff1a;…

【ACM出版,EI稳定检索,九大高校联合举办, IEEE Fellow支持】2024年计算机视觉与艺术研讨会(CVA 2024,11月29-12月1日)

大会官网&#xff1a;www.icadi.net (CVA为ICADI分会&#xff0c;网站沿用主会议&#xff1b;议程、出版将以主会为准&#xff09; 大会时间&#xff1a;2024年11月29-12月1日 大会地点&#xff1a;中国-天津 终轮截稿&#xff1a;2024年11月22号&#xff08;特殊情况联系会…