RoseTTAFold,作为David Baker教授团队早期开发的蛋白质结构预测工具,在学术界与工业界广受认可。然而,随着时间推移,仅局限于预测已知结构的蛋白质并不能满足生物医药和生物工程领域对创新设计的需求。这促使David Baker教授团队继续深入研究突破。在此背景下,RFdiffusion应运而生,继承了RoseTTAFold的优良基因,但在功能上实现了质的飞跃,不仅能够预测蛋白质结构,更能够从无到有地进行创新设计。这种“从零开始”的设计理念赋予科学家们前所未有的设计自由度,这一突破不仅标志着蛋白质设计技术的重大进步,也意味着科研人员可以更深入地探究生命现象的本质,甚至创造出全新的生物功能和应用。
综上所述,本次培训会议是在深度学习驱动蛋白质设计这一新兴领域快速发展的背景下举办,旨在促进相关领域的科研人员、工程师及产业界人士对该领域的理解与技术掌握,推动深度学习技术在蛋白质设计领域的创新应用与实际转化。本次培训会议的主办方为北京软研国际信息技术研究院,承办方互动派(北京)教育科技有限公司,会议会务合作单位为北京中科四方生物科技有限公司,具体相关事宜通知如下:
培训对象
生物信息学、结构生物学、合成生物学、药物研发、生物材料等相关领域的科研人员;生物医药、生物科技企业研发、技术部门负责人、对深度学习驱动蛋白质设计感兴趣的跨界人士。
讲师介绍
由国家双一流、985高校特聘研究员、博士生导师讲授。近五年发表SCI研究论文20余篇,获国际生物设计会议奖励(The International BioDesign Research Conference)。主持基金委蛋白质设计相关项目和科技部重点研发计划课题多项。主要擅长分子设计、分子模拟方法研究。
4.课程详情
深度学习驱动的蛋白质设计技术与前沿实践-从基础到尖端应用
Rosetta蛋白质设计:基础概念
一、Rosetta基础元素和Rosetta力场优化
1、Pose/mover/scorefunction
2、单体结构的扰动和优化:Minimization和Relax
3、蛋白复合物结构的扰动和优化
二、蛋白质结构viewer和Linux入门命令
1、用户属组及权限 目录文件属性
2、LINUX基础命令 环境变量
3、shell常用命令练习 vim编辑器
Rosetta蛋白质设计:应用案例
三、RosettaScripts应用
1、Residue Selector,Task Operation,Filter等组件
2、结构从头设计:Blueprint
3、序列设计和优化:FastDesign
RFdiffusion创新结构生成技术
四、背景介绍
1、结构生成过程中的物理能量函数与约束
2、基于Deep learning的预测模型和生成模型
3、结构验证与性能评估
五、RFdiffusion基于指定骨架的蛋白质结构设计
核心知识点:利用用户提供的特定结构框架进行蛋白质结构设计。
1、无约束单体设计(contigmap):全新骨架的蛋白质结构创新设计,通过RFdiffusion实现从头生成新颖、非同源蛋白质结构
2、特定骨架引导设计 (scaffoldguided):利用已有结构骨架指导蛋白质结构创新与改造
RFdiffusion 高级应用及领域热点
六、RFdiffusion含活性位点的蛋白质结构设计
核心知识点:使用RFdiffusion构建具有特定生物活性的蛋白质结构
1、Motifscaffold: inference.input_pdb & contigmap.inpaint_seq:如何整合已知活性位点信息,嫁接到设计的新蛋白质结构上
实例分析:酶活位点嫁接,对称位点嫁接的设计策略与实施
七、蛋白质-蛋白质相互作用界面(PPI):Binder设计
核心知识点:利用RFdiffusion设计能有效介导蛋白间相互作用的Binder区域。
1、ppi.hotspots:识别和利用PPI热点信息来定制Binder结构
2、设计实例:针对指定骨架和/或特定motif的Binder结构创建
八、RFdiffusion中的对称性设计
核心知识点:阐述如何在蛋白质结构设计中考虑并实现对称性特征。
1、Inference.symmetry: 对称性建模与控制
2、potentials:优化对称单元间的能量分布与稳定性
九、多样性
核心知识点:探究RFdiffusion在处理结构多样性上的机制和优势
diffuser.partial_T:局部扩散与全局优化相结合,提高结构多样性和稳健性
RFdiffusion中的noise
ProteinMPNN LigandMPNN 序列设计基础与高级应用
十、ProteinMPNN序列设计入门
核心知识点:介绍ProteinMPNN的核心架构与训练过程,掌握ProteinMPNN和LigandMPNN在不同场景下的蛋白质结构序列设计流程
应用案例:
1、Monomer单体序列设计:用ProteinMPNN针对单体蛋白质进行序列设计
2、Complex复合物zhong 指定链设计:利用ProteinMPNN在复合物环境下设计特定链的序列,涉及链间相互作用的考虑与优化。
3、Models, Helper scripts, number of sequences:深入了解模型使用方法、辅助脚本的功能以及决定生成序列数量的因素
十一、指定设计位点与氨基酸偏好性设置
核心知识点:如何运用深度学习工具来精准控制特定氨基酸残基的位置与特性
应用案例:
1、Fix position与Redesign position:保留某些部位不变(Fix position)和重新设计其他部位(Redesign position)的具体操作。
2、Bias AA与Omit AA:在设计过程中如何设置氨基酸偏好性,包括优先选择某些氨基酸(Bias AA)和排除特定氨基酸(Omit AA),以满足特定功能需求或生物物理化学特性。
RFdiffusion与 ProteinMPNN 高级应用案例分析
十二、MPNN进阶应用
核心知识点:MPNN对称性处理与同聚多体设计、MPNN设计多样性与温度参数调控
应用案例:
1、MPNN处理对称性Symmetry:讲解MPNN如何识别和处理蛋白质的对称性特征,特别是对于Homooligomers(同聚多体)的设计。
2、Tied position(绑定位置):探讨MPNN在处理需要保持多个位置协同变化以维持特定对称模式的情况下的具体方法。
3、MPNN设计多样性:探究MPNN如何通过温度参数调整来促进设计序列的多样性,以及多样性对最终蛋白质功能和稳定性的影响。
十三、Colabfold 结构预测与深度学习应用
1、MSA、pLDDT和pAE:介绍多序列比对(Multiple Sequence Alignment)、预测精度得分(predicted Local Distance Difference Test, pLDDT)和原子接触误差(predicted Atomic Error, pAE)在蛋白质结构预测中的重要作用。
2、逆转网络与幻想蛋白设计
探讨如何通过深度学习技术逆向设计已知结构或创造新型蛋白质结构可能性。
互动讨论
1、分享与解析近期领域内热点研究成果中RFdiffusion + ProteinMPNN的实际应用案例
2、讨论并解决实际操作中可能遇到的问题与挑战,进一步提升学员对深度学习在蛋白质结构设计领域中的理解和应用能力