革命性重磅!AlphaFold3迎来重大成果!国内大佬手把手教您深度学习蛋白质设计

2024-05-23
2024 年 5 月 8 日,谷歌 DeepMind 与 Isomorphic Labs 联合在《自然》期刊上发布蛋白质领域最新人工智能模型 AlphaFold 3!这一模型能够准确预测蛋白质、DNA、RNA 以及配体等生命分子的结构及其相互作用方式。这是继AlphaFold 2 之后的又一重大突破在预测类药物相互作用方面,AlphaFold 3 实现了前所未有的准确度,包括蛋白质与配体的结合以及抗体与其靶蛋白的结合。在 PoseBusters 的基准测试中,AlphaFold 3 的准确率比现有最佳传统方法高出 50%,而且无需任何结构信息输入,成为首个超越传统物理预测工具的人工智能系统。这种预测抗体与蛋白质结合的能力,对于理解人类免疫反应的各个方面以及新抗体的设计至关重要。深度学习在蛋白质设计领域的前沿研究主要集中在蛋白质结构预测、蛋白质序列设计、蛋白质-蛋白质相互作用预测、蛋白质功能注释和蛋白质优化与筛选等方面。这些研究方向为开发新的功能性蛋白质和药物靶点提供了新思路,并在生物医学、药物研发和生物材料等领深度学习在蛋白质设计领域的应用被认为是当前的前沿研究方向之一,深度学习在蛋白质设计领域的不断发展为新药研发、生物制药、生命科学研究等领域带来了许多创新和机会              2024年最值得期待的三大技术一、深度学习蛋白质设计二、CADD计算机辅助药物设计三、AIDD人工智能药物发现设计echnology深度学习在蛋白质设计领域的前沿研究主要集中在蛋白质结构预测、蛋白质序列设计、蛋白质-蛋白质相互作用预测、蛋白质功能注释和蛋白质优化与筛选等方面。这些研究方向为开发新的功能性蛋白质和药物靶点提供了新思路,并在生物医学、药物研发和生物材料等领深度学习在蛋白质设计领域的应用被认为是当前的前沿研究方向之一,蛋白质结构预测与设计领域的未来将充满创新和跨学科的发展,为解决生物医学、生物工程和生物能源等方面的重大问题提供更多可能性。蛋白质折叠和结构预测:深度学习模型可以预测蛋白质的三维结构,这对理解蛋白质的功能和开展蛋白质设计至关重要。通过深度神经网络模型和注意力机制的应用,可以更准确地预测蛋白质的折叠和结构。蛋白质序列设计:深度学习可以用于预测蛋白质序列的功能和稳定性。通过神经网络模型和自然语言处理技术的结合,可以设计出具有特定功能和稳定性的蛋白质序列,例如酶活性、药物靶点等。蛋白质-蛋白质相互作用预测:深度学习模型可以预测蛋白质和蛋白质之间的相互作用,从而帮助设计新的蛋白质复合物和抗体。蛋白质功能注释和预测:深度学习可以进行蛋白质功能注释和预测,识别蛋白质的功能域、结构域和功能位点等。这有助于预测蛋白质的功能和相应的生物学作用。蛋白质优化和筛选:深度学习可以用于优化和筛选设计出的蛋白质。通过神经网络和生成对抗网络的应用,可以提高蛋白质的稳定性、可溶性和活性,以满足特定的设计要求。蛋白质-蛋白质相互作用预测:深度学习可用于预测蛋白质与蛋白质之间的相互作用,从而实现蛋白质和配体的高效率设计和筛选等。近年来发过哪些顶刊以及方向:Nature communications| 使用基于结构的残基偏好进行蛋白质设计Nature biotechnology| 用于功能性蛋白质设计的机器学习Scientific reports| Deep-WET:一种基于深度学习的方法,使用具有加权特征的词嵌入技术预测 DNA 结合蛋白Cell Systems| 深度学习为蛋白设计开启了新时代Nat. Comput. Sci| 基于深度学习的无rotamer蛋白质设计Comput Struct Biotech| 深度学习用于蛋白质设计:从结构到序列与功能本课程围绕蛋白设计基础与前沿工作展开讲述,从蛋白结构的预测与优化到蛋白的从头设计进行深度教学,本课程主要面向有编程基础的学员,对基础知识进行详细讲解,并且会结合前沿文献讲解相关技术的应用。帮助学员们, 通过本次培训学员将了解蛋白质设计的底层逻辑与基本规则,并掌握蛋白质设计中的常见蛋白质设计算法的实际操作,具备基本的蛋白质设计算法开发的基础能力及前沿视野。01深度学习蛋白质设计课表第一天   Python编程基础1. Python 基础➣Python 简介:了解Python的历史、特点和与其他编程语言的比较。➣安装和设置环境:安装Python,设置Python开发环境(如Anaconda、Jupyter notebook)。➣基本语法:数据类型(整数、浮点数、字符串、布尔值)、变量、基本运算符。➣控制结构:条件语句(if-else)、循环语句(for循环、while循环)。➣函数:定义函数、参数、返回值、作用域、递归。➣数据结构:列表、元组、字典、集合、操作和常用方法。➣文件操作:读写文件,文件与异常处理。2. Python 进阶➣类和对象:面向对象编程基础,创建类,实例化对象,理解封装、继承和多态。➣模块和包:导入标准模块,使用第三方包,创建自定义模块和包。➣高级功能:列表推导式、生成器、迭代器、装饰器和匿名函数。3. Python 在科学计算中的应用➣NumPy:数组创建、数组操作、数学计算、线性代数等。➣Matplotlib:基础图表、科学图形、图表定制。4. 数据分析与可视化➣Pandas:数据结构(Series、DataFrame)、数据载入、数据清洗、数据统计、数据合并。➣数据可视化:使用 Matplotlib 和 Seaborn 进行高级数据可视化。5. 蛋白质设计中的特定应用➣BioPython:序列处理、数据库访问、生物学数据的分析。➣脚本编写:自动化常见的蛋白质设计任务,如序列对比、结构预测。➣机器学习:使用Scikit-learn进行特征提取、模型训练、评估和优化。6. 实战项目➣项目1:蛋白质序列数据分析,如统计特定序列的频率、可视化序列分布等。➣项目2:蛋白质结构预测,使用机器学习技术预测蛋白质的二级结构或功能位点。➣项目3:开发一个小型的蛋白质设计工具,集成数据处理、分析及可视化功能。第二天  shell命令行操作基础1. Shell环境简介➣什么是Shell:了解Shell是什么,以及它如何与操作系统交互。➣不同类型的Shell:Bash, Zsh, Tcsh的介绍。➣访问Shell:如何打开终端窗口,基础的命令行界面操作。2. 基础命令➣文件系统操作:cd, ls, pwd, mkdir, rm, touch 等命令的使用。➣文件操作:cat, more, less, head, tail, grep, find等命令。➣权限和所有权:使用chmod, chown, chgrp改变文件的权限和所有权。➣文本处理:echo, cat, cut, sort, uniq, tr, awk, sed等工具的基本使用。➣归档和压缩:tar, gzip, gunzip, zip, unzip等命令。3. Shell脚本编写➣创建和执行Shell脚本:如何编写一个简单的脚本并使其可执行。➣变量和数据类型:学习如何在脚本中定义和使用变量。➣流程控制:➣条件语句:if, else, elif, case等语句的使用。➣循环结构:for, while, until循环的使用。➣函数:如何定义和使用函数。➣输入和输出:处理用户输入和脚本输出。➣引用和转义字符:学习如何在命令行中正确使用单引号、双引号和转义字符。4. 高级Shell编程➣调试Shell脚本:如何调试Shell脚本,包括设置和使用调试选项。➣正则表达式:基本正则表达式的应用,结合grep, sed, awk使用。➣环境管理:了解PATH和其他环境变量的作用和管理方法。➣脚本的安全性:编写安全的脚本以避免常见的安全问题。5. 实用案例和项目➣数据备份脚本:创建一个自动备份你的重要文件的脚本。➣文件整理脚本:编写一个自动整理下载文件夹中文件的脚本。➣PDB文件分析脚本的编写第三天 蛋白质设计基础: 从经典力场到深度学习1. 如何计算蛋白质构象的能量?a) 蛋白质可视化与编辑常用方法i. pymol使用方法简介ii. chimera使用方法简介iii. pdb文件格式详解iv. 使用python biopython、pymol等库编辑蛋白质结构b) 分子力学、溶剂化能简介i. 分子力学公式形式ii. 溶剂化能的计算方法iii. MM/PBSA方法计算结合自由能2. 基于统计势函数的蛋白质设计方法——Rosettaa) 统计势函数的一般定义b) 蛋白质设计中的统计势函数i. Rosetta统计势定义ii. Rosetta能量函数常见项及物理意义c) 基于Rosetta势函数的蛋白设计i. 设计流程ii. 实验结果3. 蛋白-蛋白对接的强大——无先验知识的蛋白质药物设计流程a) 蛋白-蛋白对接简介i. 蛋白-蛋白对接的定义ii. RifGen对接方法介绍b) 蛋白质药物设计i. 设计流程ii. 实验结果4. 深度学习强势登场——蛋白质设计模型ProteinMPNNa) MPNN 消息传递神经网络简介b) ProteinMPNN模型简介i. 模型结构介绍(输入、输出、参数……)ii. 模型使用(主编程语言Python)c) 基于ProteinMPNN的蛋白质设计i. 设计流程ii. 实验结果5. 平分秋色还是天壤之别?两种蛋白设计方法的比较a) 深度学习模型具有更高的序列恢复率b) 深度学习模型可实现rosetta、alphafold不可完成的设计任务c) 深度学习模型的短板第四天 Alphafold vs Rosettafold1.蛋白结构预测背景介绍2.早期蛋白质结构预测算法:从统计分析到深度残差网络2.1 直接耦合分析和互信息计算2.2 深度残差网络和蛋白质接触图预测2.3 蛋白质距离矩阵预测3. 几何约束的梯度下降法到端到端深度学习的蛋白结构预测3.1 trrosetta和alphafold简介3.2 端到端几何深度学习方法介绍4. AF和AF2的差异与创新4.1 第一代Alphafold简介4.2 Alphafold2详解5. Rosettafold详解5.1 SE3网络 第五天  基于Alphafold的下游应用1. AF2多体蛋白结构预测的关键问题与解决途径1.1 多序列比对中序列拼接配对问题1.2 模板匹配问题2. 利用AF2做蛋白和多肽柔性对接2.1蛋白质表面几何物理化学互补问题2.3 多肽柔性/构象处理3. 利用AF2做蛋白结构和序列新设计3.1 trrosetta幻想设计3.2 AF2序列和结构幻想设计4. 利用AF2做结构聚类发现新结构和功能4.1 alphadatabase数据库结构简介与分析4.2 foldseek结构比对工具介绍4.3 新结构与新功能5. 利用AF2做多构象预测和功能发现5.1 MSA采样聚类分析及结构预测5.2 不同MSA可以预测构象之间的转变和功能6. 利用AF2的部分算法模块做模型质量评估和侧链构象等  6.1 三角机制提升蛋白质模型质量评估6.2 局部三角机制和evoformer用于蛋白质侧链预测第六天  蛋白质的从头生成模型1. Rosettafold的基本架构回顾2. 基于Rosettafold的改进a) 有关扩散模型b) 基于扩散模型的模型修改3. RFdiffusion实现通用性蛋白结构生成a) 蛋白质binder生成b) 基于骨架结构的蛋白质结构生成c) 蛋白质单体的从头生成d) 多聚体蛋白的从头生成4. ProteinGenerator实现蛋白质骨架与序列的co-designa) 隐空间中的蛋白质序列-结构的联合分布b) 与rfdiffusion的异同5. Rosettafold AA实现多类生物大分子结构预测与生成a) 加入小分子结构预测器b) 将局部坐标系迁移到小分子结构6. Chroma的基本构架与实现a) 模型讲解b) 利用chroma逼近蛋白构象空间全空间采样与生成第七天  大语言模型在蛋白质设计中的应用及多肽设计1. ProGEN的基本实现a) 模型构架讲解b) 与基于结构方法的比较2. ProGEN的性能与改进 3. ESM-fold的基本构架a) ESM网络构架b) ESMfold网络讲解c) 与alphafold方法的对比4. ESM-fold的性能评估5. 基于大语言模型的蛋白质生成模型的下游应用a) 蛋白质结构的快速预测b) 大型蛋白复合物结构预测6. 多肽设计与蛋白质设计的区别与联系a) 分子结构稳定性i. 二级结构含量ii. 氢键网络与局部二级结构b) 分子的功能性异同c) 蛋白质设计方法在多肽设计面临的瓶颈7. 多肽设计算法a) 基于Rosetta实现多肽设计i. Flexpepdockii. Anchor extensionb) 基于RF diffusion实现多肽设计i. 参数的设定与优化方案ii. 生成结构的评估c) 基于alphafold 梯度下降进行多肽骨架和序列设计d) 多肽对接算法i. 基于Autodock 的多肽对接ii. 基于alphafold的多肽柔性对接iii. 其余对接算法8. 基于多肽蛋白复合物训练的深度学习多肽设计算法02课程目标结构预测基础: 学生将学会通过生物信息学工具分析蛋白质序列,预测其二级结构和三维结构,并理解结构与功能之间的关联。模型应用与评估: 学生将能够使用机器学习和深度学习模型进行蛋白质结构预测,同时学习如何评估模型的准确性和可靠性,选择正确的工具加以应用。药物设计: 掌握与蛋白质结构预测相关的药物设计原理,学会设计靶向特定蛋白质的药物分子与多肽药物分子,理解蛋白类药靶相互作用的机制。03通过课程学习您将得到基于深度学习的通用型蛋白设计模型近几年来发展迅速,本课程围绕蛋白设计基础与前沿工作展开讲述,从蛋白结构的预测与优化到蛋白的从头设计进行深度教学,本课程从零基础开始讲解,对基础知识进行详细讲解,并且会结合前沿文献讲解相关技术的应用。帮助学员们, 通过本次培训学员将了解蛋白质设计的底层逻辑与基本规则,并掌握蛋白质设计中的常见蛋白质设计算法的实际操作,具备基本的蛋白质设计算法开发的基础能力及前沿视野。04授课架构1、课程特色--全面的课程技术应用、原理流程、实例联系全贯穿2、学习模式--理论知识与上机操作相结合,让零基础学员快速熟练掌握3、课程服务答疑--主讲老师将为您实际工作中遇到的问题提供专业解答05课程解疑、学员评价以及资料老师针对每一个学员的培训疑问都会耐心解答,每次培训将近2000余次解疑将近300余页PPT还有相应代码,提供软件安装和指导,报名成功就发送预习视频进行预习主讲老师们来自国内top1高校,组内工作主要聚焦新型蛋白质设计与蛋白质结构预测算法开发与自动化药物高通量筛选方向,已在Nature Chemistry子刊, JCAS,Angew,JMC,JCTC等权威期刊上发表SCI检索论文20余篇02CADD计算机辅助药物设计课程目标Science TechnologyCADD计算机辅助药物设计:依据生物化学、酶学、分子生物学以及遗传学等生命科学的研究成果,以计算机化学为基础,通过计算机的模拟、计算和预算药物与受体生物大分子之间的相互作用,考察药物与靶点的结构互补、性质互补等,设计出合理的药物分子。它是设计和优化先导化合物的方法,特别是在食品、生物、化学、医药、植物、疾病方面应泛!靶点的发现与确证是现代新药研发的第一步,也是新药创制过程中的瓶颈之一。计算机辅助药物设计(computer aided drug design)是以计算机化学为基础,通过计算机的模拟、计算和预算药物与受体生物大分子之间的关系,设计和优化先导化合物的方法。计算机辅助药物设计实际上就是通过模拟和计算受体与配体的这种相互作用,进行先导化合物的优化与设计。计算机辅助药物设计大致包括活性位点分析法、数据库搜寻、全新药物设计   01CADD计算机辅助药物设计课表第一天上午背景与理论知识以及工具准备1.PDB数据库的介绍和使用1.1数据库简介1.2靶点蛋白的结构查询与选取1.3靶点蛋白的结构序列下载1.4靶点蛋白的下载与预处理1.5批量下载蛋白晶体结构2.Pymol的介绍与使用2.1软件基本操作及基本知识介绍2.2蛋白质-配体相互作用图解2.3蛋白-配体小分子表面图、静电势表示2.4蛋白-配体结构叠加与比对2.5绘制相互作用力3.notepad的介绍和使用3.1优势及主要功能介绍3.2界面和基本操作介绍3.3插件安装使用下午一般的蛋白-配体分子对接讲解1.对接的相关理论介绍1.1分子对接的概念及基本原理1.2分子对接的基本方法1.3分子对接的常用软件1.4分子对接的一般流程2.常规的蛋白-配体对接2.1收集受体与配体分子2.2复合体预构象的处理2.3准备受体、配体分子2.4蛋白-配体对接2.5对接结果的分析以新冠病毒蛋白主蛋白酶靶点及相关抑制剂为例第二天虚拟筛选1.小分子数据库的介绍与下载2.相关程序的介绍2.1 openbabel的介绍和使用2.2 chemdraw的介绍与使用3.虚拟筛选的前处理4.虚拟筛选的流程及实战演示案例:筛选新冠病毒主蛋白酶抑制剂5.结果分析与作图6.药物ADME预测6.1ADME概念介绍6.2预测相关网站及软件介绍6.3预测结果的分析第三天拓展对接的使用方法1.蛋白-蛋白对接1.1蛋白-蛋白对接的应用场景1.2相关程序的介绍1.3目标蛋白的收集以及预处理1.4使用算例进行运算1.5关键残基的预设1.6结果的获取与文件类型1.7结果的分析以目前火热的靶点PD-1/PD-L1等为例。2.涉及金属酶蛋白的对接2.1金属酶蛋白-配体的背景介绍2.2蛋白与配体分子的收集与预处理2.3金属离子的处理2.4金属辅酶蛋白-配体的对接2.5结果分析以人类法尼基转移酶及其抑制剂为例3.蛋白-多糖分子对接4.1蛋白-多糖相互作用4.2对接处理的要点4.3蛋白-多糖分子对接的流程4.4蛋白-多糖分子对接4.5相关结果分析以α-糖苷转移酶和多糖分子对接为例5.核酸-小分子对接5.1核酸-小分子的应用现状5.2相关的程序介绍5.3核酸-小分子的结合种类5.4核酸-小分子对接5.5相关结果的分析以人端粒g -四链和配体分子对接为例。操作流程介绍及实战演示第四天拓展对接的使用方法1.柔性对接1.1柔性对接的使用场景介绍1.2柔性对接的优势1.3蛋白-配体的柔性对接重点:柔性残基的设置方法1.4相关结果的分析以周期蛋白依赖性激酶2(CDK2)与配体1CK为例2.共价对接2.1两种共价对接方法的介绍2.1.1柔性侧链法2.1.2两点吸引子法2.2蛋白和配体的收集以及预处理2.3共价药物分子与靶蛋白的共价对接2.4结果的对比以目前火热的新冠共价药物为例。3.蛋白-水合对接3.1水合作用在蛋白-配体相互作用中的意义及方法介绍3.2蛋白和配体的收集以及预处理3.3对接相关参数的准备重点:水分子的加入和处理3.4蛋白-水分子-配体对接3.5结果分析以乙酰胆碱结合蛋白(AChBP)与尼古丁复合物为例第五天分子动力学模拟(linux与gromacs使用安装)1. linux系统的介绍和简单使用1.1 linux常用命令行1.2 linux上的常用程序安装1.3体验:如何在linux上进行虚拟筛选2.分子动力学的理论介绍2.1分子动力学模拟的原理2.2分子动力学模拟的方法及相关程序2.3相关力场的介绍3.gromacs使用及介绍重点:主要命令及参数的介绍4.origin介绍及使用第六天溶剂化分子动力学模拟的执行1.一般的溶剂化蛋白的处理流程2.蛋白晶体的准备3.结构的能量最小化4.对体系的预平衡5.无限制的分子动力学模拟6.分子动力学结果展示与解读以水中的溶菌酶为例第七天蛋白-配体分子动力学模拟的执行1.蛋白-配体在分子动力学模拟的处理流程2.蛋白晶体的准备3.蛋白-配体模拟初始构象的准备4.配体分子力场拓扑文件的准备4.1高斯的简要介绍4.2 ambertool的简要介绍4.3生成小分子的力场参数文件5.对复合物体系温度和压力分别限制的预平衡6.无限制的分子动力学模拟7.分子动力学结果展示与解读8.轨迹后处理及分析以新冠病毒蛋白主蛋白酶靶点及相关抑制剂为例      02课程目标让学员熟练掌握:PDB数据库、靶点蛋白、蛋白质-配体、蛋白-配体小分子、蛋白-配体结构、分子对接、蛋白-配体对接、虚拟筛选、蛋白-蛋白对接、蛋白-多糖分子对接、蛋白-水合对接、分子动力学等技术03培训对象目前计算机辅助药物设计受众人体众多,列如CADD、药物设计、药学、药物研发、药物筛选、新药研发、药物化学、生物制药、免疫、天然产物、兽药研发,生物信息、中药药理、中药化学、网络药理、结构药理、食品安全、食品风味、食药研发、食品研发、抗肿瘤药物、肿瘤免疫、酶工程、遗传、抗体药物、农业工程、化学、有机合成、有机化学、结构生物、合成生物等众多科研人员。04培训架构1、课程特色--全面的课程技术应用、原理流程、实例联系全贯穿2、学习模式--理论知识与上机操作相结合,让零基础学员快速熟练掌握3、课程服务答疑--主讲老师将为您实际工作中遇到的问题提供专业解答05授课资料老师备课PPT将近1000余页,培训软件都会提供以及指导安装    目前为止已经举办30余期,参会学员达3000余人,学员评价一致非常满意,算是国内CADD计算机辅助药物设计最好的培训课程计算机辅助药物设计主讲老师来自国内高校北京协和医院药物研究所,主要擅长药物虚拟筛选、计算机辅助药物设计、人工智能药物发现、分子对接、分子动力学等方面的研究,有十余年的研究经验,以第一作发表论文20余篇SPORTS03AIDD人工智能药物发现与设计发现课程目标Science Technology AIDD人工智能药物发现与设计:是人工智能和机器学习技术使制药领域实现了现代化。目前机器学习和深度学习算法已被应用于多肽合成、虚拟筛选、毒性预测、药物监测和释放、药效团建模、定量构效关系、药物重定位、多药理和生理活性等药物发现过程。可以很好的将传统的面向化学的药物发现与人工智能药物设计相结合。此外,世界各地的系统生物学和化学科学家与计算科学家合作,开发现代ML算法和原理,大大的可以促进药物的发现和开发。   01AIDD人工智能药物发现与设计课表第一天1.AIDD概述及药物综合数据库介绍2.人工智能辅助药物设计AIDD概述3.安装环境(1)anaconda(2)vscode(3)pycharm(4)虚拟环境4.第三方库基本使用方法(1)numpy(2)pandas(3)matplotlib(4)requests5.多种药物综合数据库的获取方式(1)KEGG(requests爬虫)(2)Chebi(libChEBIpy)(3)PubChem(pubchempy / requests)(4)ChEMBL(chembl_webresource_client)(5)BiGG(curl)(6)PDB(pypdb)第二天 ML-based AIDD1.机器学习(1)机器学习种类:①监督学习②无监督学习③强化学习(2)典型机器学习方法①决策树②支持向量机③朴素贝叶斯④神经网络⑤卷积神经网络(3)模型的评估与验证(4)分类评估:准确率、精确率、召回率、F1分数、ROC曲线、AUC计算(5)回归评估:平均绝对误差、均方差、R2分数、可释方差分数(6)交叉验证2.sklearn工具包基本使用3.rdkit工具包的基本使用4.化合物编码方式和化合物相似性理论知识5.项目实战1:基于ADME和Ro5的分子筛选6.项目实战2:基于化合物相似性的配体筛选7.项目实战3:基于化合物相似性的分子聚类8.项目实战4:   基于机器学习的生物活性预测9.项目实战5:基于机器学习的分子毒性预测第三天 GNN-based AIDD1.图神经网络(1)框架介绍: PyG,DGL,TorchDrug(2)图神经网络消息传递机制(3)图神经网络数据集设计(4)图神经网络节点预测、图预测任务和边预测任务实战2.论文精讲:DeepTox: Toxicity Prediction using Deep Learning3.项目实战1:基于图神经网络的分子毒性预测(1)SMILES分子数据集构建PyG图数据集(2)基于GNN进行分子毒性预测4.项目实战2:基于图神经网络的蛋白质-配体相互作用预测(1)蛋白质分子图形化,构建PyG图数据集(2)基于GIN进行网络搭建及相互作用预测第四天 NLP-based AIDD1.自然语言处理(1)Encoder-Decoder模型(2)循环神经网络 RNN(3)Seq2seq(4)Attention(5)Transformer2.项目实战1:基于自然语言的分子毒性预测(1)SMILES分子数据集词向量表示方法(2)基于NLP模型进行分子毒性预测3.项目实战2:基于Transformer的有机化学反应产量预测 (Prediction of chemical reaction yields using deep learning)4.论文精读及代码讲解:《Mapping the space of chemical reactions using attention-based neural networks》第五天 分子生成与药物设计1.分子生成模型(1)循环神经网络RNN(2)变分自动编码器VAE(3)生成对抗网络GAN(4)强化学习RL2.项目实战1: 基于图数据的小分子化合物生成模型《A Graph to Graphs Framework for Retrosynthesis Prediction》3.项目实战2: 基于NLP的抗体生成模型《Generative language modeling for antibody design》第六天深度学习的蛋白质-配体相互作用预测蛋白质基本知识介绍蛋白质的基本格式:序列、二级结构、三级结构多重序列对比数据库介绍与相关数据爬取PDB数据库UniProt数据库KLIFS数据库基于RDKit的蛋白质基本处理基于RDKit的药效团特征与可视化基于RDKit的骨架和片段处理基于RDKit的分子3D构象生成与优化项目实战:基于序列的蛋白质属性预测项目实战:基于结构的蛋白质属性预测项目实战:基于深度学习的蛋白质-配体相互作用基于深度学习的结合位点比较和脱靶预测基于深度学习的蛋白质结合位点检测基于分子对接预测小分子在蛋白质结合位点的结合模式蛋白质-配体相互作用模型搭建基于蛋白质-配体相互作用分析器PLIP深入了解蛋白质-配体相互作用基于机器学习的分子对接来预测蛋白质-配体的结合亲和力(回归任务)基于三维构象的蛋白质-配体对接及NGLView可视化基于蛋白质三维数据使用原子卷积网络进行蛋白质-配体相互作用预测02课程目标AIDD人工智能药物发现与设计课程:让学员了解药物发现的前沿背景,学习人工智能领域的各类常见算法,熟悉工具包的安装与使用,掌握一定的算法编程能力,能够运用计算机方法研究药物相关问题。通过大量的案例讲解和实践操作,具备一定的AIDD模型构建和数据分析能力03培训历程目前为止已经举办30余期,参会学员达2800余人,学员评价一致非常满意,填补了国内人工智能药物研发技术的空白04培训对象目前AIDD药物研发设计受众人体众多,列如CADD、药物设计、药学、药物研发、药物筛选、新药研发、药物化学、生物制药、免疫、天然产物、兽药研发,生物信息、中药药理、中药化学、网络药理、结构药理、食品安全、食品风味、食药研发、食品研发、抗肿瘤药物、肿瘤免疫、酶工程、遗传、抗体药物、农业工程、化学、有机合成、有机化学、结构生物、合成生物等众多科研人员。05培训架构1、课程特色--全面的课程技术应用、原理流程、实例联系全贯穿2、学习模式--理论知识与上机操作相结合,让零基础学员快速熟练掌握3、课程服务答疑--主讲老师将为您实际工作中遇到的问题提供专业解答05授课老师 AIDD授课老师老师,有十余年的计算机算法研究和程序设计经验。研究方向涉及生物信息学,深度学习,药物靶标识别,药物不良反应等。参与了国自然基金2项,主持了省厅级科研项目3项。一作身份发表SCI论文数篇,包括BMC Bioinformatics, Journal of Biomedical Informatics, International Journal of Molecular Sciences等知名期刊。授课时间安排01深度学习蛋白质设计授课时间2024.06.08-2024.06.09(9:00-11:30)--(13:30-17:00)2024.06.15-2024.06.16(9:00-11:30)--(13:30-17:00)2024.06.22-2024.06.23(9:00-11:30)--(13:30-17:00)2024.06.29(9:00-11:30)--(13:30-17:00)共计全7天的课 通过腾讯会议直播    线上实操    提供全部录播02CADD计算机辅助药物设计授课时间2024.06.08-2024.06.09(9:00-11:30)--(13:30-17:00)2024.06.15-2024.06.16(9:00-11:30)--(13:30-17:00)2024.06.22-2024.06.23(9:00-11:30)--(13:30-17:00)2024.06.29(9:00-11:30)--(13:30-17:00)共计全7天的课 通过腾讯会议直播    线上实操    提供全部录播 03AIDD人工智能药物发现与设计授课时间2024.06.11-2024.06.14 (19:00-22:00)2024.06.17-2024.06.20(19:00-22:00)2024.06.24-2024.06.27(19:00-22:00)共计全6天的课 通过腾讯会议直播    线上实操     提供全部录播培训费用及福利课程报名费用:深度学习蛋白质设计:公费价:每人每班¥6880元 (含报名费、培训费、资料费、提供课后全程回放资料)自费价:每人每班¥6480元 (含报名费、培训费、资料费、提供课后全程回放资料)CADD计算机辅助药物设计与AIDD药物发现与设计:公费价:每人每班¥5880元 (含报名费、培训费、资料费、提供课后全程回放资料)自费价:每人每班¥5480元 (含报名费、培训费、资料费、提供课后全程回放资料)重磅优惠:报二送一(同时报名两个班免费赠送一个学习名额赠送班任选)报四送二(同时报名四个班免费赠送两个学习名额赠送班任选)优惠1:两班同报:10880元  (原价18640)三班同报:14880元   (原价23620)可免费学习一年特惠:24880元 (可免费学习一整年本单位举办的任意课程)可免费学习两年特惠:(28880元可免费学习两整年本单位举办的任意课程)优惠2:提前报名缴费可享受300元优惠(仅限十五名)报名学习课程可赠送往期课程回放(报多少赠多少)(可点击跳转详情链接):回放一:机器学习生物医学回放二:机器学习单细胞分析专题回放三:单细胞空间转录组专题回放四:比较基因组学专题回放五:机器学习蛋白组学专题回放六:机器学习微生物专题回放七:蛋白质晶体结构解析回放八:机器学习代谢组学技术培训特色及福利1、课程特色--全面的课程技术应用、原理流程、实例联系全贯穿2、学习模式--理论知识与上机操作相结合,让零基础学员快速熟练掌握3、课程服务答疑--主讲老师将为您实际工作中遇到的问题提供专业解答授课方式:通过腾讯会议线上直播,理论+实操的授课模式,老师手把手带着操作,从零基础开始讲解,电子PPT和教程开课前一周提前发送给学员,所有培训使用软件都会发送给学员,有什么疑问采取开麦共享屏幕和微信群解疑,学员和老师交流、学员与学员交流,培训完毕后老师长期解疑,培训群不解散,往期培训学员对于培训质量和授课方式一致评价极高!腾讯会议实时直播解答|手把手带着操作学员对于培训给予高度评价学员培训后投顶刊报名咨询方式(请二维码扫描下方微信) 微信:766728764 电子邮箱:m15238680799@163.com 电话:15238680799引用本次参会学员的一句话:发现真的是脚踏实地的同时 需要偶尔仰望星空非常感谢各位对我们培训的认可!祝愿各位心想事成往期参会单位▼国外院系高校;有来自麻省理工大学、University of Bristol (布里斯托大学)、加州伯克利大学、Osaka University(大版大学)、乔治梅森大学、加州理工大学、曼彻斯特大学莱斯大学波士顿大学、德州 农工大学、德雷克大学、美国联合大学、普林斯顿大学、斯坦福大学Imperial College London、KAUSTuniversity、理海大学、TheUniversityofQueensland、澳大利亚昆士兰大学、耶鲁大学牛津大学剑桥大学匹兹堡大学悉尼大学、多伦多大学、西雅图华盛顿大学、伦敦大学杜克大学、东京大学、哥伦比亚大学、康奈尔大学、纽约大学西北大学布朗大学华盛顿大学等 国内院系高校;有来自中山大学清华大学浙江大学北京大学第一医院中国医学科学院北京协和医院、西北民族大学、西南大学山东大学、启元实验室、中国人民解放军总医院第一医学中心、广东海洋大学武汉大学中国农业大学河南师范大学南京工业大学上海交通大学南方科技大学南京大学中国医学科学院基础医学研究所、青海省农林科学院、天津中医药大学第一附属医院、山东大学、黑龙江八一农垦大学、南昌大学第二附属医院、台州市中心医院(台州学院附属医院)、宁波大 学附属人民医院、新疆农业大学、北京林业大学广西医科大学、湖南文理学院、滨州医学院、滨州医学 院烟台附属医院、华南师范大学中国环境科学研究院云南师范大学昆明理工大学湖北医药学院、临港实验室、 苏州大学福州大学南方医院南昌大学第二附属医院深圳市中医院、湖南文理学院、河南科技学院、福建省立医院中南大学湘雅医院深圳市中医院、省立同德医院、内蒙古科技大学包头师范学院、 乌鲁木齐市疾病预防控制中心、中国林业科学研究院林业研究所、中国农业科学院兰州畜牧与兽药研究 所、鲁东大学、河北工程大学、南方医科大学珠江医院、首都医科大学附属北京妇产医院、重庆医科大学 附属第二医院、复旦大学上海医学院、陕西中医药大学附属医院、中国 医学科学院血液病医院(中国医学科学院血液学研究所)、深圳北京大学、 香港科技大学医学中心、天津市肿瘤医院陆军特色医学中心、空军军医大学第一附属医院、江南大学、 中国科学院深圳先进技术研究院等5000余名学员还有很多公司和科研院所以及高校!感谢对我们培训的认可!还有许多因为时间冲突无法参加。这次我们诚挚邀请您来参加!声明:此内容由第三方提供、授权发布或者转载自第三方;本内容一切版权及连带责任由第三方负责,与本公众号无关。据此内容作出的任何判断,后果自负。
更多内容,请访问原始网站
文中所述内容并不反映新药情报库及其所属公司任何意见及观点,如有版权侵扰或错误之处,请及时联系我们,我们会在24小时内配合处理。
立即开始免费试用!
智慧芽新药情报库是智慧芽专为生命科学人士构建的基于AI的创新药情报平台,助您全方位提升您的研发与决策效率。
立即开始数据试用!
智慧芽新药库数据也通过智慧芽数据服务平台,以API或者数据包形式对外开放,助您更加充分利用智慧芽新药情报信息。