鄂维南院士:再谈AI for Science_哔哩哔哩_bilibili
以往处理高维问题
量子力学:单变量乘积
统计学:旋转
AI4S
处理数据
蛋白质折叠?
不是纯粹的数据驱动
物理学等学科基本原理
例:分子动力学
数据+模型
流程图
这张图展示了从超大型数据库到机器学习模型的流程:
-
超大型数据库:首先有一个“超大型数据库”,其中包含了大量的数据。
-
聚类(clustering):对数据库中的数据进行聚类处理。
-
符号配体(symbol ligands):通过聚类得到的结果用于表示为“符号配体”。
-
重采样(resampling):然后对这些符号配体进行重采样操作。
-
对接(docking):接着进行对接过程,产生一个“对接得分”(docking score)。
-
训练(training):利用得到的对接得分来训练一个模型。
-
验证(validation):在训练过程中,会对模型进行验证以确保其准确性。
-
模型偏差(model deviation):在整个过程中还会考虑模型的偏差问题。
-
机器学习模型:最后,经过上述步骤处理后,会形成一个“机器学习模型”。
-
推断(inference):这个机器学习模型可以用来做推断或预测。
整个流程涉及了数据处理、特征提取、模型训练与验证等多个环节,最终目的是为了构建一个有效的机器学习模型来进行后续的分析或预测工作。
原始方法
前景
实验
知识库