人工智能化学研发—国工智能

AI+化学研发板块

“AI for Science”类研发

      AI+化学研发模块涵盖了催化剂研发过程中的重要过程,如分子生成、性能预测、结构生成、反应预测、合成路线推荐、实验优化、小分子催化剂设计、电解质材料研发、OLED器件设计等,使用方法基本是在原有科学计算方法基础上,根据实际应用场景在不同层面结合AI,以取得单靠AI和单靠原有计算方法所无法达到的效果。GoCatal®目前已包含的有针对于金属-有机配体类均相催化剂开发相关模块,和针对于无机晶体类、负载型等非均相催化剂的开发相关模块。
  

功能模块

实验室研发

在化学/化工领域的实验室研发阶段,比如小分子催化剂设计、电解质材料研发、OLED器件设计等,现有研发手段依赖于实验人员的专业知识和各类成本高昂、周期漫长的合成、表征等手段。结合计算化学和机器学习,可以在初期积累的实验数据基础上进行分子信息挖掘与性能预测,并结合生成模型推荐符合性能需求的小分子、材料、或器件,有效降低实验成本,缩减研发周期,减少试错空间。

实验优化

不论是实验室研发阶段,还是小试、中试阶段,都会遇到如何选择较优的实验条件的问题。比如选用的催化剂类型、原料配比、温度、压力等等,这些实验条件的选取直接影响最后的产率。常用的正交实验、高通量实验等手段,依然经常面临试错成本高、效果不明显等问题。国工结合计算化学、知识图谱、AI算法、以及自动化实验平台,打造出一套技术高度整合、学科高度交叉的智能型实验优化平台,面对客户的具体需求,可以从积累的数据库中利用AI算法选择最适合的实验条件,并经过实验验证,在短周期内将经过实验验证的各类条件交予客户手中。

分子生成器

具有所期望性能的新的分子结构,已有实验数据的分子结构所期望的性能。在有了清晰的“构效关系”后,将其嵌入到分子生成算法中,算法便可以根据提示朝着所希望的性能去生成分子。结合前面的性能预测器一起使用,便形成一整套AI辅助下的催化剂设计工具。

性能预测器

性能预测器基于先前的实验和文献数据,用于预测新催化剂的性能。首先,计算催化剂的结构描述符和电子描述符。结构描述符包括埋藏体积、特定键长和键角、分子体积以及表面积等。电子结构描述符则包括福井函数、电子密度和轨道能量等指标。为了满足计算精度和速度的需求,采用不同级别的结构优化方法,如力场、半经验和密度泛函理论(DFT)。接下来,建立描述符和催化剂性质之间的机器学习模型。选择适当的特征和机器学习模型的超参数,并在必要时考虑实验条件与描述符的关联。然后,利用机器学习模型筛选出符合要求的新分子。这种将机器学习与计算化学相结合的方法极大地缩小了实验筛选的范围,从而加快了分子发现的进程。

反应预测器

反应预测器能够从微观尺度上基于量子化学方法快速计算如气相、溶液、体相等多种复杂环境反应体系的一系列反应过程,给出完整的反应路径信息。由此能够清晰地找出过渡态从而推断反应决速步,并给出各种可能出现的产物和副产物以及对应的产率分布。借助反应预测器,能够在降低实验成本的同时提高研发效率,完善更加全面的反应信息,帮助理解化工体系中的各种微观反应机理。在实际的化工生产中对提高生产效率,降低生产成本来说具有重要意义。

合成路线推荐器

合成路线推荐器由Corey在20世纪60年代提出,用来描述通过断键将一个复杂的目标分子还原为简单前体或可购买化合物的迭代过程。传统的逆合成方法基于专家经验和大量文献查询,时间长,成本高。该逆合成平台,基于先进人工智能算法,可以短时间内生成合理的目标化合物合成路线,具有以下优势:
- 产生新想法:找到新化合物的合成途径或者旧化合物的新的合成路径
- 节省时间:减少开发合成路径的时间和精力
- 降低研发成本:提高合成成功率
- 增强知识:学习数据库以及专家经验

结构生成器

非均相催化结构生成器:在非均相催化体系中,催化剂以固相或负载在固相上存在,而催化剂结构、载体结构对催化性能都有着影响。在“非均相催化性能预测器”的基础上,后面连接“非均相催化结构生成器”,可以根据所希望的催化性能,输出所对应的催化剂结构、或载体结构。

有机反应预测器

当给定反应物,如果能预知后续会发生什么样的一系列反应,对于提高主产物收率、副产物利用等有着重要意义。“有机反应预测器”,根据所输入的反应物,可以输出可能得到的产物及产率分布。值得一提的是,与“合成路线推荐器”联合使用,对于开发合成路线来说效果更佳。

产品功能

实验优化器
结构生成器
合成路线推荐器
反应预测器
分子生成器
性能预测器
实验优化器
实验优化器

“实验优化器”,输入所希望优化的实验(工艺)参数空间,如温度、压力、溶剂配比等,以及希望优化的性能,如收率、反应时间等,经过少量的实验迭代,可以快速找到最佳性能所对应的实验(工艺)参数。注意,“实验优化器”在使用过程中,需要与实验配合使用。

 

 

优化的实验(工艺)参数

 

当给定一条工艺路线之后,所需要调试的工艺参数往往需要大量实验来寻找最佳的参数组合。

结构生成器
非均相催化结构生成器

在非均相催化体系中,催化剂以固相或负载在固相上存在,而催化剂结构、载体结构对催化性能都有着影响。在“非均相催化性能预测器”的基础上,后面连接“非均相催化结构生成器”,可以根据所希望的催化性能,输出所对应的催化剂结构、或载体结构。

 

电池材料分子(结构)生成器

 

当知道电池微观尺度的分子结构等信息与所展现的性能之间关系之后,可以提出所期望的性能,反推所对应的微观结构。还是以电解液添加剂为例,在“电池材料性能预测器”的基础上,后面接入“电池材料分子(结构)生成器”,可以输入所期望的电解液性能,输出为对应的添加剂信息(分子结构、添加量等)。

合成路线推荐器
合成路线推荐器

合成路线推荐器由Corey在20世纪60年代提出,用来描述通过断键将一个复杂的目标分子还原为简单前体或可购买化合物的迭代过程。传统的逆合成方法基于专家经验和大量文献查询,时间长,成本高。该逆合成平台,基于先进人工智能算法,可以短时间内生成合理的目标化合物合成路线。

 

逆合成方法优势

 

- 产生新想法:找到新化合物的合成途径或者旧化合物的新的合成路径。
- 节省时间:减少开发合成路径的时间和精力。
- 降低研发成本:提高合成成功率。
- 增强知识:学习数据库以及专家经验。

反应预测器
反应物:支持溶液环境

反应预测器能够从微观尺度上基于量子化学方法快速计算如气相、溶液、体相等多种复杂环境反应体系的一系列反应过程,给出完整的反应路径信息。由此能够清晰地找出过渡态从而推断反应决速步,并给出各种可能出现的产物和副产物以及对应的产率分布。借助反应预测器,能够在降低实验成本的同时提高研发效率,完善更加全面的反应信息,帮助理解化工体系中的各种微观反应机理。在实际的化工生产中对提高生产效率,降低生产成本来说具有重要意义。
 

后续可能发生的一系列反应

 

给出完整的反应路径、清晰找出决速步、给出可能出现的副产物、给出产率分布

分子生成器
分子生成

在传统分子发现流程中,全新可绕开专利限制的分子发现任务往往需要大量专家通过对与文献中分子相近的极其有限的化学空间进行猜测和尝试来进行,这大大增加了分子发现流程的周期和成本,也限制了分子的多样性,对此,分子生成模型通过给定分子的各种约束来逆向生成分子而为分子发现提供了一种新的解决方案。

 

分子生成模型优势

 

  • 不受限于小数据集:国工自研的分子生成模型完全脱离了文献小数据集的桎梏,可以只通过人为指定的规则(无需指定数据集)生成大量高多样性的满足规则的分子。
  • 精确生成满足规则的分子:国工自研的分子生成模型可以根据指定的规则(比如结合能力在某一个特定的区间中甚至为一个特定的值)极其精确的生成满足规则且多样性极强的分子,以供实验端满足后期尝试的需要。
  • 高效利用后期化学实验迭代数据:国工自研的分子生成模型可以通过直接提取反馈数据中蕴含的规则的形式高效利用珍贵的实验数据而大大节约后期实验成本。
  • 可以大量生成在现有公开数据集中完全不存在且满足特定规则的高多样性分子:国工自研的分子生成模型基于独特的化学空间探索技术,完全不受规则难度的影响,可以在公开数据集中完全无法找到符合规则的分子的场景中(这类场景中传统基于规则的分子生成算法几乎完全无法运行)正常运行并产生大量高多样性的目标分子。
性能预测器
性能预测器:用于预测新催化剂的性能

首先,计算催化剂的结构描述符和电子描述符。结构描述符包括埋藏体积、特定键长和键角、分子体积以及表面积等。电子结构描述符则包括福井函数、电子密度和轨道能量等指标。为了满足计算精度和速度的需求,采用不同级别的结构优化方法,如力场、半经验和密度泛函理论(DFT)。

 

催化剂性质之间的机器学习模型

 

接下来,建立描述符和催化剂性质之间的机器学习模型。选择适当的特征和机器学习模型的超参数,并在必要时考虑实验条件与描述符的关联。然后,利用机器学习模型筛选出符合要求的新分子。这种将机器学习与计算化学相结合的方法极大地缩小了实验筛选的范围,从而加快了分子发现的进程。

AI+化学研发平台

均相催化性能预测

“性能预测”和“分子生成”,其中性能预测输入为分子结构(可来自于人工设计或算法合成),输出为此分子的催化性能。

均相催化分子生成

在有了清晰的“构效关系”后,将其嵌入到分子生成算法中,算法便可以根据提示朝着所希望的性能去生成分子。结合前面的性能预测一起使用,便形成一整套AI辅助下的催化剂设计工具。

高分子性能预测

所谓高分子性能预测是针对一类高分子材料,输入单体,可以给出其二级结构、三级结构,然后结合聚合工艺,进一步预测其聚合性能。

高分子单体生成

在高分子材料研发中,除了聚合工艺外,单体分子结构是影响聚合物性能的主要因素。在单体-聚合性能关系建立后,即在“高分子性能预测”的基础上,可以连接“高分子单体生成”。

非均相催化性能预测

非均相催化是化工体系中的重要一环。非均相催化体系中,涉及到的催化剂往往以固相存在,而反应物可能是气相或液相,这种反应体系更容易对催化剂进行分离和回收利用。

非均相催化结构生成

在“非均相催化性能预测”的基础上,后面连接“非均相催化结构生成”,可以根据所希望的催化性能,输出所对应的催化剂结构、或载体结构。

复合材料性能预测

很多复合材料,单体以某种配比进行混合后,互相之间不发生复杂的化学反应,但混在一起展现出某种特定的物理性能,液晶、涂料、橡胶等都具有此类特点。

复合材料单体生成

所谓“复合材料单体生成”,即在“复合材料性能预测”的基础上,可以输入所希望的材料性能,将输出所对应的单体配比,甚至单体分子结构。

研发场景

催化剂设计

设计一款新的分子结构;设计新的晶体结构

合成(制备)路线开发

如何合成一款已知结构的分子;如何制备一款已知结构的物质

副产物分析

确定副产物结构;降低副产物比例

实验条件(工艺参数)优化

在指定参数探索空间确定最佳实验条件;在更广阔的参数空间推荐更优的工艺参数
欢迎咨询,了解更多产品信息
免费咨询,为您定制解决方案
立即咨询