基于人工智能的化学研发平台的思考与实践
2021-06-23
行业新闻

分享:

根据我们项目经验当前化学研发过程中,存在以下几个行业痛点。

第一是实验结果难复现,很多情况下实验结果会不稳定。同一个实验,不同的人做,每个人的结果有差异收益率最高的那个实验结果,让同一个人复现,可能复现的结果还是有差异。

第二点是实验过程管理困难大规模研发机构中研发人员会有几百甚至成千上万人,每个人掌握着各人的研发实验记录实验数据,作为研发的经理,对资源的管理和整合比较困难。

第三,研发所产生的数据和经验,整合困难。不容易描述,会随着人员的流失而流失。

第四点研发所考虑的因素复杂,设计成本、供应链体系、生产安全等,同时各类文献种类繁多,导致研发周期很长,并且检索时难免会有遗漏

国工智能发布了新一代化工研发的人工智能解决方案,来解决上述问题。

 

 

在国工智能研发平台中会规范整个研发过程。首先委托单下达研发机构或者企业的研发中心,在研发委托下达后,系统会分配一个带有二维码的的委托编号,这个二维码中包含了研发项目所要用到的试剂、容器以及整个研发过程中所有的数据,整个研发过程通过这个二维码就可以进行追溯。。第二步,近似性搜索,系统自动检索全球化合物库和企业自身研发数据库中一些和所需化合物相类似的相关研发项目。简单来说,就是实验所用到的原材料和以前研发项目用到的原材料比较像,或者是分子结构特征相符,从而可以进行复用推荐。系统研发过程数据提取出来,进行推送,以此来减少研发时的重复成本投入。

如果近似性搜索库中没有近似项,那么系统会调用逆向合成机器人系统逆向推导所需化合物合成过程以及合成途径中所引用的相关文献,会自动生成多条合成路径来扩展研发人员的研发思路通过相应的路线和可参考的资料,企业可以进行人为干预的合成路线实验设计和修正,同时人工智能算法会自动学习企业常用的化合物和合成习惯,从而可以将整个研发团队的经验进行数字化积累。

研发管理系统会分发研发任务到电子实验记录本,以及会自动调用相关的实验辅助设计DOE部分算法,如回归算法、随机森林,来完成整个实验路线的辅助设计。系统会自动采集检验分析的相关的仪器如色谱质谱,同时获取实验室的反应条件以及温湿度的环境和相关试剂的批次信息以用于后续实验结果复现。最后经过结果审核,科研结果归档。经过归档之后,整个的数据流程会记录到近似性搜索数据库中,备于后续检索

 

 

研发项目的管理涵盖了科研项目管理的整个过程,里面包含了例如立项的论证,建议和审批,进度计划和风险计划,以及任务的分发,包括分配给每个研究员各自的实验路线,实验设计,实验过程中所使用的试剂,同时也可以跟踪实验的进度。作为研发项目的经理,可以直接的了解项目整的进度。


 

 

 

 

近似性搜索,系统自带公开化合物信息库里面亿个已知分子结构,并融合企业自身的一些特殊化合物,将化合物信息归集到企业本地数据库,从而实现数据的离线检索和保存,能有效防止研发数据泄露。

 

在新一代的人工智能框架下,把目标化合物分子结构输入系统人工智能依赖于全球上百万份的文献数据自动完成未知化合物合成路线的推理和推导工作。人工智能平台带有自学习功能初次给出的合成路线不一定完全是符合企业的研发特征,但是经过持续的自我训练,系统会学习并模拟企业的研发习惯,用料习惯,从而系统生成的合成路线无限接近企业特点

 

 

人工智能生成逆向合成路线,所用原料会优先从化合物商品库中进行检索,优先采用标准常用化合物进行和合成。

 

 

 

化合物正向合成推导,在进行合成路线设计时可以通过原料化合物来推导反应结果,从而减少合成风险。

 

自动提供提供相关参考文献

 

整个研发辅助系统部署在企业本地,没有外网传输,杜绝研发数据泄露。完成本地化部署以后,系统就开始不断地搜集和学习所有研发人员的研发行为和研发习惯,自我学习自我更新同时配合国工智能生产制造一体化解决方案,会把销售、科研、生产、质检平台一体化,实现全产业链条的业务优化。

 

根据生产和质量数据人工智能系统会直接计算最优的收益率,最优原材料配比,最优的反应时间、温度并给出最优工艺参数建议同时系统可以反向控制相关反应设备,形成优化闭环。

 

 

 

在国工智能制造平台(MOM)包含了研发管理(DEV)、实验室与质量管理系统(LIMS)这些系统均可以与实验室设备进行联动和互通,系统会自动抓取色谱,天平,PH计等实验设备数据,来提高数据分析质量和实验复现效率。

 

 

数据大脑拥有大量的算法封装除了人工智能算法也包括了SPC,CPK,DOE,六西格玛等分析工具。满足企业各种计算需求。

 

人工智能在辅助化学的研发过程,存在着巨大的价值,

第一,系统能协同完成整个实验的执行过程,所有的研发人员的研发过程都会在系统中进行显示,项目进度能有效的管理。

第二,系统会控制整个研发过程的成本与周期实时记录和反馈人天和物料等成本消耗情况,离计划目标完成的情况等,做到计划可控。

第三,系统会将研发经验进行储备,归结到一个AI模型中去,AI会自主对研发经验进行整理和学习,从而减少科研人员离职的风险。

第四,系统会充分挖掘海量研发数据中存在的价值在研发过程中,企业会积累大量的研发数据研发经验,这些数据可以通过一些算法,配方和工艺提取出来,通过AI系统进行再次优化。充分发挥了人工智能和机器学习的潜能

第五,保证研发数据可追溯性,获得准确可靠的分析成果。研发项目在立项的开始就会形成一个的项目编码,通过这个的编码企业可以找到整个研发过程当中所有的数据。

相关标签

推荐新闻