AI for Science
一、摘要
作为一个研究对象涵盖基本物质、生命体和社会的跨学科研究领域,复杂系统的研究有助于增进对自然和社会现象的理解和预测,在解决人类面临的复杂问题中具有重要价值。这一领域的早期研究积累了海量的各类真实复杂系统数据,在此基础上发展数据密集型、人工智能方法驱动的复杂性科学研究新范式,将为复杂系统的描述、预测与知识发现提供一条全新的路径。
在此背景下,复杂系统研究与AI的结合,预示着一种新的可能性。这种以数据为中心、AI驱动的复杂性科学研究新范式,有可能突破领域研究瓶颈,帮助我们更好的理解自然界和社会中的各类复杂现象、更可靠地预测和控制系统的未来行为,应对现实世界中的复杂问题和挑战。
二、复杂性科学与复杂系统的早期研究
2000 年以来兴起的复杂网络研究方法是把各类复杂系统简化为节点以及连接节点的边的集合,
节点代表系统的基本单元,边代表各个单元之间的相互作用。尽管这些各种理论与模型为我们理解真实世界的复杂性质提供了重要的工具,然而,现有研究在以下3个方向仍存在挑战:
首先,复杂系统规模宏大,且存在典型的多尺度和异质性,难以基于第一性原理进行精确、高效的仿真模拟;其次,系统内部广泛存在的非线性动力学和非高斯(幂律)分布造成了系统演化的不确定性,存在多个不同稳定状态(相),即便是很小的扰动也可能发生状态转移,使得当前复杂系统预测方法的(长期)预测真实性受到很大制约;最后,系统微观层面的个体状态与相互作用难以适用于统计方法中的概率描述,两者间的存在和共演化也对理论建模提出了挑战。
三、AI助力下的复杂系统研究
目前结合AI技术的复杂系统研究主要包括预测模拟与规律发现工作
3.1 预测模拟
相比传统复杂系统预测方法,数据驱动的AI 方法通过在观测系统数据基础上训练机器学习模型,从数据中提炼出通用规律用于目标系统的预测,不受理论模型分析能力和适用条件的制约,可
以提供更高精度和更细粒度的预测结果。
其中,如何提升现有 AI 预测方法的可解释性以及对概率分布的建模能力是一个关键挑战。
3.2 规律发现
综合运用图神经网络、强化学习、符号回归等技术的 AI 方法在基于观测数据发现物理公式和图结构物理机制领域取得了突破,这一思想同样可以用于复杂系统的规律发现研究。
3.3 发展方向
① 发展网络科学中的代数方法:想比于统计方法的概率描述手段,使用确定性的矩阵表达一个真实的复杂网络,使用面向网络的特征值、代数特性分析将更具复杂规律挖掘的潜力。
② 发展数据密集型、基于AI的复杂系统方法:针对复杂系统多尺度、异质特性造成的模拟仿真难题,可以研究大规模数据驱动的多智能体模拟方法。
③ 发展知识与AI结合的复杂系统研究方法:把代数和 AI 结合,将已知的知识、符号化的数学语言嵌入 AI 模型,形成一个介于“黑盒”“白盒”之间的“灰盒”。
四、复杂系统视角下的AI研究发展方向
AI自身已形成复杂系统,需要借助复杂性的视觉理解AI、解决起发展过程中的问题。
① 基于复杂网络结构理论,可以研究表现好的深度学习网络是否存在普适的规律。
② 从系统动力学理论角度,与复杂系统高度强相关的统计物理方法可以用来分析一定理想化的机器学习方法。
③ LLM有希望发展成为复杂性科学的重要研究工具,其具备与人类协同交互、存储海量知识并准确检索的强大能力,可以启发科学家提出新的复杂系统理论。同时,复杂系统的研究同样可以反哺LLM的发展,目前兴起的针对LLM智能涌现现象及其背后的神经网络标度率的研究,更多是一种经验性的数据观测和总结。