当前位置：首页 > news >正文

机器学习力场加速凝聚态物理模拟：从电荷密度波畴粗化到O(N)计算突破

news 2026/5/25 14:24:34

1. 项目概述当机器学习“遇见”凝聚态物理在凝聚态物理和材料科学的研究前沿有一个问题长久以来既令人着迷又充满挑战一块材料在经历快速降温淬火后其内部新生的有序结构比如电荷密度波、铁磁畴是如何一步步长大、合并最终形成我们观测到的宏观图案的这个过程我们称之为“畴粗化”。它不仅仅是相变后一个简单的“打扫战场”的尾声而是深刻决定了材料最终性能——例如导电性、磁性、光学响应——的关键动力学过程。然而想要在计算机里“亲眼目睹”并量化分析这个过程尤其是对于涉及成千上万个原子、电子强关联的复杂系统传统计算方法往往力不从心。传统的金标准比如基于精确对角化Exact Diagonalization, ED的方法其计算成本随着系统原子数N的增加以O(N³)的恐怖速度飙升。这意味着想把模拟的格子从50x50扩大到300x300计算量可能增加数百倍使得研究大尺度、长时程的粗化动力学几乎成为不可能的任务。这就像你想用显微镜观察一片森林的演化但你的显微镜一次只能看清几棵树而且看一次要等上好几天。我最近的工作正是尝试用机器学习这把“新钥匙”去打开这扇计算瓶颈的大门。我们构建了一个机器学习力场ML Force Field框架并将其与朗之万动力学Langevin Dynamics模拟相结合专门用来研究Peierls系统中**电荷密度波CDW**的畴粗化。这个框架的核心突破在于它成功地将计算复杂度从O(N³)降到了O(N)实现了近乎线性的标度。这使得我们首次能够在300x300的大尺度格子上模拟足够长的时间清晰地捕捉到CDW畴从纳米尺度的萌芽到微米尺度的合并的全过程。更令人兴奋的是这次模拟不仅仅验证了已知的物理规律还揭示了一些新的现象。我们发现CDW的粗化并非遵循单一的幂律而是呈现出明显的两阶段特征在早期畴的尺寸以一种异常快速的方式增长指数约0.7到了后期才回归到经典的Allen-Cahn机制所预言的较慢增长指数0.5。这个“异常”的早期阶段与我们观察到的畴壁强烈的各向异性排列密切相关。这项工作为理解相变动力学中拓扑缺陷如畴壁、涡旋的演化和相互作用提供了一个全新的、高效的计算视角。如果你是一名计算物理或材料模拟领域的研究者正苦于传统方法无法触及的时空尺度或者你是一位对机器学习在科学计算中应用感兴趣的实践者想知道如何将对称性约束巧妙地嵌入神经网络亦或是你单纯对材料中这些美妙的图案形成过程感到好奇那么这篇分享或许能给你带来一些启发。接下来我将拆解这个“机器学习加速的朗之万动力学模拟”项目的完整思路、技术细节、实操要点以及我们踩过的那些“坑”。2. 核心思路与方案设计为什么是“机器学习力场朗之万动力学”要理解我们为什么选择这个技术路线首先得看清我们要解决的物理问题是什么以及传统方法的瓶颈在哪里。2.1 物理问题Peierls系统中的电荷密度波与畴粗化我们研究的对象是Peierls系统。这是一种非常典型的展现电子-晶格耦合效应的模型。简单来说在一条一维原子链上电子会导致晶格发生周期性畸变原子间距一长一短同时打开一个能隙使系统能量降低。这个伴随晶格畸变而产生的电子密度周期性调制就是电荷密度波CDW。在二维扩展的SSHSu-Schrieffer-Heeger模型中情况更复杂CDW序参量有四个简并的基态对应相位0, π/2, π, 3π/2就像一个有四个可能平衡位置的“钟摆”。当我们对这个系统进行一个快速的“淬火”——比如从高温无序相瞬间降到低温——系统会猝不及防地落入一个高能、无序的亚稳态。为了降低能量系统中会随机“凝结”出无数个小区域每个区域自发选择了四个CDW相位中的一个这就是“成核”。这些小区域就是“畴”。不同畴之间由畴壁Domain Wall分隔而在多个畴壁的交汇处则会形成拓扑缺陷比如涡旋Vortex。接下来的畴粗化过程就是这些畴通过畴壁的运动和拓扑缺陷的湮灭不断合并长大最终形成少数几个大畴的过程。描述这个动力学过程的核心方程是在绝热近似下认为电子始终处于瞬时晶格位形的基态晶格位移场u_i(t)所遵循的朗之万方程m * d²u_i/dt² -γ * du_i/dt F_i({u}) η_i(t)其中F_i({u}) -∂E_elec({u})/∂u_i是关键它代表电子系统对第i个原子产生的力。这个力依赖于所有原子的位移{u}计算它需要求解当前晶格构型下的电子基态能量E_elec。传统ED方法每次力计算都需要对角化一个与系统尺寸相关的哈密顿量这是O(N³)复杂度的根源。2.2 方案选型用机器学习力场替代昂贵的量子力学计算我们的核心思路是既然直接计算F_i({u})太贵能否训练一个神经网络输入局域的原子位移环境直接输出这个原子所受的力这就是机器学习力场的思想。但这里有一个关键约束我们的系统具有离散的D4正方形晶格对称性。神经网络本身并不天然具备这种对称性。如果我们简单地将原子坐标扔进一个全连接网络训练出的模型可能无法正确反映物理系统的对称性导致预测结果在对称操作下不一致这在实际模拟中会是灾难性的。因此我们的方案设计围绕两个核心展开对称性保持的描述符Descriptor我们不直接将原始位移u_i输入网络而是先构造一组在D4对称群所有操作下保持不变的“特征变量”{G(Γ, r)}。这些描述符由原子位移按照其所属的不可约表示Irreducible Representation, IR的基函数组合而成并最终通过双谱Bispectrum系数或引入参考系的方法来包含必要的相位信息确保输入特征既是完备的又是严格对称性不变的。朗之万动力学积分器力场一旦建立动力学演化就变成了一个经典的分子动力学问题。我们采用过阻尼朗之万动力学忽略惯性项m*d²u/dt²积分时间步长需要谨慎选择以平衡计算效率和数值稳定性。为什么这个方案可行精度可控神经网络在足够多的、由ED方法生成的高质量训练数据上训练后可以以极高的精度拟合复杂的F_i({u})函数关系。我们的基准测试表明ML预测的力与ED计算的结果在统计意义上高度一致。效率飞跃神经网络的前向传播是O(N)复杂度的。对于大系统N一次力评估的成本从ED的 ~N³ 降低到 ~N实现了数个数量级的加速。可扩展性训练可以在小系统如50x50上进行训练好的模型可以直接应用于大系统如300x300的模拟体现了“从小学习往大推广”的机器学习思想。这个方案的本质是用一个经过精心设计的、对称性保持的神经网络作为一个高效的“代理模型”Surrogate Model替代了原本计算昂贵的量子力学求解器从而让大规模、长时间的动力学模拟成为可能。3. 机器学习力场构建详解从对称性到神经网络这是整个项目的技术核心也是最具挑战性的部分。构建一个既准确又高效的力场需要我们在物理洞察、数学描述和工程实现之间找到最佳平衡点。3.1 对称性保持描述符的构造群论在行动描述符的目标是将一个原子i周围的局部环境其位移u_i及其近邻位移{u_j}映射为一组固定长度的、在对称操作下不变的实数向量。我们的构造过程分为几步第一步定义邻居区块Neighbor Blocks我们不是考虑所有邻居而是按照距离和方位角将邻居分组到不同的“区块”中。如图9所示我们主要定义了三种类型的区块Type-I最近邻的4个原子沿x和y轴方向。每个原子有(u_x, u_y)两个分量共8维。Type-II次近邻的4个原子沿对角线方向y±x。同样构成8维向量。Type-III更远一层的8个原子。构成16维向量。这种分块处理极大地降低了后续表示的复杂度。第二步不可约表示分解对于每个区块的位移向量如Type-I的8维向量它构成了D4点群的一个可约表示。我们需要利用群论将其分解为不可约表示IR的直和。以Type-I为例其8维表示分解为8 A1 ⊕ A2 ⊕ B1 ⊕ B2 ⊕ 2E这里A1, A2, B1, B2是一维表示E是二维表示。数字2E表示有两个独立的E表示。分解的关键是找到每个IR的基函数。例如对于Type-I区块A1表示的基函数是f^{A1} u^x_A u^y_B - u^x_C - u^y_D这个组合在D4群的所有操作90度旋转、镜像等下其变换行为完全由A1表示的特征标决定并且是线性独立的。我们为每个区块的每种IR都构造了这样的基函数详见原文附录A。这些f^(Γ, r)就是原始的、变换性质明确的特征。实操心得手动推导这些基函数非常繁琐且容易出错。在实际操作中我们编写了脚本利用D4群的字符表Character Table和投影算符Projection Operator方法来自动生成所有区块的所有IR基函数。这是保证正确性的关键一步。第三步构造对称性不变量——超越功率谱得到IR基f^(Γ, r)后最简单的构造不变量的方法是计算其功率谱Power Spectrump^(Γ, r) ||f^(Γ, r)||²。这确实是旋转不变的但它丢失了不同IR分量之间的相对相位信息会导致“虚假对称性”——即两个物理上不同的构型可能具有相同的功率谱。为了包含完整的相位信息理论上最完备的方法是计算双谱系数Bispectrum CoefficientsB^{Γ, Γ1, Γ2}_{r, r1, r2} Σ_{m,n,l} C^{Γ, Γ1, Γ2}_{m,n,l} f^(Γ, r)*_m f^(Γ1, r1)_n f^(Γ2, r2)_l其中C是克莱布什-戈丹系数。双谱系数包含了所有可能的3阶耦合是完备的对称性不变量。然而它的维度非常高冗余度大直接作为神经网络输入会导致模型参数爆炸训练困难。第四步我们的解决方案——引入参考系为了在完备性和效率间取得平衡我们引入了一个巧妙的“参考系”方法。我们不是直接使用双谱而是构造一个参考向量f^(Γ, r)_ref。这个参考向量来源于将整个局部环境按方位角分成8个扇区计算每个扇区内所有原子位移的平均值然后用与Type-III区块相同的方式构造IR基。这个f^(Γ, r)_ref代表了局部环境的一个“平均”或“主导”方向。最终我们定义的对称性不变量描述符为η^(Γ, r) (f^(Γ, r) · f^(Γ, r)_ref) / (|f^(Γ, r)| |f^(Γ, r)_ref|)这个η本质上是f^(Γ, r)与其参考方向f^(Γ, r)_ref的余弦相似度。它包含了f^(Γ, r)相对于局部平均环境的相位方向信息同时保持了严格的旋转不变性。所有{η^(Γ, r)}的集合就构成了输入神经网络的最终描述符向量。3.2 神经网络架构与训练网络结构我们采用了一个相对标准的全连接前馈神经网络Feedforward Neural Network。输入层是上述描述符向量。经过2-3个隐藏层每层128-256个神经元使用ReLU激活函数最终输出层直接预测该原子所受的力F_i的两个分量(F_x, F_y)。损失函数使用均方误差MSE损失直接比较网络预测的力F_i^ML和由ED计算得到的“真实”力F_i^EDL 1/N Σ_i |F_i^ML - F_i^ED|²为了平衡不同力分量的大小有时会对数据进行标准化减均值、除以标准差。数据生成与训练数据生成我们在较小的系统如50x50上运行ED-Langevin模拟随机采样成千上万个不同的瞬时晶格构型{u_i}。对于每个构型用ED方法精确计算每个原子所受的力F_i^ED。同时根据该构型计算每个原子的描述符{η}。这样就构成了一个(描述符目标力)的数据对。训练策略将数据集按比例如8:1:1划分为训练集、验证集和测试集。使用Adam优化器进行训练。验证集用于监控过拟合测试集用于最终评估模型在未见数据上的泛化能力。关键技巧为了确保模型能很好地泛化到大系统我们在数据生成时有意包含了各种不同尺度的涨落构型特别是那些包含畴壁、缺陷的构型因为这些是粗化动力学中的关键结构。注意事项神经网络的训练成功高度依赖于数据的质量和代表性。如果训练数据只包含接近平衡态的微小振动那么训练出的模型将无法预测大尺度畴壁运动时的力。因此采样策略需要覆盖相空间中的相关区域这通常需要一些物理直觉和试错。4. 大规模动力学模拟与结果分析有了训练好的、高精度的机器学习力场我们就可以将其嵌入朗之万动力学模拟中对大系统进行长时间的演化模拟。4.1 模拟设置与流程初始条件我们从一个高温无序相T T_cCDW转变温度的平衡态开始然后瞬间“淬火”到低温T T_c。在模拟中这通过将朗之万方程中的温度参数T设置为一个很低的值来实现同时初始构型{u_i}设置为随机扰动。积分器采用过阻尼朗之万动力学忽略惯性项方程简化为γ du_i/dt F_i^ML({u}) η_i(t)其中η_i(t)是满足η_i(t)η_j(t) 2γ k_B T δ_ij δ(t-t)的高斯白噪声。我们使用简单的欧拉-丸山Euler-Maruyama方法进行数值积分u_i(tΔt) u_i(t) (Δt/γ) * F_i^ML({u(t)}) sqrt(2k_B T Δt/γ) * ξ_iξ_i是服从标准正态分布的随机数。时间步长 Δt 的选择这是确保模拟稳定的关键。步长太大会导致积分发散步长太小则计算效率低下。我们通过测试系统能量在短时间内的稳定性来确定合适的Δt。通常需要比原子振动周期小1-2个数量级。系统规模我们成功模拟了300x300的格点系统包含9万个原子。这对于ED方法是不可想象的但在ML力场下变得可行。4.2 畴粗化的可视化与序参量分析为了观察CDW畴的演化我们定义了局域序参量。对于Peierls系统一个方便的定义是φ_i (u_i - (1/4)Σ_{j∈N(i)} u_j) * exp(iQ·r_i)其中Q(π, π)是CDW的波矢。个φ_i是一个二维矢量。我们可以提取其相位角θ_i arctan(φ_i^y / φ_i^x)。四个简并基态对应θ_i 0, π/2, π, 3π/2我们用四种不同的颜色表示。图5展示了一系列时间快照。可以清晰地看到早期t较小系统从无序迅速凝结出大量颜色各异的小畴形成密集的畴壁网络和点状缺陷多个畴壁的交汇点。中期小畴通过畴壁运动开始合并点缺陷数量减少畴的平均尺寸增大。后期系统演化为由少数几个大畴占据畴壁变得平直或缓弯并倾向于沿晶格对角线方向排列。4.3 定量分析关联函数与标度律为了定量刻画粗化动力学我们计算了位移关联函数C(r, t) u_i(t) · u_{ir}(t)其中...表示系综平均。从C(r, t)我们可以提取一个特征长度尺度L(t)通常定义为关联函数衰减到其最大值一半时的距离。L(t)代表了畴的平均尺寸。核心发现如图6所示L(t)的增长呈现两段不同的幂律行为L(t) ~ t^α晚期阶段α ≈ 0.5。这与经典的Allen-Cahn 生长律完全一致对应于曲率驱动的畴壁运动机制。简单理解畴壁就像绷紧的橡皮筋其曲率越大畴越小向内收缩的驱动力就越强速度越快。定量上曲率κ ~ 1/L速度v dL/dt ~ -κ积分即得L ~ t^{1/2}。早期至中期阶段α ≈ 0.7。这是一个异常快速的粗化阶段。4.4 异常粗化机制的物理解释各向异性畴壁为什么早期会更快答案藏在畴的形态各向异性中。观察图5和图8在早期CDW畴并非各向同性的圆形而是显著地沿着晶格的对角线方向被拉长形成许多“细长条”或“十字交叉”的图案。这种各向异性根源于电子响应函数的各向异性。通过微扰分析计算电子-晶格耦合引入的有效能E_e我们发现其系数——电子晶格 susceptibilityχ^P_{ab}(q)——在波矢Q(π,π)附近沿对角线方向衰减最慢图7。这意味着如果畴壁的法线方向沿着对角线其能量成本更低。因此系统在弛豫初期自然倾向于形成沿对角线排列的畴壁。对于这种被拉长的畴图8c其动力学行为可以简化分析设其长轴长度为L_∥短轴长度为L_⊥。由于畴壁沿长轴方向几乎是平的曲率κ_∥ ≈ 0所以长轴方向的收缩几乎被抑制 (v_⊥ dL_⊥/dt ≈ 0)。收缩的动力主要来自短轴两端较大的曲率 (κ_⊥ ~ 1/L_⊥)。根据Allen-Cahn方程短轴两端的收缩速度是恒定的 (v_∥ ~ -1/L_⊥ ≈ constant)。因此长轴长度随时间线性减小L_∥ ~ L_0 - c*t。这种线性的收缩模式在表现上就对应了一个更大的有效生长指数α大于1/2。当这些早期形成的细长畴通过快速收缩消失后剩下的畴形状变得更接近各向同性动力学就回归到了标准的曲率驱动机制指数也变回1/2。实操心得在分析幂律指数时对时间的取值区间非常敏感。需要确保系统已经度过了初始的瞬态弛豫阶段并且L(t)已经进入了清晰的标度增长区。我们通常会在双对数坐标log(L)-log(t)中通过分段线性拟合来提取不同阶段的指数α并多次重复模拟进行系综平均以减少误差。5. 技术实现细节、挑战与解决方案将理论方案转化为稳定可靠的模拟代码过程中充满了挑战。以下是我们在实现过程中遇到的一些关键问题及解决方案。5.1 训练数据集的构建与平衡挑战ED模拟生成数据成本高且相空间巨大。如何用有限的数据训练出能泛化到各种构型特别是包含拓扑缺陷的构型的模型解决方案主动学习Active Learning循环我们并非一次性生成所有数据。而是先用一个小的初始数据集训练一个初步模型然后用这个模型去运行一段动力学模拟。当模型对某个构型的预测置信度低例如预测力的方差大或者模拟出现了新的、训练集中未出现的结构特征如一种特定取向的畴壁时我们就对这个构型进行ED计算将新的(构型真实力)数据对加入训练集重新训练模型。如此迭代使数据集能主动覆盖动力学演化路径上的关键区域。数据增强利用系统的对称性。对于每一个由ED计算得到的训练构型我们可以对其施加所有D4对称群的操作旋转、镜像生成一系列对称等价的构型及其对应的力。这能显著增加数据量且不引入额外计算成本同时强制模型学习对称性。构型采样策略除了从动力学轨迹中采样我们还特意构造了一些“极端”构型如孤立的畴壁、涡旋对等并计算其受力加入训练集。这确保了模型对这些关键拓扑结构的力场有准确的把握。5.2 描述符计算的效率与数值稳定性挑战对于每个原子计算其描述符{η^(Γ, r)}需要遍历其近邻并进行一系列线性组合和点积运算。在300x300的系统中每个时间步要对9万个原子进行此操作必须高效。解决方案预计算映射表对于固定截断半径内的邻居每个原子与其邻居的相对位置和所属区块类型是固定的周期性边界条件下。我们可以预先计算一个“邻居列表”和每个邻居在各类IR基函数组合中的系数。在模拟运行时计算描述符就简化为一次高效的、基于预存系数的张量收缩操作避免了大量的条件判断和循环。向量化与并行化使用NumPy或PyTorch等支持向量化运算的库将对所有原子的描述符计算一次性完成。同时可以利用多核CPU或GPU进行并行计算将系统划分为多个区域分别计算。处理分母为零在计算η (f·f_ref)/(|f||f_ref|)时当|f|或|f_ref|接近于零例如在高度无序区域会导致数值不稳定。我们引入一个小的正则化参数ε如1e-10计算为η (f·f_ref) / (sqrt(|f|²ε) * sqrt(|f_ref|²ε))。5.3 朗之万积分中的噪声与稳定性挑战过阻尼朗之万方程中的随机噪声η_i(t)是白噪声在数值积分中需要正确生成。时间步长Δt的选择需要权衡精度和效率。解决方案噪声生成确保生成的随机力满足η_i(t)η_j(t) 2γ k_B T δ_ij δ(t-t)。在欧拉-丸山格式中这要求随机项为sqrt(2γ k_B T Δt) * ξ_i其中ξ_i是均值为0、方差为1的独立高斯随机数。必须为每个原子的每个自由度x, y独立生成。时间步长测试我们通过以下步骤确定Δt在一个小系统上用ED方法进行精确的动力学模拟记录稳定的最大时间步长Δt_ED。用ML力场在相同系统上测试从Δt 0.5 * Δt_ED开始尝试。监控系统的总能量势能动能在无热噪声T0的弛豫过程中是否单调下降并保持稳定以及序参量在有限温度下的演化是否合理。通常ML力场由于是拟合的其势能面可能存在细微的非物理震荡因此可用的Δt可能略小于Δt_ED。我们最终选定的Δt确保了百万步模拟后系统依然稳定。能量漂移监控即使在确定了Δt后在长时间模拟中仍需监控系统的总能量在NVE系综下或温度在NVT系综下是否有漂移。轻微的漂移是允许的但剧烈的漂移表明积分方案或力场可能有问题。5.4 大规模并行与I/O优化挑战300x300系统模拟数万甚至百万个时间步会产生海量的构型数据每个快照保存9万个原子的位移对存储和后续分析都是压力。解决方案并行策略动力学模拟本身在每个时间步内是高度并行的每个原子的受力计算是独立的。们将晶格划分为多个区域分配给不同的CPU核心或GPU线程分别计算其区域内原子的描述符和网络推理。进程间通信仅发生在区域边界处交换邻居信息。稀疏输出与在线分析并非每个时间步都保存完整构型。我们以较大的间隔例如每1000步保存快照。同时在模拟运行时在线计算并累加一些重要的观测量如全局序参量、关联函数C(r,t)的粗略估计、拓扑缺陷的数量等。这些标量或低维数据可以频繁保存而不会造成I/O瓶颈。数据格式使用高效的二进制格式如HDF5存储快照数据而非文本格式可以极大减少存储空间和读写时间。6. 常见问题、排查与拓展思考在实际操作中从模型训练到大规模模拟可能会遇到各种问题。这里总结一些典型情况及其排查思路。6.1 模型训练相关问题现象可能原因排查与解决思路训练损失震荡不降学习率太大批量大小不合适数据噪声大。降低学习率尝试不同的批量大小如32, 64, 128检查ED计算的力是否收敛增加k点采样或减小收敛阈值。验证集损失远高于训练集损失模型过拟合训练数据缺乏代表性。增加Dropout层或L2正则化扩大训练数据集特别是包含更多样的缺陷构型采用更简单的网络结构。模型在小系统上测试良好但在大系统模拟中发散描述符的截断半径设置过小未捕捉到长程关联训练数据未覆盖大尺度涨落。增大描述符的截断半径增加Type-III或更远邻区块在训练数据生成时使用更大尺寸的系统进行ED采样或使用主动学习专门捕获大尺度模式。模拟中畴壁运动速度明显异常过快或过慢力场的整体尺度可能不准温度参数T或阻尼系数γ设置不当。检查模型预测的力与ED力的整体分布是否一致不仅仅是MSE小还要看分布形状。校准γ可以通过计算一个简单构型如单畴壁在ML力场下的弛豫时间与ED结果或解析估计进行比较。6.2 动力学模拟相关问题现象可能原因排查与解决思路系统能量在NVE模拟中持续上升或爆发式增长时间步长Δt过大ML力场在某个构型下给出了非物理的巨大力可能是外推失败。立即减小Δt重试。在出现问题的构型附近用ED方法计算真实力与ML预测力对比检查是否出现了训练数据未覆盖的“异常区域”。将该构型加入训练集重新训练。畴粗化指数α与理论值或ED结果偏差大模拟时间不够长未进入标度区系统尺寸不够大有限尺寸效应显著统计平均不足。确保L(t)在双对数坐标上有一段明显的线性区域。进行有限尺寸缩放分析用不同尺寸如100x100, 200x200, 300x300的系统模拟观察α是否收敛。增加独立模拟的次数系综大小进行平均减少随机噪声的影响。观察不到明显的各向异性畴结构淬火深度不够温度不够低电子-晶格耦合强度g太小导致各向异性效应微弱。尝试更低的淬火温度T。增大耦合常数g在物理合理的范围内。检查序参量θ_i的定义和可视化是否正确确保相位提取无误。6.3 项目的局限性与未来拓展我们这个框架虽然强大但也有其适用范围和可改进之处绝热近似的局限我们的方法基于绝热近似假设电子始终处于瞬时基态。这对于描述CDW相变的慢动力学是很好的近似。但如果要研究超快激光脉冲诱导的非平衡动力学电子可能被激发到高能态绝热近似失效。未来可探索将电子激发态自由度也纳入机器学习框架或与时间依赖的密度泛函理论TDDFT结合。训练数据的依赖性与迁移性模型严重依赖于训练数据的质量和范围。为一个特定参数如耦合强度g、电子浓度的系统训练的模型不能直接用于参数不同的系统。一种思路是开发“条件”力场模型将g、T等参数也作为网络的输入从而学习一个在参数空间连续的力场函数。扩展到更复杂的系统和相互作用目前我们处理的是相对简单的SSH模型。对于更真实的材料可能涉及多轨道、自旋-轨道耦合、电子-电子关联等。描述符和网络结构需要相应扩展以捕捉更复杂的局部环境和对称性。图神经网络GNN因其在处理不规则结构和复杂关系上的优势是一个很有前景的方向。与其他尺度方法的耦合ML力场可以作为介观尺度模拟的引擎但其参数来源于微观的电子结构计算。如何与第一性原理计算更无缝地衔接实现从电子结构到微观力场再到介观动力学的高通量、自动化工作流是计算材料学的一个重要趋势。这项工作只是一个起点。机器学习与计算物理的结合正在为我们打开一扇观察和理解复杂物质世界动力学的新窗口。它不仅仅是一个加速工具更通过其数据驱动的模式识别能力有可能帮助我们发现新的物理规律和标度行为。当你看到屏幕上那些色彩斑斓的畴图案按照机器学习预测的规律演化、合并时那种将微观机制与宏观现象通过计算紧密联系起来的体验正是这个领域最吸引人的地方。

查看全文

http://www.zskr.cn/news/1379777.html