当前位置：首页 > news >正文

机器学习优化核物理α衰变预测：从两势方法到超重核探索

news 2026/5/25 9:05:38

1. 项目概述当机器学习遇见α衰变在核物理研究的前沿预测超重核的α衰变半衰期一直是个既基础又极具挑战性的课题。这不仅仅是理论物理学家笔下的公式推演更是实验物理学家在合成新元素、验证核壳层结构时判断一个原子核能“存活”多久的关键依据。传统的理论模型如两势方法TPA通过求解量子隧穿问题来估算半衰期其核心在于精确描述α粒子氦-4核从母核中“逃逸”时所面临的势垒。然而一个长期被简化处理的物理效应——α粒子的非定域性效应即α粒子在穿越势垒时其有效质量随空间位置变化的特性对隧穿概率有着微妙而重要的影响。手动调整描述这一效应的参数如ρ_S来拟合实验数据不仅效率低下也难以捕捉其背后复杂的物理依赖关系。近年来机器学习ML技术以其强大的数据驱动和非线性拟合能力开始渗透到物理学的各个角落。我们不禁思考能否让机器学习来学习这个“调参”的过程甚至挖掘出我们尚未明确意识到的物理规律这正是我们这项工作的出发点。我们尝试将三种经典的树回归模型——决策树回归DT、随机森林回归RF和XGBRegressorXG——引入到对TPA框架中非定域性效应参数ρ_S的优化中。我们的目标很明确不是用机器学习“黑箱”替代物理模型而是将其作为物理模型的“优化器”和“解释器”让物理图像更清晰让预测更精准。实测下来这个思路是行得通的。对于从Z52到Z118的196个偶偶核经过机器学习优化的TPA模型其预测半衰期与实验值的标准偏差σ显著降低。其中决策树回归DT和XGBRegressorXG模型表现最佳相较于未考虑非定域性效应的原始TPA标准偏差分别降低了54.5%和53.7%。这意味着预测精度有了质的飞跃。更进一步我们将优化后的模型应用于预测尚未被合成的、原子序数Z118和120的20个超重偶偶核的α衰变半衰期其结果与当前主流的经验公式如DUR和NewD模型预测趋势基本一致为未来在实验室中“捕捉”这些极端不稳定的新核素提供了宝贵的理论参考。这篇文章我将从一个一线研究者的角度为你拆解这个“机器学习核物理”交叉项目的完整脉络。我会详细解释我们为什么选择这个物理问题如何构建“物理模型机器学习”的混合框架在实操中遇到了哪些坑以及最终这些模型到底“学”到了什么。无论你是对核物理感兴趣还是想了解机器学习在科学计算中的具体应用相信都能从中获得启发。2. 核心物理框架与机器学习策略解析2.1 理论基础两势方法TPA与非定域性效应要理解机器学习优化了什么首先得搞清楚它优化的对象——TPA模型及其中的非定域性效应。2.1.1 两势方法TPA的核心公式TPA是计算α衰变半衰期的一个主流量子力学模型。其核心思想是将衰变过程分解为两个阶段α粒子在母核内部的预形成以及它穿越库仑势垒的量子隧穿。半衰期 ( T_{1/2} ) 由衰变宽度Γ决定[ T_{1/2} \frac{\hbar \ln 2}{\Gamma} ]而衰变宽度Γ可以表达为三个因子的乘积[ \Gamma \frac{\hbar^2 P_\alpha F P}{4\mu} ]这里每一个因子都有明确的物理意义( P_\alpha )预形成因子描述α粒子在衰变前于母核内部预先聚合成一个“团簇”的概率。我们采用了基于结合能计算的团簇形成模型来估算它对于偶偶核其计算公式源于核质量的系统学。( F )归一化因子与α粒子在势垒内部区域的波函数有关可以通过WKB近似下的积分求得。( P )穿透概率这就是著名的伽莫夫因子描述α粒子穿越库仑势垒的量子隧穿概率计算同样依赖WKB近似。( \mu )折合质量这是整个模型中的一个关键参数传统上它被简单地取为α粒子与子核的静态折合质量 ( \mu_0 \frac{m_\alpha M_d}{m_\alpha M_d} )。2.1.2 非定域性效应被忽略的“动态质量”非定域性效应源于核相互作用的非定域性质。简单类比当一个α粒子非常接近原子核表面时它感受到的核力场是剧烈变化的这种相互作用会导致它的有效惯性即有效质量不再是自由空间中的常数质量 ( m_\alpha )而是随位置 ( r ) 变化的函数 ( m^*(r) )。这就像一个小球在穿过不同粘度的介质时其运动“阻力”或“惯性”会发生变化。根据Medeiros等人的工作这个位置相关的有效质量可以表示为[ m^*(r) \frac{m}{1 - \rho(r)} ]其中( \rho(r) ) 是一个描述质量修正的空间分布函数通常采用与核势形状类似的费米型函数形式[ \rho(r) \rho_S a_S \frac{d}{dr} \left[ 1 \exp\left(\frac{r - R_S}{a_S}\right) \right]^{-1} ]这里( \rho_S ) 就成了一个关键的可调参数。它的大小和符号决定了在核表面附近α粒子的有效质量是增大( \rho_S 0 )还是减小( \rho_S 0 )。相应地折合质量也变为[ \mu(r) \frac{m^(r) M_d}{m^(r) M_d} ]这个 ( \mu(r) ) 将取代原来常数 ( \mu_0 )代入穿透概率 ( P ) 和归一化因子 ( F ) 的计算积分中。物理图像很直观如果有效质量在势垒内增加( \rho_S 0 )意味着α粒子在那里“变重”了惯性更大隧穿出去就更困难预测的半衰期会变长反之如果有效质量减小( \rho_S 0 )隧穿更容易预测半衰期会变短。注意非定域性效应修正的不是势垒高度而是穿越势垒的“粒子”本身的属性。这是对传统模型一个相当深刻的物理补充它使得模型包含了对核表面微观结构的更精细描述。2.2 机器学习介入的策略从“手动调参”到“智能拟合”传统上参数 ( \rho_S ) 是针对每个核素通过手动调整使其计算半衰期与实验值吻合来确定的。这种方法不仅繁琐而且无法保证全局最优更难以揭示 ( \rho_S ) 与核素基本性质如质子数Z、中子数N、衰变能Q_α等之间的潜在规律。我们的策略是让机器学习模型来学习从核素特征到最优 ( \rho_S ) 值的映射关系。2.2.1 问题定义与数据准备我们将此构建为一个监督学习回归问题输入特征X选择能够表征核素基本性质的物理量。受Royer经验公式启发我们选择了 ( Z/\sqrt{Q_\alpha} ) 和核子数 ( A ) 作为主要特征。这两个量分别敏感于库仑排斥和核子规模与α衰变概率有很强的经验关联。输出标签y目标变量就是我们需要预测的 ( \rho_S ) 值。训练数据我们首先为一批已知的偶偶核Z52到118手动精细调整 ( \rho_S )使得TPA计算的对数半衰期 ( \log_{10}(T_{cal}) ) 与实验值 ( \log_{10}(T_{exp}) ) 的偏差控制在0.001以内。这批“黄金标准”的 ( \rho_S ) 值及其对应的核素特征就构成了我们机器学习模型的训练集和测试集。2.2.2 模型选型为什么是树模型我们选择了三种树集成模型进行对比决策树回归DT基础模型通过一系列if-else规则分割数。优点是模型简单、可解释性强我们可以直观看到它基于哪些特征做决策。随机森林回归RF通过构建大量决策树并集成其结果如取平均。它通过“随机子空间”和“自助采样”引入随机性能有效降低单棵决策树的过拟合风险通常具有更好的泛化能力。XGBRegressorXG梯度提升决策树GBDT的高效实现。它采用加法模型每一棵新树都在学习之前所有树预测结果的残差通过梯度下降最小化损失函数。XGBoost因其高效、准确且能处理复杂非线性关系在众多机器学习竞赛和科学应用中表现出色。实操心得模型选择背后的考量在物理问题中应用机器学习我们不能盲目追求最高精度的“黑箱”模型。决策树的可解释性是一个巨大优势它可能帮助我们“反推”出物理规律比如发现“当Z大于某个值且Q_α小于某个值时ρ_S倾向于为正”这样的规则。随机森林和XGBoost虽然更强大但其集成机制使得可解释性变差。因此对比这三类模型不仅能找到预测性能最优的还能在“精度”和“物理可解释性”之间做出权衡。我们的结果也印证了这一点虽然RF在预测ρ_S本身这个回归任务上MSE最小见表I但最终用于计算半衰期时DT和XG优化的模型与实验符合得更好。这说明对于我们的终极目标——预测半衰期模型学到的“规律”的物理合理性比单纯拟合ρ_S的数值精度更重要。2.2.3 训练与评估流程数据划分将196个核素的数据集按比例如8:2划分为训练集和测试集。超参数优化我们利用Python的GridSearchCV或RandomizedSearchCV等工具对每个模型的关键超参数如树的最大深度、学习率、子采样比例等进行自动搜索以找到在验证集上表现最佳的组合。这一步至关重要能避免模型欠拟合或过拟合。模型训练用优化后的超参数在训练集上训练模型。性能评估在测试集上我们不仅看模型预测ρ_S的误差如均方误差MSE、决定系数R²更重要的是要将预测出的ρ_S代回TPA模型计算半衰期并评估其与实验值的整体偏差标准偏差σ。后者才是我们关心的终极物理指标。3. 实操过程从数据到预测的实现细节3.1 环境搭建与数据预处理进行这类交叉研究一个清晰、可复现的计算环境是第一步。我们主要使用Python进行机器学习部分的建模和优化。3.1.1 核心工具栈科学计算与数据处理NumPy,Pandas。用于处理核素数据表包含Z, N, A, Q_α实验值T_exp实验值等。机器学习框架scikit-learn(sklearn)。它提供了决策树、随机森林等模型的可靠实现以及完善的数据分割、超参数搜索、评估模块。高级梯度提升库XGBoost。需要单独安装pip install xgboost它提供了比sklearn内置GradientBoosting更高效、功能更丰富的XGBRegressor。物理计算核心我们需要自己编写TPA模型计算半衰期的函数。这包括数值积分计算F和P、结合能查询计算P_α等。可以使用SciPy进行积分运算。3.1.2 数据准备关键步骤数据收集从核数据库如AME中收集196个偶偶核的基态性质质子数Z、中子数N、质量数A、实验α衰变能Q_α_exp、实验半衰期T_exp。同时需要它们的自旋宇称信息以确定角动量转移l_min。特征工程计算每个核素的输入特征。我们创建两个特征feature1 Z / np.sqrt(Q_alpha_exp)和feature2 A。将它们组成特征矩阵X。标签生成这是最耗时的一步。对于每个核素编写一个循环或优化程序如scipy.optimize.minimize通过调整ρ_S使log10(T_cal) - log10(T_exp)的绝对值最小化。收敛后得到的ρ_S即为该核素的“最优”标签y。务必保存每次计算所用的其他固定参数如核势深度V0、弥散度a等。数据清洗与检查检查生成的ρ_S值是否存在异常值例如绝对值过大。绘制ρ_S随Z、N、Q_α变化的散点图观察其大致趋势这有助于后续理解机器学习模型的输出。踩坑记录标签生成的稳定性手动优化ρ_S时目标函数半衰期对数差可能不是单调的存在局部极小值。我们采用了以下策略确保稳定性给优化器设定合理的边界根据物理直觉将ρ_S的搜索范围限定在[-5, 5]之间。多起点尝试从0、1、-1等多个初始值开始优化选择使最终残差最小的结果。验证物理合理性优化完成后检查计算出的有效质量曲线m*(r)是否在物理合理的范围内不应出现负值或奇点。3.2 机器学习模型的构建、训练与优化有了干净的数据X, y就可以开始构建机器学习流水线。3.2.1 模型初始化与超参数网格定义from sklearn.tree import DecisionTreeRegressor from sklearn.ensemble import RandomForestRegressor from xgboost import XGBRegressor from sklearn.model_selection import GridSearchCV, train_test_split from sklearn.metrics import mean_squared_error, r2_score # 划分训练集和测试集 X_train, X_test, y_train, y_test train_test_split(X, y, test_size0.2, random_state42) # 定义决策树参数网格 dt_param_grid { max_depth: [3, 5, 7, 10, None], min_samples_split: [2, 5, 10], min_samples_leaf: [1, 2, 4] } # 定义随机森林参数网格 rf_param_grid { n_estimators: [100, 200, 300], max_depth: [5, 10, 15, None], min_samples_split: [2, 5, 10], bootstrap: [True, False] } # 定义XGBoost参数网格 xgb_param_grid { n_estimators: [100, 200, 300], max_depth: [3, 5, 7], learning_rate: [0.01, 0.05, 0.1], subsample: [0.8, 0.9, 1.0], colsample_bytree: [0.8, 0.9, 1.0] } # 初始化模型 dt DecisionTreeRegressor(random_state42) rf RandomForestRegressor(random_state42, n_jobs-1) # n_jobs-1 使用所有CPU核心 xgb XGBRegressor(random_state42, n_jobs-1, verbosity0)3.2.2 执行超参数搜索与模型训练我们使用交叉验证来寻找最佳超参数避免对单一训练/测试分割的过拟合。# 使用5折交叉验证进行网格搜索 dt_grid_search GridSearchCV(dt, dt_param_grid, cv5, scoringneg_mean_squared_error, n_jobs-1) rf_grid_search GridSearchCV(rf, rf_param_grid, cv5, scoringneg_mean_squared_error, n_jobs-1) xgb_grid_search GridSearchCV(xgb, xgb_param_grid, cv5, scoringneg_mean_squared_error, n_jobs-1) # 拟合模型这是一个耗时步骤特别是对RF和XGB print(Training Decision Tree...) dt_grid_search.fit(X_train, y_train) print(Training Random Forest...) rf_grid_search.fit(X_train, y_train) print(Training XGBoost...) xgb_grid_search.fit(X_train, y_train) # 获取最佳模型 best_dt dt_grid_search.best_estimator_ best_rf rf_grid_search.best_estimator_ best_xgb xgb_grid_search.best_estimator_3.2.3 模型评估与物理指标计算训练完成后我们需要在两个层面评估模型回归任务层面在测试集上预测ρ_S计算MSE和R²。# 预测测试集的 rho_S y_pred_dt best_dt.predict(X_test) y_pred_rf best_rf.predict(X_test) y_pred_xgb best_xgb.predict(X_test) # 计算回归指标 mse_dt mean_squared_error(y_test, y_pred_dt) r2_dt r2_score(y_test, y_pred_dt) # ... 同理计算rf和xgb的指标物理任务层面将预测的ρ_S代入TPA模型重新计算每个测试集核素的半衰期 ( T_{cal}^{ML} )然后计算所有核素或整个数据集的对数偏差 ( \Delta_i \log_{10}(T_{cal, i}^{ML} / T_{exp, i}) ) 及其标准偏差σ。这才是衡量我们工作成功与否的黄金标准。def calculate_sigma(T_cal_list, T_exp_list): 计算对数半衰期偏差的标准偏差σ deltas np.log10(T_cal_list / T_exp_list) # 注意确保列表顺序对应 sigma np.std(deltas) return sigma # 假设我们已经用ML预测的rho_S计算得到了新的半衰期列表 T_cal_ml_dt, T_cal_ml_rf, T_cal_ml_xgb sigma_dt calculate_sigma(T_cal_ml_dt, T_exp_all) sigma_rf calculate_sigma(T_cal_ml_rf, T_exp_all) sigma_xgb calculate_sigma(T_cal_ml_xgb, T_exp_all) # 同时计算原始TPArho_S0的sigma_0 sigma_0 calculate_sigma(T_cal_original, T_exp_all) improvement_dt (sigma_0 - sigma_dt) / sigma_0 * 100 improvement_xgb (sigma_0 - sigma_xgb) / sigma_0 * 100 print(f原始TPA σ: {sigma_0:.3f}) print(fDT优化后 σ: {sigma_dt:.3f}, 提升: {improvement_dt:.1f}%) print(fXGB优化后 σ: {sigma_xgb:.3f}, 提升: {improvement_xgb:.1f}%)3.3 应用于超重核预测与外推验证模型在已知核素上表现良好后我们将其用于预测未知的超重核。3.3.1 获取超重核输入特征对于Z118和120的核素其α衰变能Q_α尚未经实验测量。我们采用了当前被认为最可靠的核质量模型——WS4模型Wang et al.来预测这些核素的Q_α值。然后利用这些预测的Q_α和已知的Z、A构造出特征向量。3.3.2 进行预测与对比分析# 假设 superheavy_features 是包含20个超重核特征的DataFrame predicted_rho_S_dt best_dt.predict(superheavy_features) predicted_rho_S_xgb best_xgb.predict(superheavy_features) # 将预测的rho_S代入TPA计算超重核的半衰期 T_pred_dt, T_pred_xgb # ... (调用TPA计算函数) ... # 同时用DUR公式和NewD公式计算这些核素的半衰期作为对比 # T_pred_dur, T_pred_newd ... (调用相应公式函数) ... # 整理结果绘制类似原文图7的对比图注意事项外推的风险用机器学习模型预测训练数据范围之外的核素外推存在风险。我们的训练集核素Z最大为118而预测集中包含Z120的核素这属于轻微的外推。树模型在外推时通常比较保守倾向于给出接近训练集边界的值。因此对于Z120的预测我们需要保持谨慎并强调其依赖于WS4模型对Q_α的预测精度。结果的可靠性需要通过与其他独立理论模型如DUR, NewD的一致性来交叉验证。4. 结果深度分析与模型行为解读4.1 性能对比谁才是“最佳优化器”我们的评估结果呈现出一个有趣的现象值得深入剖析。4.1.1 回归指标与物理指标的“背离”从纯粹的机器学习回归任务来看随机森林RF模型在预测ρ_S参数本身上表现最好其均方误差MSE最低决定系数R²最高参见原文表I。这符合一般认知因为RF通过集成多棵树降低了方差通常泛化能力更强。然而当我们把三个模型预测的ρ_S代回物理模型计算最终的半衰期预测标准偏差σ时故事发生了变化。决策树DT和XGBoostXG优化后的TPA模型其σ值分别为0.264和0.259显著低于RF优化后的结果0.306并且比不考虑非定域性效应ρ_S0的原始TPAσ0.573提升了超过53%。这说明了什么目标函数的重要性机器学习模型的优化目标最小化ρ_S的MSE与我们的终极物理目标最小化半衰期预测的σ并不完全等价。一个在数值上更接近“手动优化值”的ρ_S代入TPA后未必能产生更准确的半衰期。这是因为TPA计算是一个复杂的非线性过程ρ_S的微小误差在通过指数项穿透概率P放大后可能对半衰期产生较大影响。模型的“平滑性”与物理“真实性”随机森林通过平均多棵树的预测来输出结果这使其预测函数相对平滑。但在物理上ρ_S随核素的变化可能包含一些局部的、尖锐的特征例如在幻数附近发生突变。相对简单的决策树或者专注于拟合残差、能捕捉复杂模式的XGBoost可能反而更能复现这种物理上的非平滑性从而得到更符合实验的半衰期预测。过拟合与泛化RF在训练集上对ρ_S拟合得最好但可能对数据中的噪声也进行了学习过拟合导致其学到的“规律”在用于计算半衰期这个下游任务时泛化能力反而不如DT和XG。实操心得评估交叉学科模型必须紧扣最终应用场景在“AI for Science”项目中不能仅仅用标准的机器学习指标如MSE、准确率来评判模型好坏。必须将模型输出代入到完整的科学计算流程中用领域的核心指标在这里就是半衰期预测的σ进行最终评估。这常常会颠覆纯ML视角下的排名。4.2 非定域性效应的物理图像四个典型案例为了直观展示非定域性效应如何影响半衰期预测我们选取了四个代表性核素进行深入分析对应原文图3-6。核素 (同位素)优化后的 ρ_S 值物理含义 (有效质量变化)对半衰期的影响与实验符合度提升¹⁰⁸Xe (氙-108)0.347在势垒区域α粒子有效质量增加。粒子“变重”隧穿更困难理论半衰期变长。偏差减少93.8%¹¹⁴Ba (钡-114)2.585有效质量显著增加。隧穿概率大幅降低理论半衰期显著变长。偏差减少99.6%¹⁸⁴Hg (汞-184)-0.347在势垒区域α粒子有效质量轻微减小。粒子“变轻”隧穿稍易理论半衰期略缩短。偏差减少50.7%²⁹⁰Fl (-290)-2.182有效质量显著减小。隧穿概率大幅提高理论半衰期显著缩短。偏差减少~100%深度解读符号的意义ρ_S的正负直接决定了非定域性效应是阻碍还是促进α衰变。对于¹⁰⁸Xe和¹¹⁴Ba正的ρ_S修正使得理论预测向更长的半衰期方向移动从而更接近实验值。这说明对于这些核素传统的常数质量模型低估了α粒子在核表面处的惯性。大小的意义ρ_S的绝对值大小反映了非定域性效应的强度。在超重核区如²⁹⁰Fl我们需要一个很大的负ρ_S-2.182来使理论与实验吻合。这强烈暗示在极重的原子核中α粒子在发射前可能处于一种与子核耦合更松散、等效惯性更小的状态这与某些理论预言的“α粒子预形成概率增高”或“核表面弥散”的图像是相容的。机器学习的价值机器学习模型自动为不同核素分配合适的ρ_S值揭示出这种修正并非一个全局常数而是与核素结构密切相关的。这为我们理解原子核的微观结构如表面厚度、中子皮、壳效应如何影响α衰变提供了新的线索。4.3 超重核预测结果与壳结构启示将优化后的DT和XG模型应用于预测Z118和120的超重核并与DUR、NewD两个经验公式对比我们得到了以下关键观察参见原文表IV和图7模型间一致性总体来看四种方法DT-TPA, XG-TPA, DUR, NewD预测的半衰期随中子数N变化的趋势是基本一致的。这交叉验证了预测结果的可靠性。DT与NewD的高度一致决策树模型优化后的TPA预测结果与最新提出的、明确考虑了核形变效应的NewD经验公式符合得非常好。这说明通过机器学习学习到的ρ_S参数可能以一种隐式的方式包含了核形变对α衰变的影响。这是一个非常有趣的发现意味着机器学习模型可能自动捕捉到了形变与有效质量修正之间的物理关联。壳结构的信号所有模型的预测曲线都显示在N178附近出现一个峰值半衰期相对较长在N180处出现一个谷值半衰期相对较短随后在N186附近又出现一个可能的峰值。这强烈提示N186可能是一个中子幻数幻数核的球形闭壳结构使其更稳定α衰变半衰期更长。N180可能是一个中子亚幻数亚壳层的填充也会影响核的稳定性但效应弱于主幻数。N178处的峰值则需要进一步研究可能与形变驱动的壳效应有关。经验总结机器学习作为“物理规律探测器”在这个项目中机器学习不仅是一个优化工具更成为了一个“规律探测器”。它通过数据驱动的方式为我们指出了两个重要的物理研究方向一是非定域性效应通过ρ_S与核素微观结构的关联二是ρ_S的系统学行为可能隐含着核形变的信息。下一步的工作完全可以聚焦于分析机器学习模型特别是可解释性强的决策树学到的决策规则尝试用明确的物理量如形变参数β2、壳修正能等来解析地描述ρ_S从而建立更深刻的物理理解。5. 常见问题、挑战与未来展望5.1 实操中遇到的典型问题与解决方案在将机器学习应用于此类物理问题中我们踩过不少坑也总结出一些实用的技巧。5.1.1 数据量有限与过拟合核物理实验数据尤其是超重核区域的精确数据非常稀少。我们用于训练的196个核素在机器学习标准下属于小样本数据集。这极易导致模型过拟合。我们的策略强正则化在树模型中严格限制树的最大深度max_depth、设置最小叶子节点样本数min_samples_leaf等。交叉验证坚决使用k折交叉验证我们用了5折来评估模型泛化能力并选择超参数而不是简单依赖训练集/测试集分割。模型简化优先尝试简单的模型如浅层决策树复杂模型如深度很大的XGBoost虽然训练误差低但验证误差可能更高。物理约束在可能的情况下将物理知识作为先验融入。例如我们怀疑ρ_S应与Q_α有强相关因此在特征工程中引入了Z/√Q_α这比单独使用Z和Q_α更有效。5.1.2 特征选择与物理可解释性最初我们尝试了更多特征如中子皮厚度、壳修正能等但这些数据不易获得或计算复杂。最终我们选择了最易获取、物理意义最明确的特征Z/√Q_α 和 A。建议在交叉学科研究中特征工程应遵循“奥卡姆剃刀”原则。从最核心、最基础的物理量开始。如果简单特征组合就能取得好效果就无需引入复杂、不确定的衍生特征。这有利于保持模型的可解释性和可靠性。5.1.3 外推预测的不确定性预测Z120的核素本质上是外推因为训练集中Z最大为118。树模型对外推非常谨慎预测值往往会“拉回”到训练集边界附近的值。如何处理明确告知不确定性在论文和报告中必须明确指出哪些预测是内插哪些是外推并强调外推结果的不确定性更大。依赖多模型共识如果多个独立的理论模型如我们的ML-TPA、DUR、NewD在外推区域给出相似的趋势那么该预测的置信度会提高。不确定性量化可以尝试使用贝叶斯机器学习方法或者利用集成模型如随机森林本身提供的预测方差来定量估计外推的不确定性。5.2 本工作的局限性与未来改进方向尽管取得了有希望的成果但本研究仍有明显的局限性这也指明了未来的改进路径。仅限于偶偶核由于预形成因子P_α的计算模型相对简单我们目前的工作只处理了偶偶核。奇A核和奇奇核的α衰变涉及未成对核子的耦合理论描述更复杂数据也更稀疏。下一步需要将团簇形成模型扩展到奇A核并收集更多数据来训练模型。对Q_α值的依赖无论是训练还是预测我们都严重依赖α衰变能Q_α的精度。对于未知核素Q_α来自核质量模型如WS4的预测这引入了另一层理论误差。未来可以考虑将Q_α也作为一个可学习的量或者开发对Q_α不确定性更鲁棒的模型。机器学习模型的“黑箱”性尽管决策树有一定可解释性但整个“特征→ρ_S→半衰期”的链条仍不够透明。我们计划下一步进行特征重要性分析和决策路径分析试图用明确的物理语言解释“模型为什么给这个核素分配这样一个ρ_S值”。探索更先进的ML架构可以尝试物理信息神经网络PINN将TPA的微分方程作为约束直接嵌入神经网络训练或许能获得物理一致性更强的模型。也可以尝试图神经网络GNN将原子核视为一个由核子连接的图来学习其整体性质。5.3 给同行研究者的建议如果你也想在核物理或其他计算物理领域尝试机器学习以下是我的几点切身建议起点要小目标要明确不要一开始就试图用AI取代整个物理模型。像我们这样选择一个明确的、局部的、可量化的优化目标如优化一个参数ρ_S更容易取得成功并令人信服。物理洞察是灵魂数据是粮食没有物理理解指导的机器学习是盲目的。你必须非常清楚你的模型在学什么输入输出代表什么物理量。同时要花大力气整理干净、可靠的数据集这是所有工作的基础。建立可复现的完整流水线从数据预处理、特征工程、模型训练、超参优化到最终的物理量计算和绘图最好用脚本如Jupyter Notebook或Python脚本将整个流程自动化。这极大方便了调试、修改和结果复现。重视可视化多画图。散点图、残差图、特征重要性图、学习曲线……可视化能帮你快速发现数据问题、模型偏差和潜在规律这是纯看数字无法替代的。保持批判性思维不要迷信机器学习给出的结果。要不断地用物理常识去拷问它“这个预测合理吗”“如果改变这个特征输出会如何变化这符合物理预期吗” 机器学习应该是延伸我们物理直觉的工具而不是替代它。这项工作只是一个起点。它展示了机器学习如何作为一个强大的“辅助工具”帮助物理学家优化传统模型中的参数甚至揭示新的物理关联。随着更多数据的积累和更先进方法的引入我们有理由相信这种“物理模型数据驱动”的混合范式将在理解极端条件下的核物质性质、预测未知核素行为等方面发挥越来越重要的作用。

查看全文

http://www.zskr.cn/news/1376699.html