基于贝叶斯优化与计算机视觉的量子点电荷态自动化搜索算法
1. 项目概述与核心价值
在半导体量子计算这个前沿领域,我们每天都在与微观世界的不确定性搏斗。其中,对单个电子电荷态的精确探测与调控,是构建和操作自旋量子比特的基石。想象一下,你需要在一片由原子尺度“岛屿”(量子点)构成的复杂迷宫中,找到一个特定的电子,并让它稳定地待在你设定的“房间”里,同时还要能实时“听”到它进出房间的细微声响——这就是电荷态调控的日常。传统上,这项工作极度依赖实验人员的经验和直觉,需要手动调节多个栅极电压,在庞大的参数空间中“盲人摸象”,不仅耗时费力,成功率也像开盲盒。我所在的团队长期受困于此,直到我们开发并验证了donorsearch这套自动化算法。它本质上是一套将计算机视觉、无监督学习和贝叶斯优化深度融合的智能实验控制系统,目标是将科研人员从重复、繁琐的电压调试中解放出来,让机器自主、高效地完成量子点电荷态的搜索与稳定工作点锁定。经过大量实验对比,这套算法将成功找到可用电荷态(表现为清晰的随机电报噪声信号)的平均时间从数小时缩短至二十分钟以内,并且将实验的可重复性和成功率提升了一个数量级。如果你正在从事硅基量子器件、半导体量子计算实验,或者对如何将机器学习应用于自动化科学实验感兴趣,那么这次关于donorsearch算法从设计思路到实操细节的深度拆解,或许能给你带来一些直接的启发。
2. 算法整体架构与设计哲学
2.1 问题定义:从物理现象到可计算任务
要理解donorsearch的设计,首先要明白它要解决的核心物理问题。在硅基量子点器件中,我们通过施加在多个金属栅极上的电压,在半导体中形成静电势阱(即量子点),用以囚禁单个电子。与这个量子点电容耦合的是一个单电子晶体管(SET),它作为一个超高灵敏度的电荷计。当量子点中的电子数因隧穿事件发生改变时(例如从0个电子变为1个电子),会改变SET的静电环境,导致其导通电流发生阶跃式变化。在时间域上测量SET电流,这种变化就表现为典型的“随机电报噪声”(RTN)——电流在两个或多个离散的电流水平之间随机跳变。
因此,我们的任务转化为一个高维参数空间中的最优值搜索问题:
- 搜索空间:由多个栅极电压(如VDBL, VDBR, VDFL, VDFR, VPL等,通常7个或更多)构成的高维空间。
- 目标函数:在某个电压组合下,测量得到的SET电流时间序列信号的质量。我们追求的是信噪比高、电平分离清晰的RTN信号。
- 挑战:目标函数(即信号质量)与电压参数之间的关系是未知的、非线性的、且通常非常“崎岖”(包含许多局部最优或平坦区域)。手动搜索如同在黑暗的高维山地中寻找最高峰。
2.2 核心模块化设计:分层递进的智能搜索策略
面对上述挑战,我们摒弃了“一杆子插到底”的单一优化策略,而是采用了分层递进、由粗到精的模块化架构。donorsearch主要分为三个核心阶段,每个阶段解决一个子问题,并为下一阶段缩小搜索范围、提供先验知识。
第一阶段:粗调与SET初始化这个阶段的目标不是直接找RTN,而是确保整个测量系统的基础——单电子晶体管(SET)——处于一个正常、敏感的工作状态。算法会执行一系列标准化的电学测量:
- SET开启:扫描顶部栅极(VTG)和屏障栅极(VLB, VRB)电压,寻找SET从关断到导通的阈值电压。这就像给一个精密仪器通电并确认其基本功能正常。
- SET夹断调谐:在SET开启后,精细调节屏障栅极电压,使SET工作在其库仑振荡的敏感边缘(即电流随栅压变化最陡峭的区域)。这里我们通过拟合电流-电压曲线的双曲正切函数,并寻找其二阶导数的极值点来精确定位“夹断电压”。这个状态下的SET对微小的电荷变化最为敏感。
实操心得:很多实验失败源于SET本身状态不佳。粗调阶段看似简单,但稳健的SET状态判断(如检查电流变化倍数是否大于100,电流范围是否大于1nA)和夹断点拟合算法(使用带平滑的高斯滤波预处理数据)是后续所有步骤的基石。我们曾因忽略了一个屏障栅的轻微漏电,导致后续所有“RTN信号”其实都是仪器噪声。
第二阶段:电荷跃迁定位器在SET状态稳定后,我们进入真正的电荷态搜索。但不是在茫茫电压空间中随机测量,而是先进行一次快速的“侦察”。我们固定某些栅压,快速扫描两个关键栅极(如VPL和VDFL)的电压,测量SET电流,得到一个二维的“电荷稳定性图”。在这个图中,高电流区域(库仑峰)的边界线,就对应着量子点中电子数发生变化的电荷跃迁线。
电荷跃迁定位器模块的核心是一套计算机视觉流程:
- 图像二值化:使用大津法(Otsu‘s method)自动确定阈值,将电流热图转化为黑白图像,突出库仑峰边界。
- 直线检测:应用霍夫变换(Hough Transform)检测图中的直线,这些直线的斜率反映了SET的电容耦合系数,是一个重要的物理参数,可用于后续自旋读出的虚拟门校准。
- 轮廓提取与骨架化:对二值图像进行高斯滤波去噪,然后用Marching Squares算法提取库仑峰的轮廓。接着,通过中轴变换(Medial Axis Transform)得到轮廓的“骨架”。
- 跃迁点定位:骨架的端点被初步认定为潜在的电荷跃迁点。为了去除伪端点(如图像边缘的假信号或噪声),我们用原始二值图作为掩膜进行过滤:要求端点沿库仑峰斜率方向移动几个像素后,必须跨越黑白边界。同时,设置端点间的最小距离,避免重复。
这个模块的输出是一系列候选的(VPL, VDFL)电压坐标,这些坐标极有可能位于电荷跃迁线上。这相当于将整个二维平面的搜索,聚焦到了几十条一维的“线索”上。
第三阶段:精细调谐与RTN信号分类这是算法的“智能核心”。我们在每个定位器找到的候选跃迁点附近,启动一个局部搜索,目标是找到能产生高质量RTN信号的具体电压工作点。
无监督信号分类器:首先,我们需要一个能自动判断一段电流轨迹是否包含RTN的“裁判”。我们设计了一个基于K-means聚类的轻量级分类器。它从每个30ms的电流轨迹中提取两个特征:
- X1 = (最大值 - 最小值) / 平均值:衡量信号的相对波动幅度。
- X2 = 最大值 / 最小值:衡量信号的高低电平比。 对于纯噪声信号,X1接近0,X2接近1,在特征空间中聚集在左下角。对于包含RTN的信号,X1和X2会更大,分布在右上区域。我们在一次“训练”运行中,用K-means将数据分为两类,然后沿着X1轴找到第一个被归为“RTN类”的数据点,以其坐标(X1‘, X2’)作为后续分类的阈值。这种方法牺牲了一点召回率(可能漏掉一些弱信号),但极大提高了精确度(确保找到的信号都是高质量的),并且速度极快。
贝叶斯优化搜索:在候选点附近,我们构建了一个以多个栅极电压为参数的局部高维搜索空间。传统的网格搜索或随机搜索在这里效率低下。我们采用了高斯过程贝叶斯优化作为默认的搜索策略。
- 高斯过程:它是一个概率���型,用于对我们未知的“信号质量分数”与电压参数之间的函数关系进行建模。它不仅能给出任何电压点下信号质量的预测值(均值),还能给出预测的不确定性(方差)。
- 采集函数:我们使用“负期望改进”作为采集函数。它的作用是平衡“利用”(在模型预测信号质量好的地方采样)和“探索”(在模型不确定性大的地方采样)。在电荷跃迁线附近,我们相信最优解就在不远处,因此策略上更偏向“利用”。
- 迭代优化:算法从一个小的随机采样开始,用这些数据初始化高斯过程模型。然后,模型会计算下一个“最有希望”的采样点(即能使期望改进最大的电压组合),我们去该点进行实际测量、评分,并将新数据加入模型,更新对目标函数的认知。如此循环,快速逼近最优工作点。
评分函数:对于被分类器判定为可能的RTN信号,我们需要一个更精细的评分来指导优化。我们使用双高斯拟合来量化RTN的质量:将电流值的直方图拟合为两个高斯分布的叠加,两个峰值的分离度d和用于区分高低电平的阈值分割点s共同构成了评分依据。分离度越大、拟合越好,得分越高。
3. 核心模块深度解析与实现要点
3.1 电荷稳定性图的智能解析:从图像到物理坐标
电荷跃迁定位器是连接宏观测量与微观物理的关键桥梁。其实现有几个技术细节至关重要:
图像预处理中的参数选择:
- 高斯滤波的sigma值:在轮廓提取前进行高斯滤波,是为了平滑由电子隧穿动力学(非无限快)造成的模糊边界。Sigma值太小,噪声去除不净;太大,会过度平滑导致边界位移。我们通过实验发现,对于我们的测量系统(500kSa/s采样,2mV电压步进),sigma取1.5-2个像素(对应3-4 mV)效果最佳。
- 霍夫变换参数:用于检测直线的霍夫变换需要设置角度和距离分辨率。我们根据器件物理设定角度搜索范围(例如-80°到-10°),因为库仑峰的斜率由栅极间的电容比值决定,通常在一个固定范围内。这大大减少了计算量和误检。
骨架端点过滤的逻辑: 这是减少误报的核心。我们的过滤条件包含两个物理约束:
- 边界跨越检验:对于一个候选端点,沿估算的库仑峰梯度方向(从霍夫变换得到)正负各移动Δ个像素(我们设为5),检查这两个位置的像素值。一个必须是1(高电流区),另一个必须是0(低电流区)。这确保了该点确实位于电流发生阶跃的边界上。
- 空间去重:设定一个最小距离r(如3个像素),如果两个端点过于接近,则只保留其中一个。这避免了在一条连续的跃迁线上因骨架微小分叉而产生多个重复点。
注意事项:这个模块对电荷稳定性图的质量有要求。如果SET的调谐状态不佳,库仑峰不清晰,或者扫描范围太小没有包含完整的峰,定位器可能会失败或输出很少的点。因此,粗调阶段确保SET工作点在库仑振荡边缘是前置必要条件。在实践中,我们会在算法中增加一个反馈:如果定位器找到的点少于某个阈值(例如3个),会自动微调SET的某个栅压(如VTG),重新扫描电荷稳定性图。
3.2 K-means聚类在实时信号分类中的巧妙应用
在精细调谐阶段,我们需要对海量的电流轨迹(每秒可能产生数十条)进行快速分类,只对那些可能包含RTN的信号进行耗时的双高斯拟合评分。使用复杂的深度学习模型在这里是不现实的(延迟高、需要大量标注数据)。我们设计的双特征K-means方案是一个极佳的工程折中。
特征设计的物理意义:
- X1 = (m - n) / i:分子
m-n反映了电流的绝对波动范围。分母i(平均值)的引入是关键。因为SET的绝对电流值会随着工作点变化,除以i使得特征对电流的整体偏移不敏感,只关注相对波动。对于RTN信号,电子在两个明确能级间隧穿,m-n较大,且i通常位于m和n之间,因此X1值较大。对于噪声,m-n小,X1接近0。 - X2 = m / n:这个特征直接衡量高低电平的对比度。理想的RTN,高低电平电流值稳定,
m/n是一个大于1的常数。而白噪声的m和n是随机起伏的极值,其比值不稳定且更接近1。
聚类与阈值获取的自动化流程:
- 在精细调谐开始前,算法会在第一个候选跃迁点附近执行一个包含10个步长的随机行走,采集10条电流轨迹。
- 对这10条轨迹计算X1和X2,进行K-means聚类(K=2)。
- 算法并非直接使用聚类中心作为分类边界,因为聚类形状可能非球形。我们采用一种更稳健的方法:将所有点按X1值排序,找到第一个被归为“RTN类”的样本点,记录其坐标(X1‘, X2’)。我们将
X1 > X1‘ && X2 > X2’的区域定义为“RTN候选区”。 - 在后续的贝叶斯优化迭代中,每条新测得的轨迹都先计算X1和X2。如果落入“RTN候选区”,则送入评分模块;否则,直接标记为噪声,赋予一个固定低分(如1.0),并加入贝叶斯优化模型的数据集。这避免了大量无用的拟合计算。
为什么不用更复杂的分类器?速度是关键。K-means计算开销极小,特征计算是O(n)的简单运算。在需要实时决策(毫秒级)的闭环实验中,这种简单高效的方案比追求极高分类精度更有价值。我们的混淆矩阵显示,作为噪声过滤器,它的精确度(Precision)非常高,能确保送去评分的信号大概率是真正的RTN。
3.3 贝叶斯优化的实战配置与内核选择
在高维电压空间中进行贝叶斯优化,其性能很大程度上取决于高斯过程所使用协方差函数(内核)的选择。我们测试了多种内核,最终选择了Matérn 5/2 内核。
内核选择理由:
- 平滑性假设:Matérn 5/2 内核假设目标函数是二阶可微的,这比常用的平方指数内核(无限次可微,过于平滑)更符合物理实际。我们的信号质量分数随电压的变化通常是连续但可能有轻微“拐角”的,Matérn 5/2 能更好地捕捉这种特性。
- 超参数优化:内核包含长度尺度参数
ℓ_q(每个电压维度一个)和协方差幅度σ_f。我们使用最大似然估计在每次模型更新后优化这些超参数。这允许算法自动学习不同电压轴对信号质量影响的敏感度(长度尺度小表示该电压维度变化敏感,反之则不敏感),以及信号质量分数的整体变化幅度。
采集函数:负期望改进在精细调谐阶段,搜索空间已被电荷跃迁定位器大幅缩小,我们相信最优解就在这个子区域内。因此,我们不需要像全局探索阶段那样采用上置信界等更偏向探索的策略。期望改进衡量的是在某个点采样,其目标函数值相对于当前已知最优值能提升多少的期望。我们将其取负,因为我们的优化器框架通常是最小化目标函数(我们将信号质量分数取负,或定义分数越低越好)。这种策略会引导采样点集中在当前模型认为可能打破纪录的区域附近,实现快速局部收敛。
初始化和并行考量:
- 初始随机采样:贝叶斯优化需要一些初始数据来构建第一个高斯过程模型。我们默认进行10次均匀随机采样。这个数量是经验值,太少模型不准,太多则浪费时间。对于7维空间,10个点是一个合理的起点。
- 并行化潜力:虽然当前版本是串行的(建议一个点,测量,更新模型),但贝叶斯优化的框架很容易扩展为批量并行采集。例如,可以使用“批量期望改进”或“局部惩罚”等方法,在一次迭代中建议多个采样点,同时进行测量,这对于拥有多路测量系统的实验平台可以进一步缩短总时间。
4. 实验部署、流程与参数调优实录
4.1 硬件集成与软件控制框架
donorsearch不是一个孤立的算法,它需要深度集成到复杂的低温量子电学测量系统中。我们的系统架构如下:
硬件层:
- 极低温环境:样品置于稀释制冷机中,基础温度约20 mK,并置于约1.1 T的磁场中。
- 电压源与信号生成:直流栅压由高精度源表(如NI PXIe-4322)提供。用于快速扫描的交流信号由任意波形发生器(AWG,如Keysight M3300A)产生,通过阻抗匹配的合成器与直流信号叠加。
- 信号读取:SET的微小电流(pA级)先经过跨阻放大器(如FEMTO DLPCA-200)转换为电压,再经过低噪声前置放大器和低通滤波器,最后由AWG或高速数字化仪进行采集。
软件控制层:
- 仪器驱动与控制:我们基于QCoDeS框架统一管理所有硬件仪器的驱动。QCoDeS提供了与硬件通信的标准化接口和参数抽象。
- 实验逻辑封装:在其之上,我们使用SilQ软件层。SilQ将复杂的测量序列(如扫描栅压、读取电流)封装成高级的、可重用的“实验”或“测量”对象。donorsearch的核心算法模块直接调用SilQ提供的API来执行具体的电压设置和电流读取操作,从而与硬件解耦。
- 算法核心:donorsearch本身用Python实现,包含了上述所有模块(粗调、定位器、分类器、优化器)。它通过SilQ与硬件交互,形成一个完整的自动化闭环。
4.2 完整自动化工作流
一次完整的donorsearch运行流程如下:
- 用户输入与启动:用户指定要搜索的器件区域(对应一组栅极),设置各栅极的安全电压范围,然后启动算法。
- 阶段一:粗调:
- 算法调用SilQ执行
SET_turn_on测量序列,扫描VTG, VLB, VRB。 - 判断电流响应是否符合SET开启特征。若否,报错停止。
- 执行
SET_pinch_off测量序列,拟合曲线,计算并设置VLB和VRB至夹断点。
- 算法调用SilQ执行
- 阶段二:电荷跃迁定位:
- 固定VTG于2V,使用AWG快速扫描VPL和VDFL(例如,各扫描200点,步长2mV),同步测量SET电流,生成一幅
I_SET(VPL, VDFL)的二维图谱。 - 调用电荷跃迁定位器模块处理该图谱,输出一组候选的
(VPL_candidate, VDFL_candidate)坐标列表。
- 固定VTG于2V,使用AWG快速扫描VPL和VDFL(例如,各扫描200点,步长2mV),同步测量SET电流,生成一幅
- 阶段三:精细调谐:
- 对列表中的每一个候选坐标:
- 以该坐标为起点,初始化贝叶斯优化器。优化参数通常包括VDFL, VPL, VDBL, VDBR, VDFR等(共7个)。
- 执行10次随机采样,测量电流轨迹,用K-means分类器确定初始阈值(X1‘, X2’)。
- 开始贝叶斯优化主循环: a. 高斯过程模型基于已有数据,通过优化采集函数,建议下一个最优采样点(一组电压值)。 b. 算法设置这些电压,通过SilQ采集一段30ms的电流轨迹(15000个点,2µs积分时间)。 c. 计算该轨迹的X1和X2。若
X1 < X1‘ or X2 < X2’,直接赋予分数1.0。 d. 否则,对电流直方图进行双高斯拟合。若拟合成功,根据分离度d和拟合优度(如χ²)计算一个质量分数(例如score = -d,因为我们希望最小化分数)。 e. 将(电压组合, 分数)作为新数据点加入高斯过程模型,更新模型。 - 循环持续直到满足停止条件:例如,连续N次(如20次)迭代未找到比当前最佳分数改进超过δ(如0.1)的点;或总迭代次数达到上限(如200次);或找到了一个分数低于设定阈值(如-3.0,对应d>3)的“足够好”的点。
- 如果一个候选点搜索失败,算法自动跳转到列表中的下一个候选点继续搜索。
- 对列表中的每一个候选坐标:
- 结果输出:算法结束时,会报告是否成功找到RTN信号。如果成功,会输出最优的电压组合、对应的电流轨迹数据、拟合参数以及整个搜索过程的历史数据,供实验人员进一步分析和验证。
4.3 关键参数调优与避坑指南
在实际部署中,以下几个参数的设置对算法性能影响巨大:
1. 电流轨迹的测量参数:
- 积分时间与长度:我们使用2µs的单点积分时间和30ms的总长度。这是一个平衡。积分时间太短,噪声大;太长,会平均掉快速的RTN跳变。30ms的长度要能捕获到数次电子隧穿事件(假设隧穿率在几十到几百Hz)。如果器件的隧穿率特别低(<10 Hz),可能需要延长测量时间到100ms。
- 下采样:在计算特征X1和X2前,我们将原始数据从2µs积分时间下采样到50µs。这相当于一个低通滤波,能有效抑制高频噪声,提升信噪比,而不丢失RTN的低频信息(隧穿事件)。
2. 贝叶斯优化参数:
- 长度尺度先验:在初始化高斯过程内核的超参数时,可以给长度尺度
ℓ_q设置一个合理的先验范围。例如,根据器件设计和经验,我们知道某些栅极(如 plunger gate VPL)对电荷态影响更敏感,其ℓ可能较小(如10 mV量级),而一些屏障栅极的ℓ可能较大(如50 mV量级)。设置合适的先验可以加速超参数优化的收敛。 - 采集函数权衡参数:如果发现优化器过早陷入局部最优,可以尝试在期望改进函数中引入一个小的探索权重,或者定期在模型中注入一些随机采样点来扰动。
3. 停止判据: 停止判据需要根据实验耐心和信号要求来设定。过于宽松可能导致在次优点徘徊太久;过于严格可能错过稍加微调就能变好的点。我们通常采用组合判据:(连续20次无显著改进) OR (找到分数 < -3.0的点) OR (总迭代 > 200)。
踩坑实录:在一次调试中,我们发现算法总是在几个候选点附近快速“宣称”成功,但人工检查信号质量很差。排查后发现,是双高斯拟合模块在信号信噪比不够高时,会错误地将单峰噪声拟合为两个非常近的峰,导致计算出虚假的高分离度
d。解决方案是在评分函数中增加拟合优度检验,例如要求拟合的残差平方和低于某个阈值,或者两个高斯峰的中心距离必须大于它们宽度之和的某一倍数(例如1.5倍),否则就判定为拟合失败,返回一个高分(差分数)。这显著提高了找到的信号的质量可靠性。
5. 性能评估、常见问题与排查技巧
5.1 算法性能量化分析
我们通过超过28组对比实验(14组GPBO,14组随机搜索)来评估donorsearch的性能。评估基于两个黄金标准:时间和人工验证。
时间效率:如下表所示,GPBO驱动的精细调谐阶段平均耗时显著低于随机搜索,且总实验时间更短。更重要的是,GPBO的时间稳定性更高(方差更小),而随机搜索耗时波动很大,取决于“运气”。
| 搜索方法 | 平均精细调谐时间 (s) | 平均总时间 (s) | 成功率 (基于人工验证) |
|---|---|---|---|
| GPBO (贝叶斯优化) | ~480 | ~920 | 高 (42/56条轨迹被至少一人确认) |
| 随机搜索 | ~430 | ~860 | 低 (19/44条轨迹被至少一人确认) |
注:成功率基于“单标注者”确认,即只要有一位人类标注者认为算法找到的轨迹包含RTN即算成功。随机搜索总时间略短是因为其简单,但成功率低意味着很多时间是浪费在无效搜索上。
信号质量(混淆矩阵分析):我们邀请了两位经验丰富的实验人员对算法最终找到的所有“RTN信号”进行盲审标注。
- 作为噪声分类器:K-means分类器在区分噪声和潜在信号方面表现优异。在测试集上,其精确度(Precision)很高,确保了送交评分的信号质量。
- 最终成果:在“全体一致”的严格标准下(两位标注者都同意是RTN),GPBO找到了48个一致确认的RTN信号,而随机搜索只找到22个。这证明了GPBO在寻找高质量、 unambiguous信号方面的强大能力。
5.2 典型故障模式与排查清单
即使算法高度自动化,实验物理的复杂性仍会导致各种问题。以下是我们在实践中总结的常见故障及排查步骤:
问题1:粗调阶段失败,SET无法开启或夹断。
- 可能原因:
- 器件损坏或引线断开。
- 设定的栅压扫描范围不正确,未覆盖SET的开启/夹断电压。
- 跨阻放大器增益设置不当,电流信号饱和或太小。
- 低温接线或滤波器故障。
- 排查步骤:
- 检查基础状态:手动测量几个简单曲线(如某个栅极的IV曲线),确认测量链路的完整性。
- 验证参数:核对算法中设定的栅压范围是否与器件设计及历史数据相符。必要时扩大扫描范围。
- 检查增益:确认跨阻放大器的增益档位(如10^7 V/A)是否合适。对于非常微弱的SET,可能需要更高增益。
- 分步调试:将粗调步骤拆开,单独测试“SET开启”扫描和“夹断”扫描,观察原始电流数据,判断是哪个子步骤出了问题。
问题2:电荷跃迁定位器找不到任何点,或找到的点非常少。
- 可能原因:
- SET未工作在敏感点(库仑振荡边缘),导致电荷稳定性图对比度低。
- 扫描的电压范围(VPL, VDFL)太小,未包含完整的库仑峰。
- 器件该区域没有可探测的电荷态(例如,量子点未形成)。
- 图像处理参数(如二值化阈值、高斯滤波sigma)不适合当前数据。
- 排查步骤:
- 可视化检查:将算法生成的电荷稳定性图(原始数据、二值化图、骨架图)保存并显示出来。人工判断图中是否有清晰的库仑菱形图案。
- 调整SET工作点:返回粗调阶段,微调VTG或屏障栅电压,使SET工作在电流变化最陡峭的区域,然后重新扫描。
- 扩大扫描范围:增加VPL和VDFL的扫描跨度。
- 调整算法参数:尝试调低Otsu二值化的阈值偏移量,或减小高斯滤波的强度,以捕捉更微弱的边界。
问题3:精细调谐阶段运行很久,但始终找不到高质量RTN信号(分数不下降)。
- 可能原因:
- 候选跃迁点本身不“活跃”,或对应的电荷态隧穿率极低/极高。
- 贝叶斯优化陷入了局部平坦区或错误的局部最优。
- 双高斯拟合失败,导致评分函数无法提供有效的梯度信息。
- K-means分类器阈值(X1‘, X2’)设置过于严格,过早拒绝了潜在信号。
- 排查步骤:
- 检查候选点质量:手动跳到算法评估过的几个“最佳”电压点,测量并查看原始电流轨迹。判断是完全没有RTN,还是有RTN但信噪比太差。
- 注入探索:在贝叶斯优化配置中,暂时提高采集函数的探索权重(例如,改用上置信界策略),或定期增加随机采样比例,帮助算法跳出可能陷入的局部区域。
- 检查评分函数:对于评分始终很高的点,检查其电流直方图。手动尝试双高斯拟合,看是否失败。如果是,考虑放宽拟合约束或改进拟合初始化。
- 放宽分类阈值:如果怀疑很多真实信号被过滤,可以手动调低X1‘和X2’的阈值,让更多信号进入评分环节。但这会增加计算负担。
问题4:算法找到的“RTN”信号,经人工检查是噪声或干扰。
- 可能原因:
- 50/60 Hz电源线干扰或其谐波,在特定条件下形成了类似双电平的图案。
- 仪器噪声中的突发脉冲。
- 评分函数中的双高斯拟合被噪声欺骗。
- 排查步骤:
- 频谱分析:对可疑信号做快速傅里叶变换,检查在50Hz/60Hz及其倍频处是否有明显的尖峰。
- 检查相关性:观察信号跳变是否与任何已知的周期性噪声(如制冷机脉冲管、泵的振动)相关。
- 增加验证步骤:在算法最终输出“成功”前,增加一个简单的验证:在找到的最优点附近,微调一个栅压(如变化1mV),重新测量。真正的RTN信号对栅压极其敏感,其跳统计特性(平均高/低电平时间)会随电压发生可预测的变化。而固定频率干扰则不会。可以将此验证步骤自动化,作为最终确认的一环。
5.3 算法扩展与未来方向
donorsearch的框架具有很强的可扩展性:
- 多目标优化:当前评分函数主要关注RTN的电平分离度。可以很容易地扩展为多目标优化,同时优化信噪比、隧穿率对称性等,找到综合最优的工作点。
- 迁移学习与预热启动:对于同一个芯片上的不同量子点,其最优工作点参数往往存在关联。可以将上一个量子点搜索得到的高斯过程模型(特别是长度尺度参数)作为下一个点搜索的初始先验,实现“预热启动”,进一步加速搜索。
- 与自旋读出集成:找到电荷态只是第一步。接下来需要执行自旋初始化、操控和读出的脉冲序列。donorsearch找到的电荷跃迁线斜率(虚拟门信息)和最优工作点,可以直接传递给后续的自旋控制程序,实现从电荷调控到自旋调控的全流程自动化。
这套算法最让我兴奋的地方在于,它将实验物理学家的“直觉”和“经验”编码成了可重复、可优化的软件逻辑。它并没有取代物理学家,而是将我们从重复劳动中解放出来,让我们能更专注于更高层次的问题,比如器件设计、新物理现象的探索和更复杂的量子算法验证。自动化不是终点,而是开启更复杂实验的新起点。
