当前位置：首页 > news >正文

量子核方法基准测试：QKE与QKT在经典数据集上的表现与工程实践启示

news 2026/5/24 11:42:03

1. 项目概述与核心目标量子机器学习QML这个领域最近几年热度一直很高。简单来说它的核心想法是能不能用量子计算机那套独特的玩法——比如叠加和纠缠——来给传统的机器学习算法“打打鸡血”解决一些经典计算机搞不定的复杂问题。我作为一个在这个交叉领域摸爬滚打了多年的研究者看到过太多宣称“量子优势”的论文但说实话很多结论都建立在精心设计的“玩具问题”上。一旦放到更通用、更现实的场景里这些量子方法的真实表现到底如何往往是个大大的问号。尤其是在当前嘈杂中型量子NISQ设备还远未成熟的背景下这个问题显得尤为关键。这次我想和你深入聊聊我们团队最近完成的一项系统性基准测试工作。我们聚焦在量子核方法特别是量子核估计和量子核训练这两个核心技术上。为什么是核方法因为在理论上基于参数化量子电路PQC的量子核被证明是当前实现量子机器学习潜力最现实的路径之一。它不像一些更复杂的“量子神经网络”那样对电路深度和相干时间有苛刻要求其核心计算——核矩阵的估计——可以通过相对浅层的量子电路完成这非常契合NISQ设备的现状。我们的目标很明确就是进行一次“压力测试”。我们选取了文献中备受关注、甚至被推测可能带来近期量子优势的两种量子特征映射ZZFeatureMap和CovariantFeatureMap。我们知道它们在特定构造的数据集上表现惊艳但我们的问题是它们的“魔力”是普适的吗离开了为其量身定做的“舒适区”面对五花八门的真实世界数据它们还能保持优势吗更进一步我们想探究量子核训练的价值。QKT听起来很美它通过优化特征映射的参数让核函数与学习任务更“对齐”理论上能提升模型性能。但这个优化过程本身需要额外的、不菲的计算开销无论是模拟还是未来在真机上运行。这笔“投资”的回报率到底如何它是否总能带来性能提升还是说在某些情况下只是徒增成本为了回答这些问题我们搭建了一个包含合成数据集和经典基准数据集的测试平台并将量子方法与经典的支持向量机、逻辑回归进行同台竞技。我们的工作不仅仅是跑几个实验、列几个准确率数字更是试图透过现象看本质理解不同方法在不同数据特性下的行为逻辑为后续研究和实践提供更扎实、更理性的参考。接下来我就带你一步步拆解我们是怎么做的以及我们发现了什么。2. 核心原理与技术路线拆解要理解我们的基准测试首先得把量子核方法这摊事儿的底层逻辑理清楚。别担心我们不用钻太深的数学牛角尖我会尽量用直白的语言和类比把它说透。2.1 经典核方法为什么需要“升维打击”想象一下你在平面上有一堆红点和蓝点它们混杂在一起用任何一条直线都无法完美分开非线性可分。经典的支持向量机SVM这时候就抓瞎了因为它本质上是个线性分类器。核方法的妙处就在于它想出了一个“作弊”的办法我不在原来的平面上跟你死磕我悄悄地把这些点都扔到一个更高维的空间里。在那个高维空间里原本纠缠在一起的红蓝点可能就变得可以用一个超平面轻松切开了。这个“扔”的过程就是特征映射。但直接计算高维空间中的坐标特征向量计算量巨大这就是所谓的“维度灾难”。核方法的核心“戏法”——核技巧——在于它发现我们最终求解SVM优化问题时具体是那个对偶问题其实根本不需要知道每个数据点在高维空间的具体坐标只需要知道任意两个点在高维空间里的内积可以理解为它们的相似度就够了。于是我们定义一个函数输入是原始空间的两个点输出就是它们在高维空间的内积这个函数就是核函数。这样一来我们既享受了高维空间带来的线性可分好处又巧妙地规避了巨大的计算成本。常见的核函数有线性核、多项式核和高斯核RBF核等。2.2 量子核估计用量子电路当“映射器”量子核方法的思想一脉相承但它用了一个非常酷的“映射器”参数化量子电路。我们可以把PQC看作一个黑盒你把一个经典数据向量x输进去它就在量子计算机上制备出一个特定的量子态|φ(x)。这个量子态就是数据x在量子希尔伯特空间中的“代表”。那么如何定义两个数据点x_i和x_j在这个量子空间中的相似度即核值呢量子力学给了我们一个自然的答案保真度也就是两个量子态重叠的概率幅的平方| φ(x_i)| φ(x_j) |^2。这正好对应了核函数所需要的内积运算。在物理上如何测量这个保真度一个实用的协议是制备出|φ(x_i)态后紧接着运行|φ(x_j)制备电路的逆电路然后测量所有量子比特是否都回到了初始的|0态。这个事件发生的概率就是我们要的核值。这个过程被称为量子核估计。它的优势在于所需的量子电路深度相对较浅正反两次编码对NISQ设备比较友好。2.3 量子特征映射ZZ与协变我们测试的两种映射是当前量子核文献中的“明星选手”。ZZFeatureMap源于所谓的IQP电路族。它的结构很有特点先对所有量子比特作用哈达玛门H门制造叠加然后交替施加依赖于数据x的单量子比特Z旋转门和两量子比特ZZ纠缠门。这个过程会重复若干次深度。这种结构被认为能够生成经典难以模拟的量子态是量子优势的候选者之一。在我们的实验中我们固定深度为2这是一个被广泛研究且被认为在表达能力和电路复杂度之间取得较好平衡的设置。CovariantFeatureMap的灵感来源于具有群结构的数据。它的设计更“几何”U(x) D(x) V(θ)。其中D(x)是数据x所属群的一个表示在我们的实现中是每个量子比特上RX和RZ旋转的张量积负责将数据编码进去V(θ)是一个与数据无关、但包含可优化参数θ的电路用于制备一个所谓的“基准态”。这种设计的初衷是对于具有对称性的数据比如图像旋转这种核可能具有内在的归纳偏置从而更高效。2.4 量子核训练让核函数“学习”任务QKE有一个固有限制一旦选定了特征映射电路的结构核函数就完全由数据决定了没有可调节的余地。这好比你固定了一个相机镜头然后去拍所有景物。量子核训练则试图给这个“镜头”加上可调参数让它能针对不同的“拍摄任务”分类问题进行微调。怎么调我们需要一个目标来告诉优化器“什么样的核是好的”。这里我们借鉴了经典机器学习中的核目标对齐思想。简单说一个“好”的核应该使得同类样本的核值相似度大异类样本的核值小。我们可以定义一个对齐度分数来衡量核矩阵与由样本标签构成的理想矩阵之间的相似性。优化这个对齐度就能找到更好的核参数。我们采用了更进一步的加权核对齐方法。它与标准SVM的对偶问题直接相关在优化对齐度的同时实际上是在最小化SVM泛化误差的一个上界。理论上这能带来更好的泛化性能。优化过程是一个典型的量子-经典混合流程量子处理器负责计算当前参数下的核矩阵经典优化器我们用了SPSA一种适合噪声环境的梯度近似方法则根据计算出的损失来更新参数θ。我们测试了两种参数化策略共享参数所有量子比特共享同一组旋转参数。这减少了参数数量可能有助于防止过拟合但表达能力受限。专用参数每个量子比特都有自己的独立旋转参数。这大大增加了模型的灵活性和表达能力但也带来了过拟合的风险。3. 实验设计与基准测试框架光有理论不够是骡子是马得拉出来溜溜。我们设计了一套尽可能全面和公平的基准测试方案核心思想就是“控制变量扩大战场”。3.1 数据集组合从“舒适区”到“野外战场”我们精心挑选了8个数据集分为两大类目的是检验模型从特例到一般的泛化能力。第一类量子“舒适区”数据集这两个数据集是专门为展示特定量子特征映射优势而构造的。Ad-hoc-ZZ一个二维数据集其分类边界被设计为恰好能被ZZFeatureMap完美分离。理论上经典线性方法对此无能为力而ZZFeatureMap应能轻松达到100%准确率。这是我们验证量子方法“基本能力”的试金石。Ad-hoc-COV基于“带误差的陪集标记”问题生成的14维数据集理论上契合CovariantFeatureMap的群结构先验。我们使用了一个公开的7量子比特实例。同样它应该是对应量子方法的“主场”。第二类经典基准数据集这里我们引入了机器学习社区公认的“考场”考察模型的通用性。IRIS数据集变体Linear-IRIS选取鸢尾花数据集中线性可分的Setosa和Versicolor两类。这是一个简单的线性问题所有方法都应该表现良好。Non-linear-IRIS选取非线性可分的Versicolor和Virginica两类。这需要模型具备非线性分类能力。MNIST降维数据集原始MNIST图像维度太高不适合当前规模的量子模拟。我们采用了主成分分析进行降维。MNIST-PCA-4/8分别降至4维和8维的“3 vs 5”数字分类任务。这是一个更具挑战性的真实世界图像分类问题。MNIST-1D降维数据集这是一个MNIST的极简版数据本身已经过高度抽象和压缩被认为是更适合当前QML基准测试的低计算量替代品。我们同样构造了4维和8维版本。所有数据集都处理为二分类且类别平衡以避免评价指标我们主要用准确率、Cohen‘s Kappa和宏平均F1分数的偏差。对于经典数据集我们采用了分层抽样的方式多次随机划分训练集和测试集以进行更稳健的统计评估。3.2 对比基线强大的经典对手为了公正地评估量子方法的“附加值”我们设立了强大的经典基线模型支持向量机我们测试了三种核函数。线性核作为线性模型的基准。多项式核其诱导空间的维度与多项式次数k有关。我们特意设置k使得其诱导空间维度与对应量子核的希尔伯特空间维度~2^(2n)n为量子比特数大致相当力求在“模型容量”上创造一个相对公平的比较环境。RBF核理论上可以映射到无限维空间是经典SVM中非常强大和常用的非线性核。逻辑回归另一个经典的线性模型作为补充参考。3.3 超参数调优与实验细节公平比较的前提是所有模型都处于其“最佳状态”。因此我们对所有模型包括经典和量子都进行了系统的网格搜索超参数调优。共同参数SVM的正则化参数C我们在[0.01, 0.1, 1, 10, 100]的对数尺度上进行搜索。经典模型特有对于RBF-SVM额外搜索带宽参数γ。对于多项式SVM根据上述规则确定次数k。量子模型特有除了C我们还引入并优化了一个量子核带宽参数 λ。这个参数非常重要它通过对核矩阵进行指数缩放K_ij - exp(-λ * (1 - K_ij))来调节核的“平滑度”。λ 太小核矩阵可能过于相似导致模型表达能力不足λ 太大可能放大噪声或导致过拟合。它在缓解量子核浓度问题即所有数据对的核值都趋近于一个常数使核矩阵失效中扮演关键角色。我们搜索的范围是[0.001, 0.01, 0.1, 0.5, 1.0]。所有超参数选择均基于训练集上的5折交叉验证准确率。确定最优超参数后我们在独立的测试集上评估最终模型的泛化性能。对于QKT我们设定了SPSA优化器的最大迭代次数为400次并采用了二阶SPSA以加速收敛。参数初始化为零这对应于V(θ)电路不施加任何有效旋转的初始状态。4. 结果分析与深度洞察实验完成后我们得到了一堆数据。直接罗列所有准确率表格意义不大我重点分享几个最关键的发现和背后的思考。4.1 量子方法在“舒适区”的统治力与局限首先在它们的主场——Ad-hoc-ZZ和Ad-hoc-COV数据集上量子方法毫无悬念地取得了完美或接近完美的分类性能。这验证了这些特征映射对于其对应特定问题的理论优势。经典线性方法线性SVM和逻辑回归在这些数据集上完全失败而经典非线性方法RBF-SVM虽然能通过学习达到不错的效果但在我们设置的对比条件下如多项式核的维度匹配其最优表现仍略逊于对应的量子核方法。注意这个结果非常重要但它绝不能直接外推为“量子方法优于经典方法”。这仅仅证明了针对特定结构精心设计的量子模型在解决其对应的问题上具有优势。这好比一把特制的钥匙能完美打开一把锁但这不意味着这把钥匙能开所有的锁。4.2 在经典基准上的表现优势不再明显当我们把战场转移到经典的IRIS和MNIST数据集时情况发生了戏剧性的变化。Linear-IRIS所有方法包括最简单的线性SVM和逻辑回归都轻松达到了接近100%的准确率。这说明在这个简单的线性问题上量子方法没有带来任何额外好处复杂的特征映射显得有些“杀鸡用牛刀”。Non-linear-IRIS这是第一个真正的考验。结果呈现混合态势。ZZFeatureMap和CovariantFeatureMap的QKE版本表现尚可但与RBF-SVM相比并无显著优势有时甚至略差。一个关键发现是经过QKT优化后模型性能并没有稳定地超越其对应的QKE版本。在某些运行中QKT甚至导致了轻微的过拟合测试集准确率反而下降。MNIST-PCA 与 MNIST-1D在这些更复杂、更接近真实应用场景的数据集上经典RBF-SVM consistently持续地表现最佳。量子方法无论是QKE还是QKT其平均准确率都落后于经典的RBF核方法。多项式SVM在维度匹配后表现与量子方法互有胜负但未显现出明显优势。4.3 量子核训练的价值重估这是我们本次研究最核心的结论之一。量子核训练带来的性能提升并不像理论上预期的那么普遍和显著。计算开销与收益不成正比QKT需要数百轮的混合优化迭代每一轮都需要在量子处理器或模拟器上估计整个训练集的核矩阵。这个计算成本是QKE的数十倍甚至数百倍。然而在我们的多数基准测试中这种巨大的额外开销并没有稳定地转化为测试集上分类准确率的提升。过拟合风险尤其是在参数较多的“专用参数”策略下QKT优化过程更容易使核函数过度适应训练数据的特定噪声或结构从而损害了其在未见数据上的泛化能力。我们在MNIST数据集上观察到了这种现象。对齐度不等于泛化度我们发现在训练集上QKT确实能显著提高核与目标的对齐度分数。但这个分数的提高并不总是与测试集上的泛化性能提升挂钩。这提醒我们优化代理损失函数对齐度与最终任务目标分类准确率之间可能存在偏差。实操心得不要盲目使用QKT。在考虑引入QKT之前务必先评估基线QKE的性能。如果QKE已经表现良好且数据集规模不大或结构相对简单那么QKT带来的边际收益可能无法覆盖其计算成本。建议将QKT视为一个“精调”工具在基线模型遇到明确瓶颈且你有充足的计算资源时再考虑使用。4.4 特征映射与超参数的选择远比训练更重要另一个颠覆我们预设的发现是对于最终性能而言选择合适的量子特征映射和精心调节超参数特别是核带宽 λ其重要性可能远远大于是否进行核训练。特征映射的匹配性ZZFeatureMap在相对低维、结构可能更“全局”的数据上有时表现更好而CovariantFeatureMap在数据可能隐含某种对称性或群结构时更有潜力。然而在没有先验知识的情况下为任意新数据集选择最合适的量子特征映射本身就是一个未解决的难题。超参数 λ 的关键作用我们观察到量子核带宽参数λ对模型性能的影响极其敏感。一个合适的λ值能有效缓解核浓度显著提升模型表现而不当的λ则会导致模型失效。在很多情况下仅仅通过网格搜索找到一个好的λ就能让QKE的性能获得巨大提升其效果可能不亚于运行一次完整的QKT。这意味着当前阶段在量子核方法的工程实践中将计算资源投入到系统的超参数搜索和特征映射设计上可能比投入到昂贵的核训练优化中性价比更高。4.5 量子核浓度现象的观察在运行高维数据集如8维MNIST时我们确实观察到了量子核浓度现象的迹象未经调整的核矩阵中非对角线元素的值非常接近导致矩阵近似退化。通过引入并优化λ参数我们有效地对抗了这一问题。这印证了文献中的观点在目前中等数量量子比特的系统中核浓度是量子核方法面临的一个实际挑战必须通过诸如带宽缩放等技术手段加以应对。5. 结论与未来工作方向通过这次大规模的基准测试我们得到了一些可能不那么“振奋人心”但却非常实在的结论无普适量子优势在通用的经典机器学习基准数据集上我们所测试的量子核方法包括QKE和QKT并未展现出相对于成熟经典方法如RBF-SVM的稳定优势。量子优势的实现高度依赖于问题与量子特征映射之间的特定匹配关系。QKT的性价比存疑量子核训练虽然是一个优雅的理论框架但在当前背景下其巨大的额外计算成本往往无法证明是合理的。它带来的性能提升不稳定且有过拟合风险。特征映射本身的设计和超参数的选择是当前影响性能的更关键因素。工程实践建议对于想要尝试量子核方法的研究者或开发者我的建议是首先确立一个强大的经典基线如RBF-SVM。这是衡量任何量子方法“附加值”的黄金标准。从简单的QKE开始并投入精力进行系统的超参数调优特别是C和λ。谨慎对待QKT仅在资源充足且基线QKE性能明确不足时将其作为一个探索性选项。深入理解你的数据探索数据中是否存在可能匹配特定量子特征映射如群结构的归纳偏置这可能是指引你找到量子优势场景的关键。这项研究也为我们指明了未来的工作方向首先需要探索更多样化、更具代表性的量子特征映射家族。其次需要发展更高效、更稳健的量子核训练算法或许需要结合更好的正则化技术或早期停止策略。最后也是最重要的是寻找和构建那些真正能体现量子计算本质优势、而经典方法难以高效解决的实际问题原型。这条路还很长但正是通过这样严谨甚至有些“泼冷水”的基准测试我们才能更扎实地向前迈进避免陷入盲目乐观的误区真正推动量子机器学习从理论走向实用。

查看全文

http://www.zskr.cn/news/1366966.html