当前位置：首页 > news >正文

量子机器学习在金融欺诈检测中的实战：VQC、SQNN、EQNN模型配置与性能对比

news 2026/5/24 9:21:53

1. 项目概述与核心价值

最近几年，量子机器学习（QML）在金融风控领域的热度持续攀升，尤其是在处理高维、非线性的欺诈交易数据时，它展现出了超越经典模型的潜力。作为一名长期关注前沿技术在金融科技中落地的从业者，我一直在跟踪这个领域。很多人对QML的印象还停留在“理论炫酷，落地困难”的阶段，但实际情况是，随着量子计算硬件的迭代和算法框架的成熟，我们已经可以基于模拟器或云平台，对特定任务进行有意义的探索和验证。

这次，我深入研究了三种主流的量子机器学习架构——变分量子电路（VQC）、采样量子神经网络（SQNN）和期望值量子神经网络（EQNN），在金融欺诈检测任务上的实战表现。核心目标非常明确：搞清楚在真实（及合成）的金融交易数据上，如何通过配置“特征映射”和“变分层”这两个核心组件，来最大化模型的检测性能（以F1分数为核心指标）。这不仅仅是跑几个实验，更是为了摸清量子模型在复杂数据模式下的“脾气”，为后续的工程化部署积累第一手经验。

为什么这件事有价值？因为金融欺诈检测本质上是一个极度不平衡的二分类问题，正常交易占绝大多数，欺诈交易凤毛麟角。经典模型如XGBoost、深度学习网络虽然有效，但在特征空间高度复杂、欺诈模式不断演变的场景下，容易遇到瓶颈。量子计算的核心优势——并行处理和探索指数级状态空间的能力——理论上为发现那些微弱、非线性的欺诈关联信号提供了新工具。然而，理论优势不等于实际效果，模型的具体实现，尤其是特征映射和变分层的选择，直接决定了量子“算力”能否有效转化为“检测力”。

本文的结论直接来源于对BankSim（合成支付数据）和欧洲信用卡数据集（真实脱敏数据）的系统性评测。我会带你一步步拆解实验设计，解读关键数据，并分享从数据预处理、量子电路构建、训练调优到结果分析全流程中的实操要点和避坑指南。无论你是想了解QML在金融领域的应用现状，还是正准备动手搭建自己的第一个量子风控模型，相信这篇来自一线的深度复盘都能给你带来实实在在的参考。

2. 核心思路与实验设计拆解

2.1 为什么选择这三个模型与两个数据集？

在开始看实验结果之前，必须先理解我们对比的“选手”和“赛场”。本次实验聚焦于三种基于参数化量子电路（PQC）的量子分类模型，它们代表了当前QML分类任务的主流思路：

变分量子电路（VQC）：这是最经典、最直观的量子-经典混合架构。它的流程非常清晰：经典数据通过一个特征映射电路编码到量子态上，然后经过一个可训练的变分层电路进行信息处理，最后对特定量子比特进行测量，将测量结果的概率分布通过一个偶校验函数映射为类别标签。VQC的优势在于结构灵活，可以通过设计不同的特征映射引入数据特征间的纠缠。
采样量子神经网络（SQNN）：你可以把它理解为VQC的一个“概率增强版”。它与VQC共享相似的特征映射和变分层结构，核心区别在于后处理。SQNN不是使用单一的偶校验映射，而是对所有量子比特的测量结果进行采样，构建一个完整的输出概率分布，再通过一个经典的神经网络（通常是一个线性层）将这个分布映射到类别空间。这种方式理论上能捕获更丰富的量子信息。
期望值量子神经网络（EQNN）：它的思路更“量子物理”一些。EQNN不依赖于对量子态的多次采样来估计概率，而是直接计算某个可观测量（通常是Pauli算符）的期望值，并将这个期望值作为特征输入到一个经典分类器（如线性模型）。它的训练目标是最小化基于期望值的损失函数。EQNN的计算开销可能更低，但表达能力可能受限于所选的可观测量。

选择这三个模型，就是为了覆盖从“直接概率映射”到“采样统计”再到“期望值特征”这三种不同的量子信息提取范式，看看哪种在欺诈检测任务上更吃香。

数据集的选择则兼顾了“真实性”和“可控性”：

欧洲信用卡数据集：来自Kaggle的经典真实数据集，包含欧洲持卡人两天内的交易记录，其中欺诈交易占比仅0.172%。它的价值在于“真实”，包含了真实世界欺诈的复杂性和噪声，但极端的不平衡性对模型是巨大挑战。
BankSim数据集：一个基于代理的合成支付模拟数据，模仿了西班牙银行的交易流。虽然是人造的，但它提供了更均衡的类别分布（欺诈占比约1.5%），并且允许我们研究在相对“干净”、模式更明确的合成数据上量子模型的表现。

用这两个数据集，我们既能检验模型在真实残酷环境下的鲁棒性，也能在更理想的环境下分析其理论性能上限，这个对比本身就很有意义。

2.2 特征映射与变分层：量子模型的“编码器”与“处理器”

这是本次实验的灵魂所在，也是所有性能差异的根源。理解它们，就理解了QML模型调优的核心。

特征映射（Feature Map）：它的作用是将经典的、实数值的欺诈交易特征向量，转换成量子态。你可以把它想象成一个量子版的“嵌入层”。不同的映射方式，决定了数据特征是如何被加载到量子比特的叠加和纠缠关系中的。

Z特征映射：这是最简单的一种，通常只使用RZ旋转门，将每个特征值编码到单个量子比特的相位上。它不主动创建量子比特间的纠缠，电路深度浅，计算快，但表达能力有限。
ZZ特征映射：在Z映射的基础上，增加了两两量子比特之间的纠缠门（如CNOT或ZZ相互作用）。它显式地引入了特征间的关联，能编码更复杂的特征关系，但代价是增加了电路深度和噪声敏感性。
Pauli特征映射：一种更通用的方式，通常涉及RX、RY、RZ等多种旋转门的组合，有时也会结合纠缠。它提供了更丰富的编码空间，灵活性最高，但设计和优化的复杂度也相应增加。

变分层（Ansatz）：特征映射将数据“写”入了量子态，变分层则负责对这个量子态进行“加工”或“变换”。它由一系列参数化的量子门构成，这些参数在训练中通过经典优化器进行调整，目标是让最终的量子态更有利于我们区分类别。

Real Amplitudes：一种结构简单的变分层，通常由单比特RY旋转门和固定模式的纠缠层（如CNOT）交替构成。它参数少，训练快，但表达能力可能不足以捕捉非常复杂的模式。
Two Local：非常流行的一种设计，采用“单比特旋转层”和“纠缠层”交替的结构。你可以自定义旋转门类型和纠缠方式，它在表达能力和训练难度之间取得了较好的平衡，是许多应用的默认选择。
Efficient SU2：旨在更高效地覆盖SU(2)群，通常包含RX、RY、RZ三种旋转，以及纠缠操作。它的表达能力很强，参数较多，适合处理复杂问题。
Pauli Two Design：一种试图实现“酉2设计”的变分层，理论上能更均匀地探索整个希尔伯特空间。但其性能在实践中可能不稳定，高度依赖于具体问题和初始化。

实操心得：选择特征映射和变分层，本质上是在模型的表达能力和训练难度/噪声鲁棒性之间做权衡。一个经��法则是：先从简单的Z映射和Real Amplitudes或Two Local变分层开始，建立性能基线。如果模型欠拟合，再尝试引入纠缠（如ZZ映射）或更复杂的变分层（如Efficient SU2）。盲目堆砌复杂度，往往会导致训练困难、梯度消失或对噪声极度敏感。

3. 核心实验结果深度解析与配置优化指南

实验的核心是让三种模型（VQC， SQNN， EQNN）在两种数据集上，遍历三种特征映射（Z， ZZ， Pauli）和四种变分层（Real Amplitudes， Two Local， Efficient SU2， Pauli Two Design）的所有组合。评价指标我们主要看F1分数，因为它能综合平衡精确率（Precision，抓得准不准）和召回率（Recall，抓得全不全），这对欺诈检测至关重要。

3.1 BankSim数据集：SQNN表现突出，配置选择是关键

先看合成数据上的表现。总体而言，SQNN模型在BankSim数据集上展现了最佳的综合性能，多个配置的F1分数超过了0.8。

表现最佳的配置组合：

冠军配置：SQNN+Z特征映射 +Real Amplitudes变分层，取得了0.85的F1分数（准确率0.86，精确率0.82，召回率0.88）。这是一个令人惊喜的结果，因为它使用了最简单的特征映射和最浅的变分层。这说明对于BankSim这类合成数据，其内在模式可能不需要特别复杂的量子纠缠来刻画，一个简单但训练良好的浅层电路就能取得很好效果。过深的电路反而可能引入不必要的噪声或导致过拟合。
亚军配置：SQNN+Pauli特征映射 +Two Local变分层，F1分数为0.84。这个组合使用了更复杂的特征映射和变分层，表现同样优异，证明了Pauli映射和Two Local的强强联合在捕捉复杂特征时的有效性。

VQC模型的表现： VQC的最佳配置是Pauli映射 +Real Amplitudes变分层，F1分数为0.73。整体上，VQC在BankSim上的表现略逊于SQNN，大多数配置的F1分数在0.6-0.7区间。一个有趣的发现是，对于VQC，引入纠缠的ZZ映射与Efficient SU2变分层搭配时，性能（F1=0.68）要优于简单的Z映射。这表明VQC架构可能更需要特征映射提供额外的纠缠资源来提升表达能力。

EQNN模型的困境： EQNN在BankSim上的表现大幅落后，最佳F1分数仅为0.59（Pauli映射 +Pauli Two Design变分层）。大部分配置的F1分数在0.3-0.5之间。这强烈暗示，直接将期望值作为分类特征，在当前的任务设置和电路深度下，难以有效区分欺诈与正常交易的复杂模式。EQNN可能更适合那些目标函数与某个物理可观测量直接相关的问题（如化学分子能量计算），而对于抽象的金融分类任务，信息在“期望值”这一步可能丢失太多。

配置优化启示一（针对合成/均衡数据）：
优先尝试SQNN架构：其基于采样的概率输出方式与分类任务匹配度可能更高。
不必迷信复杂配置：从Z+Real Amplitudes或Two Local这类简单组合开始，它们可能带来意想不到的高效表现。
谨慎使用EQNN：除非有明确的物理先验或对计算效率有极端要求，否则在分类任务上可将其优先级放后。

3.2 欧洲信用卡数据集：VQC逆转夺冠，数据特性决定模型命运

切换到极度不平衡的真实数据战场，故事发生了反转。VQC模型在欧洲数据集上表现最为出色，而SQNN的表现有所下降。

表现最佳的配置组合：

冠军配置：VQC+Z特征映射 +Pauli Two Design变分层，取得了惊人的0.88的F1分数（准确率0.90，精确率1.0，召回率0.78）。这是一个非常漂亮的结果，特别是精确率达到1.0，意味着所有被模型标记为欺诈的交易都是真正的欺诈，这在风控中极其珍贵，可以极大降低误报带来的客户投诉成本。
强势配置：VQC+ZZ/Pauli特征映射 +Two Local变分层，F1分数均为0.83。这再次证明了Two Local变分层的稳健性。

SQNN模型的表现： SQNN的最佳配置是Pauli映射 +Two Local变分层，F1分数为0.81。虽然也不错，但相比其在BankSim上的统治力有所下滑。其Z映射 +Two Local配置的F1分数为0.80。这表明在真实、复杂、不平衡的数据中，SQNN的泛化能力面临更大挑战。

EQNN模型依然不佳：最佳F1分数仅为0.52（ZZ/Pauli映射 +Two Local变分层），再次印证了其在该任务上的局限性。

配置优化启示二（针对真实/不平衡数据）：
VQC架构更具竞争力：其确定的偶校验映射方式，可能在处理极端类别不平衡时，能形成更清晰的决策边界。
关注高精确率配置：在欧洲数据集上，多个VQC和SQNN配置的精确率达到了1.0。在欺诈检测中，“宁可漏杀，不可错杀”的高精确率策略往往更实用。应优先筛选出这些高精确率的配置，即使其召回率稍低。
Two Local是“万能膏药”：无论在哪个数据集、与哪种特征映射搭配，Two Local变分层都表现出了稳定且良好的性能，可以作为首选的变分层候选。

3.3 关键发现与通用配置策略

通过对两个数据集的交叉分析，我们可以提炼出更具通用性的指导原则：

特征映射的选择：
- Z映射：简单、快速、对噪声相对鲁棒。在数据模式不极度复杂或作为基线时是安全的选择。在欧洲数据集上表现尤其亮眼。
- ZZ映射：通过引入纠缠，能显著提升模型对特征间相互关系的建模能力。当简单映射表现不佳时，尝试ZZ映射是合理的下一步，特别是与表达能力强的变分层（如Efficient SU2）搭配时。
- Pauli映射：通常表现最稳健，在两个数据集、三种模型上都提供了接近最优的性能。它是追求“省心”和“高性能”时的推荐选择，但需要关注其可能带来的计算开销。
变分层的选择：
- Real Amplitudes：计算效率高。在SQNN与简单数据（BankSim）的组合中表现出色，但在复杂场景下可能表达能力不足。
- Two Local：本次实验中的“最佳劳模”。它在几乎所有场景下都提供了稳定、优秀的性能，在表达能力、训练速度和鲁棒性之间取得了最佳平衡。强烈建议作为初次实验的默认变分层。
- Efficient SU2：表达能力最强，参数多。当Two Local表现遇到瓶颈，且你有足够的计算资源和耐心进行调优时，可以尝试用它来冲击更高的性能上限。
- Pauli Two Design：性能波动大，不稳定。除非有特定理论需求，否则不建议作为首选。
模型架构的抉择：
- 追求最佳性能：在数据相对均衡或模式清晰时，优先测试SQNN；在数据极度不平衡、需要极高精确率的真实场景，优先测试VQC。
- 资源与效率考量：如果计算资源有限，VQC通常比SQNN更快，因为后者需要多次采样。EQNN计算最快，但性能风险也最大。
- 实用推荐路径：VQC/SQNN+Pauli或Z特征映射 +Two Local变分层。这是一个高性能、高稳定性的起点组合。

4. 噪声鲁棒性分析：从理想走进现实

量子计算，尤其是近期的NISQ设备，无法避开噪声。因此，我们在模拟器中为表现最好的模型（BankSim选SQNN，欧洲数据集选VQC）注入了五种典型的量子噪声通道，观察其性能衰减情况。这对于评估模型未来上真机的潜力至关重要。

噪声类型简介：

退极化噪声：以概率p将量子态完全混合，是最具破坏性的噪声之一。
相位阻尼噪声：导致量子比特相位信息丢失（退相干）。
振幅阻尼噪声：模拟能量耗散，使量子态向基态|0⟩弛豫。
比特翻转噪声：以概率p将|0⟩和|1⟩翻转。
相位翻转噪声：以概率p施加一个Z门，改变相对相位。

实验结果与解读：

SQNN在BankSim上的噪声表现：在无噪声时F1分数高达0.85的SQNN模型，对噪声非常敏感。当噪声水平增加到0.25时，性能在所有噪声类型下均大幅下滑，F1分数降至0.45-0.55区间。特别是退极化、相位阻尼和振幅阻尼噪声对其影响最大。这表明，尽管SQNN在理想条件下表现卓越，但其性能严重依赖于量子态的相干性，在当前的噪声水平下可能非常脆弱。
VQC在欧洲数据集上的噪声表现：相比之下，VQC展现了更强的鲁棒性。在无噪声时F1分数为0.90，随着噪声增加，其性能衰减更为平缓。有趣的是，在相位翻转噪声下，其性能甚至出现了一个小峰值，这可能是因为这种噪声偶然起到了类似“正则化”的作用，防止了过拟合。在噪声水平较高时，VQC的性能仍能维持在0.4-0.55的区间，优于SQNN在同等噪声下的表现。

避坑指南与工程启示：
噪声是QML落地必须面对的“拦路虎”。模拟器中的优秀表现，不代表能在真实量子硬件上复现。
VQC架构显示出更好的噪声容忍度。这可能得益于其更简单的测量后处理（偶校验）和优化的电路结构。在面向近期量子硬件的应用规划中，VQC可能是更稳妥的选择。
针对噪声的设计：未来的工作必须考虑噪声自适应。这包括：
使用更浅的电路：在满足性能需求的前提下，尽量使用像Z映射+Real Amplitudes这样的浅层组合。
选择噪声鲁棒的变分层：研究哪些门序列对特定噪声更不敏感。
集成错误缓解技术：如零噪声外推、测量误差缓解等，虽然会增加计算开销，但可能是实用化必经之路。

5. 统计显著性验证与实验可靠性

为了确保我们观察到的性能差异不是随机波动导致的，我们对所有实验结果的F1分数进行了单因素方差分析（ANOVA）。这是将实证结论建立在坚实统计基础上的关键一步。

ANOVA结果速查表：

影响因素	F值	p值	统计显著性
模型类型	335.08	1.18 × 10⁻¹⁰²	高度显著
变分层	10.96	7.51 × 10⁻²³	高度显著
特征映射	8.96	1.44 × 10⁻⁴	显著
数据集	1.71	0.1917	不显著

结果解读：

模型类型的影响最大：F值极高，p值近乎为0。这以统计学的严格语言证实了VQC、SQNN、EQNN三者之间的性能差异是真实且巨大的，绝非偶然。
变分层和特征映射的选择至关重要：它们的p值也远小于0.05，说明不同的配置组合会显著影响模型性能，我们的配置优化工作具有明确价值。
数据集的影响不显著：这是一个非常有趣的发现。p值大于0.05，意味着虽然两个数据集本身差异很大，但模型性能的相对优劣趋势和配置的优劣规律在两个数据集上是一致的。例如，VQC和SQNN总是优于EQNN；Two Local和Pauli映射通常表现更好。这极大地增强了我们结论的普适性和可靠性。

实操心得：在进行任何机器学习，尤其是资源消耗大的量子机器学习实验时，一定要做重复实验和统计检验。我们每个配置都运行了10次，用ANOVA分析结果。这不仅能给你信心，也能在结果出现反直觉时，帮你判断是发现了新规律，还是仅仅遇到了随机误差。

6. 完整复现指南：从零搭建你的量子欺诈检测模型

理论分析完毕，是时候动手了。以下是我基于Qiskit框架，复现本次核心实验的步骤和代码要点。假设你已有Python和Qiskit的基础。

6.1 环境准备与数据预处理

# 环境配置建议 pip install qiskit qiskit-machine-learning pandas scikit-learn numpy matplotlib

import pandas as pd from sklearn.model_selection import train_test_split from sklearn.preprocessing import StandardScaler from sklearn.metrics import classification_report, f1_score from qiskit.circuit.library import ZZFeatureMap, ZFeatureMap, PauliFeatureMap, RealAmplitudes, TwoLocal, EfficientSU2 from qiskit_machine_learning.algorithms import VQC, SamplerQNN, EstimatorQNN from qiskit_machine_learning.neural_networks import SamplerQNN as SamplerNN, EstimatorQNN as EstimatorNN from qiskit.primitives import Sampler, Estimator import numpy as np # 1. 数据加载与清洗（以欧洲数据集为例，需从Kaggle下载） # 假设df已加载，包含‘Time’， ‘V1’...‘V28’， ‘Amount’， ‘Class’列 # ‘Class’为标签，1表示欺诈 # 2. 特征工程（这里做最基础的处理） features = df.drop(['Class', 'Time'], axis=1) # 通常丢弃‘Time’，或进行周期性编码 labels = df['Class'] # 3. 标准化：量子旋转门对输入尺度敏感，必须标准化 scaler = StandardScaler() features_scaled = scaler.fit_transform(features) # 4. 处理类别不平衡（关键！） # 量子模型对小样本学习同样敏感，必须处理不平衡 from imblearn.over_sampling import SMOTE smote = SMOTE(random_state=42) X_res, y_res = smote.fit_resample(features_scaled, labels) # 5. 划分训练集和测试集 X_train, X_test, y_train, y_test = train_test_split(X_res, y_res, test_size=0.2, random_state=42, stratify=y_res)

6.2 构建量子电路：特征映射与变分层

def create_quantum_circuit(num_qubits, feature_map_type='z', ansatz_type='two_local', reps=2): """ 创建特征映射和变分层组成的参数化量子电路。 参数： num_qubits: 量子比特数，应与特征维度匹配（可通过PCA降维） feature_map_type: ‘z‘, ‘zz‘, ‘pauli‘ ansatz_type: ‘real_amplitudes‘, ‘two_local‘, ‘efficient_su2‘, ‘pauli_two_design‘ reps: 变分层的重复层数，控制电路深度和参数数量 """ # 1. 构建特征映射 if feature_map_type.lower() == 'z': feature_map = ZFeatureMap(feature_dimension=num_qubits, reps=1) elif feature_map_type.lower() == 'zz': feature_map = ZZFeatureMap(feature_dimension=num_qubits, reps=1, entanglement='linear') elif feature_map_type.lower() == 'pauli': feature_map = PauliFeatureMap(feature_dimension=num_qubits, reps=1, paulis=['Z', 'ZZ'], entanglement='linear') else: raise ValueError(f"不支持的feature_map_type: {feature_map_type}") # 2. 构建变分层 if ansatz_type.lower() == 'real_amplitudes': ansatz = RealAmplitudes(num_qubits, reps=reps) elif ansatz_type.lower() == 'two_local': ansatz = TwoLocal(num_qubits, ['ry', 'rz'], 'cz', reps=reps, insert_barriers=True) elif ansatz_type.lower() == 'efficient_su2': ansatz = EfficientSU2(num_qubits, reps=reps) elif ansatz_type.lower() == 'pauli_two_design': # Qiskit未直接提供，可用TwoLocal模拟或自定义 ansatz = TwoLocal(num_qubits, ['ry', 'rz'], 'cz', reps=reps, entanglement='full', insert_barriers=True) print("注意：使用‘full‘纠缠的TwoLocal作为PauliTwoDesign的近似") else: raise ValueError(f"不支持的ansatz_type: {ansatz_type}") # 3. 组合成完整电路 circuit = feature_map.compose(ansatz) return circuit, feature_map, ansatz # 示例：创建一个4比特，使用ZZ特征映射和TwoLocal变分层的电路 qc, fm, ans = create_quantum_circuit(4, feature_map_type='zz', ansatz_type='two_local', reps=2) print(f"电路深度: {qc.depth()}") print(f"参数数量: {ans.num_parameters}")

6.3 实例化与训练QML模型

这里以VQC和SQNN为例，EQNN构建方式类似但使用EstimatorQNN。

from qiskit.algorithms.optimizers import COBYLA, SPSA from qiskit_machine_learning.algorithms.classifiers import NeuralNetworkClassifier def train_vqc(X_train, y_train, feature_map, ansatz, optimizer_type='cobyla', max_iter=200): """训练一个VQC分类器""" # 使用Sampler原语 sampler = Sampler() # 创建VQC实例 vqc = VQC( sampler=sampler, feature_map=feature_map, ansatz=ansatz, optimizer=COBYLA(maxiter=max_iter) if optimizer_type=='cobyla' else SPSA(maxiter=max_iter), callback=callback # 可选，用于记录损失 ) # 训练 vqc.fit(X_train, y_train) return vqc def train_sqnn(X_train, y_train, feature_map, ansatz, optimizer_type='cobyla', max_iter=200): """训练一个SQNN分类器""" # 构建完整电路 from qiskit import QuantumCircuit full_circuit = feature_map.compose(ansatz) # 定义如何从测量结果中解读（这里是多类概率，二分类可简化） def parity(x): return '{:b}'.format(x).count('1') % 2 # 创建SamplerQNN sampler_qnn = SamplerNN( circuit=full_circuit, input_params=feature_map.parameters, weight_params=ansatz.parameters, interpret=parity, # 二分类的偶校验解释函数 output_shape=2, # 二分类，输出两个类别的概率 sampler=Sampler() ) # 包装成分类器 classifier = NeuralNetworkClassifier( neural_network=sampler_qnn, optimizer=COBYLA(maxiter=max_iter) if optimizer_type=='cobyla' else SPSA(maxiter=max_iter), callback=callback ) classifier.fit(X_train, y_train) return classifier # 训练示例 num_qubits = 4 # 根据PCA降维后的特征数确定 circuit, fm, ans = create_quantum_circuit(num_qubits, 'pauli', 'two_local') # 训练VQC print("训练VQC...") vqc_classifier = train_vqc(X_train[:, :num_qubits], y_train, fm, ans, 'cobyla', 150) # 训练SQNN print("训练SQNN...") sqnn_classifier = train_sqnn(X_train[:, :num_qubits], y_train, fm, ans, 'cobyla', 150)

6.4 评估、调优与可视化

# 1. 评估模型 def evaluate_model(classifier, X_test, y_test, name): y_pred = classifier.predict(X_test[:, :num_qubits]) f1 = f1_score(y_test, y_pred) report = classification_report(y_test, y_pred, target_names=['正常', '欺诈']) print(f"\n=== {name} 模型评估 ===") print(f"F1分数: {f1:.4f}") print(report) return f1, report f1_vqc, report_vqc = evaluate_model(vqc_classifier, X_test, y_test, "VQC") f1_sqnn, report_sqnn = evaluate_model(sqnn_classifier, X_test, y_test, "SQNN") # 2. 损失曲线可视化（如果回调函数记录了损失） import matplotlib.pyplot as plt plt.figure(figsize=(10, 6)) plt.plot(vqc_loss_history, label='VQC Loss', alpha=0.7) plt.plot(sqnn_loss_history, label='SQNN Loss', alpha=0.7) plt.xlabel('迭代次数') plt.ylabel('损失值') plt.title('训练损失曲线对比') plt.legend() plt.grid(True, linestyle='--', alpha=0.5) plt.show() # 3. 超参数调优建议 # - `reps`（变分层重复次数）：从1或2开始，逐渐增加。增加`reps`能提高表达能力，但也增加训练难度和噪声敏感度。 # - 优化器：`COBYLA`适用于无噪声或低噪声模拟，收敛稳定但慢；`SPSA`更适合有噪声场景或真机运行。 # - 学习率/最大迭代次数：需要根据损失曲线调整。如果损失早早就平坦了，可以减小迭代次数；如果一直在下降，可以增加。

7. 常见问题、排查技巧与避坑实录

在实际操作中，你肯定会遇到各种问题。以下是我在实验中踩过的坑和总结的排查思路。

7.1 模型性能不佳（F1分数低）

问题现象：无论怎么调参，F1分数都低于0.6，甚至和随机猜测差不多。
排查步骤：
1. 检查数据预处理：这是最常见的问题。确认特征是否已经标准化？类别不平衡是否处理（用了SMOTE）？量子比特数是否与特征维度匹配（尝试用PCA将特征降至4-8维）？
2. 检查电路结构：打印出你的量子电路图。特征映射和变分层是否正确连接？参数数量是否合理？电路深度是否过深（可能导致梯度消失）？
3. 验证经典部分：用一个简单的经典模型（如逻辑回归）在同样的数据上跑一下。如果经典模型效果也很差，那问题很可能出在数据或特征本身，而不是量子模型。
4. 简化配置：退回到最简单的配置：Z特征映射 +Real Amplitudes变分层，reps=1。先确保这个基线能跑出比随机好的结果。
5. 观察损失曲线：如果损失曲线根本不下降，可能是优化器问题，尝试换用SPSA或调整学习率。也可能是梯度问题（ barren plateau），尝试换一种变分层结构或减少reps。

7.2 训练速度极慢或内存溢出

问题现象：训练迭代一次要几分钟，或者直接报内存错误。
排查步骤：
1. 减少量子比特数：这是最有效的方法。量子电路的模拟成本随比特数指数增长。务必使用PCA、特征选择等方法将特征维度降至8以下，4-6个量子比特是模拟实验的甜点区。
2. 使用更浅的电路：减少变分层的reps参数。reps=1或2通常足够用于探索。
3. 切换模拟器后端：Qiskit的Aer模拟器有statevector（精确但耗内存）和matrix_product_state（MPS，适用于低纠缠电路）等后端。对于低纠缠电路，使用backend = AerSimulator(method='matrix_product_state')可以大幅节省内存和计算时间。
4. 减少训练数据量：在实验探索阶段，先用一个子集（如1000个样本）进行快速迭代，找到有希望的配置后再用全数据训练。

7.3 结果不稳定，每次运行差异大

问题现象：同样的配置和代码，多次训练的F1分数波动很大。
排查步骤：
1. 固定随机种子：在Python、NumPy、Qiskit等所有可能的地方设置随机种子，确保可重复性。
```
import random import numpy as np random.seed(42) np.random.seed(42) # 在创建VQC/SQNN时，如果优化器有random参数，也需设置
```
2. 参数初始化：变分层的参数初始值对训练影响很大。尝试不同的初始化策略，或者使用qiskit.algorithms.optimizers中优化器自带的初始化功能。
3. 增加测量次数：对于SQNN，采样次数（shots）太少会导致概率估计不准。在模拟中，可以设置一个较大的shots值（如10000）来减少统计波动。
4. 进行多次运行取平均：对于量子机器学习，由于随机初始化等因素，对每个配置进行多次（如10次）独立训练并取性能指标的平均值，是报告结果的标准做法。我们的ANOVA分析正是基于此。

7.4 选择优化器的经验

COBYLA：无梯度优化器，在无噪声模拟中表现稳定，是我在模拟实验中的首选。但它对参数缩放敏感，确保你的输入数据已标准化。
SPSA：随机梯度近似，特别适合有噪声的环境或真机运行。它每次迭代只计算两次损失，效率高，但超参数（如学习率）需要仔细调整。
Adam：经典的梯度下降优化器，在Qiskit中也可用。但它需要计算梯度，在模拟中可能较慢，且对量子电路中的 barren plateau 问题更敏感。

一个实用的训练流程建议：在模拟器上，先用COBYLA和小数据集快速筛选出有潜力的电路配置。确定最佳配置后，再用SPSA和全量数据进行最终训练和评估，以模拟更接近真实量子硬件的噪声环境。

量子机器学习在金融欺诈检测上的应用还处于早期探索阶段，本次实验清晰地表明，模型架构和组件配置的选择，其影响远大于算法本身的“量子优越性”。没有“银弹”配置，最佳组合高度依赖于你的具体数据特性。我的建议是，以本文的实验结果为导航图，从VQC/SQNN+Pauli/Z+Two Local这个稳健的组合开始你的探索，结合扎实的数据预处理和严谨的评估流程，一步步调优，记录下属于你自己数据集的“配置性能图谱”。这个过程本身，就是理解和驾驭量子机器学习能力的最佳途径。

查看全文

http://www.zskr.cn/news/1365509.html