当前位置：首页 > news >正文

量子变分算法---损失函数

news 2026/6/5 8:53:32

引子

关于损失函数，我们知道在强化学习中，会有一个函数，用来表示模型每一次行为的分数，通过最大化得分，建立一个正反馈机制，若模型为最优则加分最多，若决策不佳则加很少分或者扣分。而在神经网络中，通过正向传播可以求得模型的权重和偏执，用于最后的预测或者分类，真实值和预测值之间的差值。而反向传播，通过求权重和偏置的梯度，来调整参数，使得梯度不断下降，让模型的性能更优。

所有物理系统，无论是经典系统还是量子系统，都可以存在于不同的状态中。例如，道路上的汽车可以具有表征其状态的特定质量、位置、速度或加速度。同样，量子系统也可以具有不同的配置或状态，但它们在处理测量和状态演变的方式上与经典系统不同。这导致了量子力学独有的叠加和纠缠等独特属性。就像我们可以用速度或加速度等物理属性来描述汽车的状态一样，我们也可以使用可观测量来描述量子系统的状态，可观测量是数学对象。

在量子力学中，状态由归一化复列向量或 kets∣ψ〉表示，可观测量是作用于 kets 的厄米线性算子 ( $\hat H=\hat H^{+}$ )。可观测量的特征向量 |λ〉 称为特征态。测量可观测量的其中一个特征态 (λ〉
将为我们提供相应的特征值 λ作为读数。

在qiskit中提供了两种方法，来测量量子系统，一个是采样器（Sampler）和估计器（Estimator），采样器用于计算给定状态∣ψ〉下获取每一个基础状态的概率值，而估计器获取一个可以观测的 $\hat H$ 和∣ψ〉

sampler原语，为什么它仅仅适合稀疏概率分布呢？

稀疏概率分布是指，量子态∣ψ〉仅涉及到少数几个计算基态|k>的概率，而大多数基态的状态为零或者非常小。例如

而下列是密集的

而如果概率是密集的，那么测量基态的数量为2的幂次，而稀疏分布的只需要少数几次测量。

Sampler在处理稀疏分布时更加高效，因此它只是需要少数几次测量来捕捉少数几个基态的概率。

Estimator通过计算可观测量 $\hat H$ 对于一个量子态∣ψ〉，它的观测概率可以被表达为 $p_{\lambda }=|\langle\lambda |\Psi \rangle$

而它对每个状态的概率和，可以表示为：

$\langle \hat H \rangle_{\Psi }: =\sum_{\lambda }p_{\lambda}=\langle\Psi | \hat H | \Psi \rangle$

但是，计算可观测量的期望值并不总是可行的，因为我们通常不知道它的特征基。Qiskit Runtime 的 Estimator 使用复杂的代数过程来估计真实量子设备上的期望值，是将可观测量分解为我们知道其特征基的其他可观测量的组合。

简而言之，Estimator 将它不知道如何测量的任何可观测量分解为更简单、可测量的可观测量，称为 Pauli 算子。任何算子都可以表示为 $4^{n}$ 个 Pauli 算子的组合。

其中 $(\sigma_{0} ,\sigma_{1} ,\sigma _{2},\sigma_{3} ):=(I,X,Y,Z)$

执行此分解后，估算器会为每个可观测量 Pk 即来自原始电路）导出一个新的电路 V k∣ψ〉，以有效地在计算基础中对泡利可观测量进行对角化并对其进行测量。我们可以轻松测量泡利可观测量，因为我们提前知道 Vk，而其他可观测量通常并非如此。
对于每个 Pk ，估算器会在量子设备上运行相应的电路多次，在计算基础中测量输出状态，并计算获得每个可能输出 j 的概率 Pkj 。然后，它寻找与每个输出 j 对应的 Pk 的特征值 λkj ，乘以 wk ，然后将所有结果相加在一起，以获得给定状态 ∣ψ 〉的可观测量 $\hat H$ 的预期值。与sampler类似，估计器也仅仅作用于稀疏状态。所以可以表示如下：

如何计算期望值呢？

对于单量子比特状态

它的期望值 $\langle \hat H \rangle_{+}: =\langle+| \hat H | + \rangle=2$

我们又知道 $\langle \hat H \rangle_{+}=2\langle X \rangle_{+}-\langle Z \rangle_{+}$ ，我们注意到 $\langle+| X | + \rangle=1$ , $\langle+| Z | + \rangle=1$ ，由于X和Z不交换，所以我们需要辅助线路。

数学介绍

由于我们不知道目标可观测量H的特征值或特征态，所以我们需要考虑它的对角化（对角化话很重要，为什么？）假设H是厄密矩阵，存在一个幺正变换V使得， $\hat H=V^{+}\Lambda V$ 且 $\langle j | \Lambda |k\rangle=0$ ,V是一个酉变换。

这样期望值就可以被重写成

我们需要知道如何获得矩阵 V 和特征值 Λ。如果您已经有了特征值，那么就不需要使用量子计算机了，因为变分算法的目标是找到 H ^的这些特征值。
幸运的是，有一种方法可以解决这个问题：任何 $2^{n}*2^{n}$ 矩阵都可以写成 $4^{n}$ 个张量积的线性组合，这些张量积是n 个 Pauli 矩阵和恒等式的，它们都是厄米矩阵和幺正矩阵，并且已知 V 和 Λ 。这就是 Runtime 的 Estimator 在内部所做的，它将任何 Operator 对象分解为 SparsePauliOp 。
以下是可以使用的运算符：

损失函数

让我们考虑一个寻找系统基态的简单例子。我们的目标是最小化表示能量的可观测量的期望值（哈密顿量 H ^ ）

我们使用估计器（estimator）来评估期望值，并将期望值传递给优化器使得它最小化，如果优化成功它将返回一组最佳参数，并且能得到解决 $|\Psi (\Theta ^{*}))\rangle$ ,并计算观测期望 $C(\hat \Theta^{*} )$ 。

测量速度和测量正确的关系图

总之，通过用哈密顿量的概率分布来表征，基本态的概率，通过最小化能量，即哈密顿量来活得最好的结果。

错误缓解

        错误缓解是指允许用户通过在执行时对设备噪声进行建模来减少电路错误的技术。通常，这会与模型训练相关的量子预处理开销和使用生成的模型缓解原始结果中错误的经典后处理开销相关。
        Qiskit Runtime 原语的 resilience_level 选项指定针对错误构建的弹性量。更高的级别会产生更准确的结果，但由于量子采样开销，处理时间会更长。在将错误缓解应用于原始查询时，可以使用弹性级别来配置成本和准确性之间的权衡。
        在实施任何错误缓解技术时，我们都希望结果中的偏差相对于之前未缓解的偏差有所减少。在某些情况下，偏差甚至可能会消失。然而，这是有代价的。随着我们减少估计量的偏差，统计变异性将增加（即方差），我们可以通过在采样过程中进一步增加每个电路的采样次数来解决这个问题。这将引入超出减少偏差所需的开销，因此默认情况下不执行此操作。我们可以通过在 options.executions.shots 中调整每个电路的镜头数量来轻松选择此行为，如下例所示。

零噪声外推

(ZNE) 的工作原理是

首先放大准备所需量子态的电路中的噪声，获得几个不同噪声水平的测量值，并使用这些测量值推断无噪声结果。
总体工作流程：

1.放大几个噪声因子的电路噪声

2.运行每个噪声放大电路

3.外推回零噪声极限

附录

1.零噪声外推（zne）的方法？

零噪声外推实验步骤：

放大噪声因子：
- 在量子电路中，引入额外的噪声。这通常通过修改量子电路的某些部分来实现，例如引入故意增加的量子门错误（例如 X、Y、Z 操作），或者使用额外的测量错误。
- 通过不同的放大因子，可以得到多个在不同噪声水平下的电路。
运行每个噪声放大电路：
- 在每个噪声级别下运行量子电路多次，通常会进行多次重复实验（shots）。每次运行的测量结果会受到噪声的影响，因此需要从多个实验中收集数据。
- 通常，噪声因子较大的电路结果会与真实的量子态有所偏差。
外推回零噪声极限：
- 对不同噪声水平下的测量结果进行分析。因为噪声与量子电路的行为有一定的关系（通常是线性或接近线性的关系），可以通过对不同噪声级别的结果进行拟合。
- 一般采用线性外推，即将噪声放大因子与测量结果之间的关系进行回归，推断出零噪声下的理论值。

量子变分算法---损失函数

引子

数学介绍

损失函数

错误缓解

附录

相关文章：

量子变分算法---损失函数

计算机的性能评估

大数据之国产数据库_OceanBase数据库002_在centos7.9上_安装部署OceanBase001_踩坑指南_亲测可用

【ETCD】【源码阅读】深入解析 EtcdServer.run 函数

springboot/ssm校内订餐系统Java代码web项目美食外卖点餐配送源码

floodfill算法

【JAVA】六亮增加贴

git提交时出现merge branch main of xxx

lstm 输入数据的形状是怎么样的，他有两种输入方式，通过参数 batch_first来设置默认是False

Apache Doris 数据类型

编译问题 fatal error: rpc/rpc.h: No such file or directory

linux 安装composer

数据库公共字段自动填充的三种实现方案

《MySQL 入门：数据库世界的第一扇门》

Qt之第三方库QCustomPlot使用（二）

JAVA-类与继承

SSH连接报错，Corrupted MAC on input 解决方法

【C++】8___继承

C# 中的异常处理：构建健壮和可靠的程序

基于智能合约的医院凭证共享中心路径探析

Kerberos身份认证原理与企业级排错实战指南

从安装到排错：手把手解决Linux服务器上Nacos启动失败的十大常见问题

集成Taotoken为OpenClaw工作流提供持久化模型支持

JS中forEach与普通for

SpringBoot WebClient 介绍

PrediPrune：机器学习驱动的编译器超级优化候选剪枝策略

SHAP原理与特征贡献解析

【Midjourney霓虹效果终极指南】：20年AI视觉工程师亲授5大参数组合+3类光源建模公式，97%新手一周内复刻赛博朋克海报

三步解锁WeMod专业版：终极本地增强工具配置指南

QKeyMapper终极指南：Windows上最强大的开源按键映射工具