第 28 章 线性代数在量子信息中的应用¶
前置:内积空间与酉变换(Ch7-8) · 张量积(Ch21) · 正定矩阵(Ch16) · SVD(Ch11) · 矩阵不等式(Ch18) · Kronecker 积(Ch19)
脉络:量子态(Hilbert 空间中的单位向量) → 量子门(酉矩阵) → 张量积(多体系统) → 纠缠(Bell 态/Schmidt 分解) → 测量(投影/POVM) → 密度矩阵与量子信道(Kraus 算子) → 量子纠错(稳定子码) → 矩阵不等式(von Neumann 熵/强次可加性)
量子信息科学完全建立在线性代数的基础之上。量子态是 Hilbert 空间中的向量,量子演化是酉变换,量子测量是投影运算,量子纠缠是张量积空间中的非可分结构,量子信道是完全正保迹映射。本章从量子态与 Hilbert 空间出发,系统展示线性代数工具在量子计算、量子通信和量子纠错中的核心作用,并以量子信息中的矩阵不等式作为结束。
28.1 量子态与 Hilbert 空间¶
基本对应:经典比特 \(\{0, 1\}\) → 量子比特 \(|\psi\rangle = \alpha|0\rangle + \beta|1\rangle \in \mathbb{C}^2\) → Dirac 记号 → 纯态 vs 混合态
链接:Ch8 内积空间的直接应用
量子比特(qubit)是量子信息的基本单元,其数学描述是二维复 Hilbert 空间中的单位向量。Dirac 记号为量子力学提供了一种简洁而强大的线性代数语言。
定义 28.1 (量子态)
一个量子态(quantum state)是 Hilbert 空间 \(\mathcal{H}\) 中的单位向量 \(|\psi\rangle\),满足 \(\langle\psi|\psi\rangle = 1\)。在 Dirac 记号中:
- 右矢(ket)\(|\psi\rangle\) 表示列向量。
- 左矢(bra)\(\langle\psi|\) 表示 \(|\psi\rangle\) 的共轭转置,即行向量。
- 内积 \(\langle\phi|\psi\rangle\) 为复数。
- 外积 \(|\psi\rangle\langle\phi|\) 为矩阵(线性算子)。
全局相位 \(e^{i\theta}|\psi\rangle\) 与 \(|\psi\rangle\) 表示相同的物理状态,因此量子态的物理空间实际上是射影 Hilbert 空间。
定义 28.2 (量子比特)
一个量子比特(qubit)的状态为 \(\mathbb{C}^2\) 中的单位向量
其中 \(|0\rangle = \begin{pmatrix} 1 \\ 0 \end{pmatrix}\),\(|1\rangle = \begin{pmatrix} 0 \\ 1 \end{pmatrix}\) 为计算基(computational basis),\(\alpha, \beta \in \mathbb{C}\)。\(|\alpha|^2\) 和 \(|\beta|^2\) 分别是测量得到 \(|0\rangle\) 和 \(|1\rangle\) 的概率。
\(n\) 个量子比特的联合状态空间为张量积 \(\mathcal{H} = (\mathbb{C}^2)^{\otimes n} \cong \mathbb{C}^{2^n}\),维数随比特数指数增长。
定理 28.1 (密度矩阵的刻画)
算子 \(\rho\) 是一个合法的密度矩阵(表示量子态)当且仅当满足以下两个条件:
- \(\rho \succeq 0\)(半正定)。
- \(\operatorname{tr}(\rho) = 1\)。
进一步地:
- \(\rho\) 表示纯态 \(\iff\) \(\rho^2 = \rho\)(幂等)\(\iff\) \(\operatorname{rank}(\rho) = 1\) \(\iff\) \(\operatorname{tr}(\rho^2) = 1\)。
- \(\rho\) 表示混合态 \(\iff\) \(\operatorname{tr}(\rho^2) < 1\),此时 \(\rho = \sum_i p_i |\psi_i\rangle\langle\psi_i|\)(\(p_i > 0\),\(\sum p_i = 1\))。
证明
必要性:纯态 \(\rho = |\psi\rangle\langle\psi|\) 显然半正定(对任意 \(|\phi\rangle\),\(\langle\phi|\rho|\phi\rangle = |\langle\phi|\psi\rangle|^2 \ge 0\)),且 \(\operatorname{tr}(\rho) = \langle\psi|\psi\rangle = 1\)。混合态 \(\rho = \sum_i p_i |\psi_i\rangle\langle\psi_i|\) 是半正定矩阵的凸组合,仍半正定,且 \(\operatorname{tr}(\rho) = \sum_i p_i = 1\)。
充分性:若 \(\rho \succeq 0\) 且 \(\operatorname{tr}(\rho) = 1\),则 \(\rho\) 有谱分解 \(\rho = \sum_i \lambda_i |e_i\rangle\langle e_i|\),其中 \(\lambda_i \ge 0\)(半正定),\(\sum_i \lambda_i = 1\)(迹为 \(1\))。因此 \(\lambda_i\) 构成概率分布,\(\rho\) 确实是纯态的概率混合。
纯态判据:若 \(\rho = |\psi\rangle\langle\psi|\),则 \(\rho^2 = |\psi\rangle\langle\psi|\psi\rangle\langle\psi| = |\psi\rangle\langle\psi| = \rho\)。反之,设 \(\operatorname{tr}(\rho^2) = 1\)。由 \(\rho\) 的特征值 \(\lambda_i \ge 0\)、\(\sum \lambda_i = 1\)、\(\sum \lambda_i^2 = 1\),以及 Cauchy-Schwarz 不等式 \(\sum \lambda_i^2 \le (\max \lambda_i)\sum \lambda_i = \max \lambda_i\),得 \(\max \lambda_i \ge 1\)。又 \(\lambda_i \le \sum \lambda_i = 1\),故恰有一个 \(\lambda_i = 1\),其余为 \(0\)。\(\blacksquare\)
例 28.1
Bloch 球表示。 单量子比特纯态(去除全局相位后)可参数化为
对应密度矩阵 \(\rho = |\psi\rangle\langle\psi| = \frac{1}{2}(I + \mathbf{r} \cdot \boldsymbol{\sigma})\),其中 Bloch 向量 \(\mathbf{r} = (\sin\theta\cos\phi, \sin\theta\sin\phi, \cos\theta)\),\(|\mathbf{r}| = 1\)。
混合态对应 \(|\mathbf{r}| < 1\)(球内部)。最大混合态 \(\rho = I/2\) 对应 \(\mathbf{r} = \mathbf{0}\)(球心)。
| 态 | Bloch 向量 | 位置 |
|---|---|---|
| \(\|0\rangle\) | \((0, 0, 1)\) | 北极 |
| \(\|1\rangle\) | \((0, 0, -1)\) | 南极 |
| \(\|+\rangle = \frac{1}{\sqrt{2}}(\|0\rangle + \|1\rangle)\) | \((1, 0, 0)\) | \(x\) 轴正向 |
| \(\|-\rangle = \frac{1}{\sqrt{2}}(\|0\rangle - \|1\rangle)\) | \((-1, 0, 0)\) | \(x\) 轴负向 |
28.2 量子门与酉变换¶
核心原理:量子演化 = 酉变换 \(U^\dagger U = I\) → 保持内积(概率守恒)→ 单比特门(Pauli, Hadamard, S, T)→ 多比特门(CNOT, Toffoli)→ 通用门集
链接:Ch7 酉矩阵理论的直接应用
封闭量子系统的演化由酉矩阵描述。量子门是量子计算的基本操作单元。
定义 28.3 (量子门)
量子门(quantum gate)是作用在量子比特上的酉矩阵 \(U\)(\(U^\dagger U = UU^\dagger = I\))。
单比特 Pauli 门:
Hadamard 门:\(H = \frac{1}{\sqrt{2}}\begin{pmatrix} 1 & 1 \\ 1 & -1 \end{pmatrix}\),满足 \(H|0\rangle = |+\rangle\),\(H|1\rangle = |-\rangle\)。
相位门:\(S = \begin{pmatrix} 1 & 0 \\ 0 & i \end{pmatrix}\),\(T = \begin{pmatrix} 1 & 0 \\ 0 & e^{i\pi/4} \end{pmatrix}\)。注意 \(S = T^2\),\(Z = S^2\)。
定义 28.4 (多比特门)
CNOT(受控非)门是最重要的双比特门:
CNOT 以第一个比特(控制位)控制第二个比特(目标位)的翻转。
Toffoli 门(CCNOT)是三比特门:当且仅当两个控制位均为 \(|1\rangle\) 时翻转目标位。Toffoli 门是经典可逆计算的通用门。
定理 28.2 (量子门集的通用性)
门集 \(\{H, T, \text{CNOT}\}\) 是通用的:对任意 \(n\) 比特酉矩阵 \(U \in U(2^n)\) 和任意 \(\varepsilon > 0\),存在由 \(H\)、\(T\)、\(\text{CNOT}\) 组成的有限量子电路 \(\tilde{U}\),使得
更精确地,所需门数为 \(O(4^n \cdot \operatorname{poly}(\log(1/\varepsilon)))\)。
证明
证明分三步:
第 1 步:任意 \(n\) 比特酉矩阵可分解为双比特门的乘积。通过 QR 分解的量子类比(Givens 旋转),\(U(2^n)\) 中的任意酉矩阵可以写成 \(O(4^n)\) 个作用在两比特上的酉门的乘积。
第 2 步:任意双比特门可用 CNOT 和单比特门实现。这通过 KAK 分解(Cartan 分解)实现:任意 \(SU(4)\) 元素可以写成 \((A_1 \otimes A_2) \cdot \exp(i(a X \otimes X + b Y \otimes Y + c Z \otimes Z)) \cdot (A_3 \otimes A_4)\) 的形式,其中 \(A_i \in SU(2)\)。中间的纠缠部分可用至多 \(3\) 个 CNOT 实现。
第 3 步:\(\{H, T\}\) 在 \(SU(2)\) 中稠密(Solovay-Kitaev 定理)。\(H\) 和 \(T\) 生成的群在 \(SU(2)\) 中稠密,且任何 \(SU(2)\) 元素可以用 \(O(\log^c(1/\varepsilon))\) 个 \(H\) 和 \(T\) 门近似到精度 \(\varepsilon\),其中 \(c \approx 3.97\)。
综合三步,总门数为 \(O(4^n \cdot \operatorname{poly}(\log(1/\varepsilon)))\)。\(\blacksquare\)
例 28.2
Bell 态的制备电路。 利用 Hadamard 门和 CNOT 门从 \(|00\rangle\) 制备 Bell 态:
矩阵表示为
作用在 \(|00\rangle = (1,0,0,0)^T\) 上得 \(\frac{1}{\sqrt{2}}(1,0,0,1)^T = |\Phi^+\rangle\)。
28.3 张量积与多体系统¶
核心:\(\mathcal{H}_A \otimes \mathcal{H}_B\) = 复合系统的状态空间 → Kronecker 积给出矩阵表示 → 维数指数增长 = 量子优势的根源
链接:Ch19 Kronecker 积和 Ch21 张量代数的直接应用
量子多体系统的数学描述依赖于张量积。复合系统的状态空间是各子系统状态空间的张量积,这一结构导致了指数级的维度增长。
定义 28.5 (复合量子系统)
由子系统 \(A\)(状态空间 \(\mathcal{H}_A\),\(\dim = d_A\))和 \(B\)(状态空间 \(\mathcal{H}_B\),\(\dim = d_B\))组成的复合量子系统的状态空间为
若 \(\{|i\rangle_A\}\) 和 \(\{|j\rangle_B\}\) 分别为 \(\mathcal{H}_A\) 和 \(\mathcal{H}_B\) 的正交基,则 \(\{|i\rangle_A \otimes |j\rangle_B\}\) 为 \(\mathcal{H}_{AB}\) 的正交基。
对于算子,\(A\) 上的算子 \(O_A\) 和 \(B\) 上的算子 \(O_B\) 的联合作用为 Kronecker 积 \(O_A \otimes O_B\)。
定理 28.3 (张量积的性质)
设 \(A \in \mathbb{C}^{m \times m}\),\(B \in \mathbb{C}^{n \times n}\),则 Kronecker 积 \(A \otimes B \in \mathbb{C}^{mn \times mn}\) 满足:
- 混合乘积性质:\((A \otimes B)(C \otimes D) = AC \otimes BD\)。
- 谱性质:若 \(A\) 的特征值为 \(\{\alpha_i\}\),\(B\) 的特征值为 \(\{\beta_j\}\),则 \(A \otimes B\) 的特征值为 \(\{\alpha_i \beta_j\}\)。
- 迹:\(\operatorname{tr}(A \otimes B) = \operatorname{tr}(A) \cdot \operatorname{tr}(B)\)。
- 行列式:\(\det(A \otimes B) = (\det A)^n (\det B)^m\)。
- 酉性保持:若 \(A\) 和 \(B\) 都是酉矩阵,则 \(A \otimes B\) 也是酉矩阵。
证明
(1):\((A \otimes B)(C \otimes D)\) 的 \((i,j)\)-块(\(A\) 的 \((i,k)\)-元素和 \(C\) 的 \((k,j)\)-元素)为 \(\sum_k A_{ik}C_{kj} \cdot BD = (AC)_{ij} BD\),即 \(AC \otimes BD\) 的 \((i,j)\)-块。
(2):若 \(A\mathbf{u} = \alpha\mathbf{u}\),\(B\mathbf{v} = \beta\mathbf{v}\),则 \((A \otimes B)(\mathbf{u} \otimes \mathbf{v}) = A\mathbf{u} \otimes B\mathbf{v} = \alpha\beta(\mathbf{u} \otimes \mathbf{v})\)。
(3):\(\operatorname{tr}(A \otimes B) = \sum_{i,j}(A \otimes B)_{(i,j),(i,j)} = \sum_i A_{ii} \sum_j B_{jj} = \operatorname{tr}(A)\operatorname{tr}(B)\)。
(5):\((A \otimes B)^\dagger(A \otimes B) = (A^\dagger \otimes B^\dagger)(A \otimes B) = A^\dagger A \otimes B^\dagger B = I \otimes I = I\)。\(\blacksquare\)
例 28.3
两比特系统的矩阵表示。 考虑两比特态 \(|\psi\rangle = \frac{1}{\sqrt{2}}|00\rangle + \frac{1}{2}|01\rangle + \frac{1}{2}|10\rangle\)。
向量表示:\(|\psi\rangle = \frac{1}{\sqrt{2}}(1, 0)^T \otimes (1, 0)^T + \frac{1}{2}(1, 0)^T \otimes (0, 1)^T + \frac{1}{2}(0, 1)^T \otimes (1, 0)^T = (\frac{1}{\sqrt{2}}, \frac{1}{2}, \frac{1}{2}, 0)^T\)。
验证归一化:\(\frac{1}{2} + \frac{1}{4} + \frac{1}{4} + 0 = 1\)。
对此态施加 \(X \otimes Z\):
28.4 纠缠与 Bell 态¶
核心概念:乘积态 \(|\alpha\rangle \otimes |\beta\rangle\) vs 纠缠态(不可分)→ Bell 态(最大纠缠)→ Schmidt 分解 = SVD 的量子版本 → Schmidt 秩判定纠缠
链接:Ch11 SVD 和 Ch21 张量积的核心应用
量子纠缠是量子信息与经典信息最本质的区别,其数学本质是张量积空间中的不可分结构。
定义 28.6 (纠缠态与可分态)
双系统纯态 \(|\psi\rangle_{AB} \in \mathcal{H}_A \otimes \mathcal{H}_B\) 称为可分(separable),若存在 \(|\alpha\rangle \in \mathcal{H}_A\) 和 \(|\beta\rangle \in \mathcal{H}_B\) 使得
否则称为纠缠态(entangled state)。
对混合态,\(\rho_{AB}\) 可分当且仅当存在分解 \(\rho_{AB} = \sum_i p_i \rho_A^{(i)} \otimes \rho_B^{(i)}\)(\(p_i > 0\),\(\sum p_i = 1\))。
定义 28.7 (Bell 态)
四个 Bell 态构成 \(\mathbb{C}^2 \otimes \mathbb{C}^2\) 的正交基:
Bell 态是最大纠缠态:每个子系统的约化密度矩阵为 \(\rho_A = \rho_B = \frac{I}{2}\)(最大混合态),von Neumann 熵取最大值 \(S = \log 2 = 1\) bit。
定理 28.4 (Schmidt 分解定理)
任意双系统纯态 \(|\psi\rangle \in \mathcal{H}_A \otimes \mathcal{H}_B\)(\(\dim \mathcal{H}_A = d_A\),\(\dim \mathcal{H}_B = d_B\))可以写为
其中 \(r \le \min(d_A, d_B)\) 为 Schmidt 秩,\(\lambda_1 \ge \lambda_2 \ge \cdots \ge \lambda_r > 0\) 为 Schmidt 系数(\(\sum_{i=1}^r \lambda_i = 1\)),\(\{|u_i\rangle\}\) 和 \(\{|v_i\rangle\}\) 分别为 \(\mathcal{H}_A\) 和 \(\mathcal{H}_B\) 中的正交集。Schmidt 系数唯一确定,当 Schmidt 系数互不相同时向量也唯一(到相位因子)。
\(|\psi\rangle\) 为乘积态 \(\iff\) Schmidt 秩 \(r = 1\)。
证明
将 \(|\psi\rangle = \sum_{j,k} c_{jk} |j\rangle_A |k\rangle_B\) 的系数排列为矩阵 \(C \in \mathbb{C}^{d_A \times d_B}\),其中 \(C_{jk} = c_{jk}\)。对 \(C\) 进行奇异值分解(SVD,Ch11):\(C = U\Sigma V^\dagger\),其中 \(U \in \mathbb{C}^{d_A \times d_A}\) 和 \(V \in \mathbb{C}^{d_B \times d_B}\) 为酉矩阵,\(\Sigma\) 为对角矩阵,对角元素 \(\sigma_i \ge 0\)。
则 \(c_{jk} = \sum_{i=1}^{r} \sigma_i U_{ji} V_{ki}^*\)。定义
由 \(U\) 和 \(V\) 的酉性,\(\{|u_i\rangle\}\) 和 \(\{|v_i\rangle\}\) 分别正交。归一化 \(\sum_i \sigma_i^2 = \|C\|_F^2 = \langle\psi|\psi\rangle = 1\),令 \(\lambda_i = \sigma_i^2\),得
唯一性来自 SVD 奇异值的唯一性。\(\blacksquare\)
例 28.4
Bell 态的 Schmidt 分解与纠缠判定。
\(|\Phi^+\rangle = \frac{1}{\sqrt{2}}(|00\rangle + |11\rangle)\)。系数矩阵 \(C = \frac{1}{\sqrt{2}}\begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix} = \frac{1}{\sqrt{2}}I\)。SVD:\(U = V = I\),\(\sigma_1 = \sigma_2 = \frac{1}{\sqrt{2}}\)。Schmidt 秩 \(r = 2 > 1\),因此 \(|\Phi^+\rangle\) 是纠缠态。Schmidt 系数 \(\lambda_1 = \lambda_2 = \frac{1}{2}\)(均匀),确认最大纠缠。
比较:\(|\psi\rangle = |01\rangle\)。系数矩阵 \(C = \begin{pmatrix} 0 & 1 \\ 0 & 0 \end{pmatrix}\)。SVD 给出 \(\sigma_1 = 1\),Schmidt 秩 \(r = 1\),因此 \(|01\rangle = |0\rangle \otimes |1\rangle\) 是乘积态(可分)。
28.5 量子测量与 POVM¶
投影测量:正交分解 \(I = \sum_m P_m\) → Born 规则 \(p(m) = \langle\psi|P_m|\psi\rangle\) → 测后态塌缩 → POVM 推广到非正交测量 → Naimark 膨胀定理
链接:Ch7 正交投影和谱分解的直接应用
量子测量将线性代数的投影算子理论与概率论结合。
定义 28.8 (投影测量与 Born 规则)
一个投影测量由一组正交投影算子 \(\{P_m\}\) 定义,满足
Born 规则:对态 \(|\psi\rangle\),测量结果为 \(m\) 的概率为
测量后态塌缩为 \(\frac{P_m|\psi\rangle}{\sqrt{p(m)}}\)。对密度矩阵 \(\rho\),\(p(m) = \operatorname{tr}(P_m \rho)\)。
定义 28.9 (POVM)
正算子值测度(Positive Operator-Valued Measure, POVM)是一般化的测量框架。POVM 由一组正算子 \(\{E_m\}\) 定义,满足
测量结果为 \(m\) 的概率为 \(p(m) = \operatorname{tr}(E_m \rho)\)。POVM 元素 \(E_m\) 不必是投影,因此可以有比维数更多的测量结果。POVM 描述了信息提取,但不指定测后态。
定理 28.5 (Naimark 膨胀定理)
任何作用在 \(\mathcal{H}\) 上的 POVM \(\{E_m\}_{m=1}^M\) 都可以实现为扩展空间 \(\mathcal{H} \otimes \mathcal{H}_{\text{aux}}\) 上的投影测量。即存在辅助空间 \(\mathcal{H}_{\text{aux}}\)、初始辅助态 \(|0\rangle_{\text{aux}}\) 和扩展空间上的正交投影 \(\{\Pi_m\}\) 使得
等价地,\(\operatorname{tr}(E_m \rho) = \operatorname{tr}(\Pi_m (\rho \otimes |0\rangle\langle 0|))\)。
证明
构造 \(\mathcal{H}_{\text{aux}} = \mathbb{C}^M\)。对每个 POVM 元素 \(E_m\),由于 \(E_m \succeq 0\),存在 \(A_m\) 使得 \(E_m = A_m^\dagger A_m\)(取 \(A_m = \sqrt{E_m}\))。定义等距映射 \(V: \mathcal{H} \to \mathcal{H} \otimes \mathcal{H}_{\text{aux}}\),
验证 \(V\) 是等距映射:\(\langle\psi|V^\dagger V|\psi\rangle = \sum_m \langle\psi|A_m^\dagger A_m|\psi\rangle = \langle\psi|\sum_m E_m|\psi\rangle = \langle\psi|\psi\rangle\)。
定义 \(\Pi_m = I_{\mathcal{H}} \otimes |m\rangle\langle m|\)(扩展空间上的投影)。则
因此 POVM 测量等价于先嵌入扩展空间再做投影测量。\(\blacksquare\)
例 28.5
三元 POVM 区分非正交态。 考虑以等概率 \(1/2\) 给出 \(|0\rangle\) 或 \(|+\rangle = \frac{1}{\sqrt{2}}(|0\rangle + |1\rangle)\)。由于 \(\langle 0|+\rangle = \frac{1}{\sqrt{2}} \ne 0\),两态不正交,不能被投影测量完美区分。
构造无歧义态区分(USD)的三元 POVM \(\{E_0, E_+, E_?\}\):
- \(E_0 = \frac{1}{1 + 1/\sqrt{2}} |1\rangle\langle 1|\):当触发时确定态为 \(|+\rangle\)(因为 \(\langle 1|0\rangle = 0\),故 \(\operatorname{tr}(E_0 |0\rangle\langle 0|) = 0\))。
- \(E_+ = \frac{1}{1 + 1/\sqrt{2}} |-\rangle\langle -|\):当触发时确定态为 \(|0\rangle\)(因为 \(\langle -|+\rangle = 0\))。
- \(E_? = I - E_0 - E_+\):不确定结果。
最优无歧义区分成功概率为 \(p_{\text{succ}} = 1 - |\langle 0|+\rangle| = 1 - \frac{1}{\sqrt{2}} \approx 0.293\)。
28.6 密度矩阵与量子信道¶
开放系统:混合态 \(\rho\) → 偏迹(约化密度矩阵) → 量子信道 \(\mathcal{E}(\rho) = \sum_k K_k \rho K_k^\dagger\)(Kraus 表示)→ CPTP 映射 → Choi-Kraus 表示定理
链接:Ch16 正定矩阵/半正定锥和 Ch21 张量积的推广
量子信道描述开放量子系统的演化,其数学本质是完全正保迹(CPTP)映射。
定义 28.10 (偏迹与约化密度矩阵)
对复合系统态 \(\rho_{AB} \in \mathcal{B}(\mathcal{H}_A \otimes \mathcal{H}_B)\),子系统 \(A\) 的约化密度矩阵为
其中 \(\{|j\rangle_B\}\) 为 \(\mathcal{H}_B\) 的任意正交基。偏迹是唯一满足以下性质的运算:对所有 \(A\) 上的算子 \(O_A\),
定义 28.11 (量子信道与 Kraus 表示)
量子信道是完全正保迹(CPTP)映射 \(\mathcal{E}: \mathcal{B}(\mathcal{H}_{\text{in}}) \to \mathcal{B}(\mathcal{H}_{\text{out}})\)。其 Kraus 表示为
\(\{K_k\}\) 称为 Kraus 算子。条件 \(\sum_k K_k^\dagger K_k = I\) 保证迹守恒(\(\operatorname{tr}(\mathcal{E}(\rho)) = \operatorname{tr}(\rho) = 1\))。
常见量子信道包括:
- 去极化信道:\(\mathcal{E}(\rho) = (1-p)\rho + \frac{p}{d}I\),以概率 \(p\) 将态替换为最大混合态。
- 振幅阻尼信道:\(K_0 = \begin{pmatrix} 1 & 0 \\ 0 & \sqrt{1-\gamma} \end{pmatrix}\),\(K_1 = \begin{pmatrix} 0 & \sqrt{\gamma} \\ 0 & 0 \end{pmatrix}\),模拟自发辐射。
定理 28.6 (Choi-Kraus 表示定理)
线性映射 \(\mathcal{E}: \mathcal{B}(\mathcal{H}_{\text{in}}) \to \mathcal{B}(\mathcal{H}_{\text{out}})\) 是完全正映射当且仅当存在算子 \(\{K_k\}_{k=1}^r\) 使得
等价地,\(\mathcal{E}\) 是完全正的当且仅当其 Choi 矩阵
是半正定的。\(\mathcal{E}\) 还是保迹的当且仅当 \(\operatorname{tr}_{\text{out}}(J(\mathcal{E})) = I_{\text{in}}\)。
证明
Kraus \(\Rightarrow\) CP:对任意扩展空间 \(\mathcal{H}_R\) 和 \(\rho_{RA} \succeq 0\),
每一项 \(X\rho X^\dagger \succeq 0\)(保持半正定性),故和也半正定。
CP \(\Rightarrow\) Kraus:设 \(\mathcal{E}\) 完全正,则 Choi 矩阵 \(J(\mathcal{E}) \succeq 0\)。对 \(J(\mathcal{E})\) 做谱分解 \(J(\mathcal{E}) = \sum_k |\phi_k\rangle\langle\phi_k|\),将 \(|\phi_k\rangle \in \mathcal{H}_{\text{in}} \otimes \mathcal{H}_{\text{out}}\) 重塑为算子 \(K_k: \mathcal{H}_{\text{in}} \to \mathcal{H}_{\text{out}}\)(通过自然同构 \(\mathcal{H}_{\text{in}} \otimes \mathcal{H}_{\text{out}} \cong \operatorname{Hom}(\mathcal{H}_{\text{in}}, \mathcal{H}_{\text{out}})\))。则可以验证 \(\mathcal{E}(\rho) = \sum_k K_k \rho K_k^\dagger\)。
保迹条件 \(\sum_k K_k^\dagger K_k = I\) 等价于 \(\operatorname{tr}_{\text{out}}(J(\mathcal{E})) = I_{\text{in}}\),这可通过直接计算验证。\(\blacksquare\)
例 28.6
退相干信道。 单比特退相干(dephasing)信道 \(\mathcal{E}(\rho) = (1-p)\rho + pZ\rho Z\),Kraus 算子为 \(K_0 = \sqrt{1-p}\, I\),\(K_1 = \sqrt{p}\, Z\)。
作用在一般态 \(\rho = \begin{pmatrix} a & b \\ b^* & 1-a \end{pmatrix}\) 上:
对角元不变,非对角元衰减为 \((1-2p)\) 倍。当 \(p = 1/2\) 时,非对角元消失,相干性完全丧失。Choi 矩阵为
特征值为 \(\{1 + (1-2p), 1 - (1-2p), 0, 0\} = \{2-2p, 2p, 0, 0\} \ge 0\),确认完全正性。
28.7 量子纠错¶
核心思想:逻辑比特编码到物理比特的子空间 → 错误 = 线性算子 → Knill-Laflamme 条件 = 码空间上的正交性条件 → 稳定子码 → CSS 码
链接:Ch4 子空间和 Ch7 投影的核心应用
量子纠错是容错量子计算的基础。
定义 28.12 (量子纠错码)
一个 \([[n, k, d]]\) 量子纠错码将 \(k\) 个逻辑量子比特编码到 \(n\) 个物理量子比特中。码空间 \(\mathcal{C}\) 是 \((\mathbb{C}^2)^{\otimes n}\) 的 \(2^k\) 维子空间。码距 \(d\) 是可以检测的最大错误权重加 \(1\);码可纠正 \(\lfloor(d-1)/2\rfloor\) 个任意单比特错误。
定理 28.7 (Knill-Laflamme 量子纠错条件)
量子码 \(\mathcal{C}\)(码空间投影 \(P\))可以纠正错误集 \(\{E_a\}\) 当且仅当存在 Hermite 矩阵 \((\alpha_{ab})\) 使得
等价地,对码空间的任意正交基 \(\{|\psi_i\rangle\}\),
直观含义:不同错误要么将码空间映射到正交子空间(可区分),要么对码空间的作用成比例(等价错误)。
证明
充分性:Knill-Laflamme 条件保证 \(\{E_a P\}\) 将码空间映射到可区分的子空间。对 Hermite 矩阵 \(\alpha = (\alpha_{ab})\) 做酉对角化 \(\alpha = W D W^\dagger\),定义"标准错误" \(\tilde{E}_c = \sum_a W_{ac} E_a\)。则
即标准错误将码空间映射到两两正交的子空间。纠错操作 = 投影到错误子空间(识别哪个错误发生)+ 逆向旋转(恢复原始态)。
必要性:若可以纠错,存在恢复操作 \(\mathcal{R}\) 使得对码空间上任意 \(\rho\),\(\mathcal{R}(\sum_a E_a \rho E_a^\dagger) = \rho\)。设 \(\mathcal{R}\) 的 Kraus 算子为 \(\{R_l\}\)。对码空间的正交基向量 \(|\psi_i\rangle\) 和 \(|\psi_j\rangle\),恢复条件意味着 \(\langle\psi_i|E_a^\dagger E_b|\psi_j\rangle\) 不依赖于 \(i, j\)(当 \(i = j\))且当 \(i \ne j\) 时为零。\(\blacksquare\)
定义 28.13 (稳定子码与 CSS 码)
稳定子码由 \(n\) 比特 Pauli 群的一个 Abel 子群 \(\mathcal{S}\)(稳定子群)定义。码空间为
若 \(\mathcal{S}\) 由 \(n - k\) 个独立生成元生成,则 \(\dim \mathcal{C} = 2^k\)。
CSS 码(Calderbank-Shor-Steane)是一类特殊的稳定子码,由两个经典线性码 \(C_1 \supset C_2\) 构造,使得 \(X\) 错误和 \(Z\) 错误可以分别纠正。
例 28.7
Shor 9 比特码和 Steane 7 比特码。
Shor \([[9,1,3]]\) 码将 \(1\) 个逻辑比特编码为 \(9\) 个物理比特:
此码可纠正任意单比特错误。结构:外层 3 比特重复码纠正位翻转(\(X\))错误,内层 3 比特相位码纠正相位翻转(\(Z\))错误。
Steane \([[7,1,3]]\) 码是 CSS 码,基于经典 \([7,4,3]\) Hamming 码。由于 Hamming 码自对偶(\(C_2 = C_1^\perp \subset C_1\)),Steane 码仅用 \(7\) 个物理比特即可纠正任意单比特错误,比 Shor 码更紧凑。
验证 Knill-Laflamme 条件:对 Steane 码,任意两个权重 \(\le 1\) 的 Pauli 错误 \(E_a, E_b\),\(E_a^\dagger E_b\) 的权重 \(\le 2 < d = 3\),因此 \(P E_a^\dagger E_b P = \alpha_{ab} P\)。
例 28.8
稳定子码的结构。 5 比特码 \([[5,1,3]]\) 是最小的能纠正任意单比特错误的量子码。其稳定子群由以下 \(4 = n - k\) 个生成元生成:
码空间由所有满足 \(g_i|\psi\rangle = |\psi\rangle\)(\(i = 1, 2, 3, 4\))的态组成,维数 \(2^1 = 2\)。
码距 \(d = 3\):任何权重 \(\le 2\) 的 Pauli 算子要么在稳定子群中,要么与某个生成元反对易,因此可以被检测。5 比特码达到了量子 Singleton 界 \(n - k \ge 2(d-1)\),即 \(4 \ge 4\)。
28.8 量子信息中的矩阵不等式¶
核心工具:von Neumann 熵 \(S(\rho) = -\operatorname{tr}(\rho \log \rho)\) → 量子相对熵 → 强次可加性 → 数据处理不等式
链接:Ch18 矩阵不等式的量子信息推广
量子信息论中的核心不等式都可以表述为矩阵函数的不等式。
定义 28.14 (von Neumann 熵)
密度矩阵 \(\rho\) 的 von Neumann 熵定义为
其中 \(\{\lambda_i\}\) 为 \(\rho\) 的特征值,约定 \(0 \log 0 = 0\)。
- \(S(\rho) = 0\) 当且仅当 \(\rho\) 为纯态。
- \(S(\rho) \le \log d\)(\(d = \dim \mathcal{H}\)),等号当且仅当 \(\rho = I/d\)(最大混合态)。
定义 28.15 (量子相对熵)
两个密度矩阵 \(\rho\) 和 \(\sigma\) 之间的量子相对熵为
当 \(\ker(\sigma) \cap \operatorname{supp}(\rho) = \{0\}\) 时有限,否则定义为 \(+\infty\)。
定理 28.8 (强次可加性)
对三体系统 \(ABC\) 的任意密度矩阵 \(\rho_{ABC}\),von Neumann 熵满足强次可加性(strong subadditivity, SSA):
其中 \(\rho_{AB} = \operatorname{tr}_C(\rho_{ABC})\) 等为约化密度矩阵。
等价形式:
- 条件熵递减:\(S(A|BC) \le S(A|B)\),其中 \(S(A|B) = S(\rho_{AB}) - S(\rho_B)\)。
- 互信息非负:\(I(A:C|B) = S(A|B) - S(A|BC) \ge 0\)。
证明
强次可加性的标准证明使用 Lieb 凹性定理。定义映射 \(f(X) = \operatorname{tr}(\exp(\log M + \log X))\)(\(M\) 固定正定矩阵),Lieb 证明了 \(f\) 是凹函数。
另一种证明基于量子相对熵的单调性(数据处理不等式)。量子相对熵在量子信道(CPTP 映射)下单调递减:
取 \(\mathcal{E} = \operatorname{tr}_C\)(偏迹是 CPTP 映射),\(\rho = \rho_{ABC}\),\(\sigma = I_A \otimes \rho_{BC} / d_A\),代入并化简即可得到强次可加性。
具体地,\(S(\rho_{ABC} \| I_A/d_A \otimes \rho_{BC}) = \log d_A - S(A|BC)\) 和 \(S(\rho_{AB} \| I_A/d_A \otimes \rho_B) = \log d_A - S(A|B)\)。偏迹单调性给出 \(\log d_A - S(A|BC) \ge \log d_A - S(A|B)\),即 \(S(A|B) \ge S(A|BC)\),这就是强次可加性。\(\blacksquare\)
定理 28.9 (Klein 不等式与量子相对熵非负性)
对任意密度矩阵 \(\rho\) 和 \(\sigma\),
等号当且仅当 \(\rho = \sigma\)。
证明
这是 Klein 不等式的推论。Klein 不等式断言:对凸函数 \(f\) 和自伴算子 \(A, B\),
取 \(f(t) = t \log t\)(凸函数),\(A = \rho\),\(B = \sigma\),\(f'(t) = \log t + 1\)。则
展开并利用 \(\operatorname{tr}(\rho) = \operatorname{tr}(\sigma) = 1\):
等号条件由 \(f\) 的严格凸性给出:\(\rho = \sigma\)。\(\blacksquare\)
例 28.9
验证强次可加性:GHZ 态。 三比特 GHZ 态 \(|\text{GHZ}\rangle = \frac{1}{\sqrt{2}}(|000\rangle + |111\rangle)\)。
约化密度矩阵:
- \(\rho_{ABC} = |\text{GHZ}\rangle\langle\text{GHZ}|\)(纯态),\(S(\rho_{ABC}) = 0\)。
- \(\rho_{AB} = \frac{1}{2}(|00\rangle\langle 00| + |11\rangle\langle 11|)\),\(S(\rho_{AB}) = \log 2 = 1\)。
- \(\rho_{BC} = \frac{1}{2}(|00\rangle\langle 00| + |11\rangle\langle 11|)\),\(S(\rho_{BC}) = 1\)。
- \(\rho_B = \frac{I}{2}\),\(S(\rho_B) = 1\)。
SSA 验证:\(S(\rho_{ABC}) + S(\rho_B) = 0 + 1 = 1 \le S(\rho_{AB}) + S(\rho_{BC}) = 1 + 1 = 2\)。不等式成立。
条件互信息 \(I(A:C|B) = S(A|B) - S(A|BC) = (S(\rho_{AB}) - S(\rho_B)) - (S(\rho_{ABC}) - S(\rho_{BC})) = (1-1) - (0-1) = 1 \ge 0\)。
注
本章的线性代数工具贯穿了量子信息的各个领域:Hilbert 空间提供状态空间的框架(Ch8),酉矩阵描述量子演化(Ch7),SVD 给出 Schmidt 分解(Ch11),Kronecker 积描述多体系统(Ch19),正定矩阵理论刻画密度矩阵和 POVM(Ch16),矩阵不等式约束信息处理的极限(Ch18)。量子信息科学是线性代数最深刻、最活跃的应用领域之一。