跳转至

第 46A 章 算子单调函数

前置:正定矩阵 (Ch16) · 矩阵分析 (Ch14) · Löwner 偏序 (Ch16)

本章脉络:从标量单调到算子单调 \(\to\) 算子单调函数 (Operator Monotone) 的定义 \(\to\) 算子凸函数 (Operator Convex) \(\to\) 核心定理:Loewner 定理(解析延拓与 Pick 函数) \(\to\) 经典算子单调函数(平方根、对数) \(\to\) 反例:为什么 \(t^2\) 不是算子单调的? \(\to\) 算子不等式的传递性 \(\to\) 应用:量子信息理论(熵的凹性)、矩阵均值理论的基础、统计物理中的稳定性估计

延伸:算子单调性研究的是矩阵偏序关系在非线性映射下的保持性质;它是矩阵分析中最高深的课题之一,揭示了复平面解析性与矩阵代数序结构之间不可思议的统一性,是构造矩阵均值 (Ch46B) 的代数核心

在标量分析中,若 \(f(t)\) 是单调增加的且 \(a \ge b\),则 \(f(a) \ge f(b)\)。然而在矩阵世界中,这一直觉往往会失效。即使 \(A \succeq B \succeq 0\),并不一定意味着 \(A^2 \succeq B^2\)算子单调函数(Operator Monotone Functions)正是研究哪些特殊的非线性函数能够保持矩阵的 Löwner 偏序。本章将介绍由 Loewner 建立的这一优雅理论,揭示函数解析性如何支配矩阵的不等式。


46A.1 定义与核心分类

定义 46A.1 (算子单调函数)

定义在区间 \(I\) 上的函数 \(f\) 称为 算子单调的,如果对于任何特征值落在 \(I\) 内的 Hermite 矩阵 \(A, B\): $\(A \succeq B \Rightarrow f(A) \succeq f(B)\)$

定义 46A.2 (算子凸函数)

函数 \(f\) 称为 算子凸的,如果: $\(f(\lambda A + (1-\lambda)B) \preceq \lambda f(A) + (1-\lambda)f(B)\)$ 这要求函数对算子的混合作用始终“低于”函数值的混合。


46A.2 核心定理:Loewner 定理

定理 46A.1 (Loewner 定理)

函数 \(f\)\((a, b)\) 上是算子单调的,当且仅当它能解析延拓到复上半平面,且映射结果仍在上半平面(Pick 函数)。 意义:这一结论将代数性质(序保持)与解析几何性质(区域映射)完美绑定。


46A.3 经典实例与反例

例 46A.1 (经典算子单调函数)

  1. 幂函数\(f(t) = t^p\),当 \(0 \le p \le 1\) 时(如平方根 \(\sqrt{t}\))是算子单调的。
  2. 对数函数\(f(t) = \ln t\) 是算子单调的。
  3. 分式线性变换\(f(t) = -1/t\) 在正半轴上是算子单调的。

反例:\(t^2\) 的失效

即使 \(A \succeq B \succeq 0\),通常 \(A^2 \nsucceq B^2\)。这意味着平方运算会“扭曲”原有的序结构。


练习题

1. [基础] 若 \(A = \begin{pmatrix} 2 & 0 \\ 0 & 1 \end{pmatrix}, B = \begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix}\),验证 \(A^2 \succeq B^2\) 是否成立。

参考答案

计算: 1. \(A \succeq B \iff A-B = \begin{pmatrix} 1 & 0 \\ 0 & 0 \end{pmatrix} \succeq 0\)。成立。 2. \(A^2 = \begin{pmatrix} 4 & 0 \\ 0 & 1 \end{pmatrix}, B^2 = \begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix}\)。 3. \(A^2 - B^2 = \begin{pmatrix} 3 & 0 \\ 0 & 0 \end{pmatrix} \succeq 0\)结论:在此特定(对角)情况下成立。但注意:对于非对角阵,这并不总是成立。

2. [反例] 举出一个例子说明 \(A \succeq B \ge 0\)\(A^2 \nsucceq B^2\)

参考答案

构造:\(B = \begin{pmatrix} 1 & 1 \\ 1 & 1 \end{pmatrix}\)\(A = B + \begin{pmatrix} \epsilon & 0 \\ 0 & 0 \end{pmatrix}\)。 在交叉项的影响下,\(A^2 - B^2\) 可能会出现负特征值。这证明了 \(f(t)=t^2\) 在算子意义下不是单调的。

3. [性质] 证明:若 \(f\) 是算子单调的,则 \(f\) 必是标量单调的。

参考答案

证明: 1. 取 \(1 \times 1\) 矩阵(即标量) \(a, b\)。 2. 算子单调定义要求 \(a \ge b \Rightarrow f(a) \ge f(b)\)。 3. 这恰好是标量单调增加的定义。 结论:算子单调性是比标量单调性强得多的限制。

4. [平方根] 证明:若 \(A \succeq B \succeq 0\),则 \(\sqrt{A} \succeq \sqrt{B}\)

参考答案

理由: 由于 \(f(t) = t^{1/2}\)\([0, \infty)\) 上满足 Loewner 定理(它的解析分支映射上半平面到上半平面),它是算子单调函数。因此平方根运算能够保持矩阵的偏序关系。

5. [逆算子] 证明 \(f(t) = -1/t\)\((0, \infty)\) 上是算子单调的。

参考答案

证明: 1. 设 \(A \succeq B \succ 0\)。 2. 根据矩阵偏序性质(见 Ch16),求逆会反转号:\(B^{-1} \succeq A^{-1}\)。 3. 乘上负号再次反转:\(-A^{-1} \succeq -B^{-1}\)。 4. 即 \(f(A) \succeq f(B)\)

6. [算子凸] 若 \(f(t) = t^2\) 是算子凸的吗?

参考答案

是的。 证明思路:展开 \((\lambda A + (1-\lambda)B)^2\) 并利用 \(A^2, B^2\) 项。中间项 \(AB+BA\) 总是被 \(A^2+B^2\) 的某种组合控制。这说明虽然 \(t^2\) 不保持顺序,但它保持了“凸性”。

7. [应用] 为什么量子熵的凹性与算子单调函数有关?

参考答案

量子相对熵涉及 \(f(t) = \ln t\)\(f(t) = t \ln t\) 的计算。由于 \(\ln t\) 是算子单调的(且 \(t \ln t\) 是算子凸的),这些代数性质直接保证了信息量在混合态下不会凭空增加,确保了热力学第二定律在量子层面的相容性。

8. [计算] 计算 \(f(A)\),其中 \(f(t) = \sqrt{t}\)\(A = \begin{pmatrix} 5 & 4 \\ 4 & 5 \end{pmatrix}\)

参考答案

步骤: 1. 特征分解:特征值为 9(对应 \((1,1)\))和 1(对应 \((1,-1)\))。 2. 对特征值开方:\(\sqrt{9}=3, \sqrt{1}=1\)。 3. 重构矩阵:\(\sqrt{A} = \frac{1}{2} \begin{pmatrix} 1 & 1 \\ 1 & -1 \end{pmatrix} \begin{pmatrix} 3 & 0 \\ 0 & 1 \end{pmatrix} \begin{pmatrix} 1 & 1 \\ 1 & -1 \end{pmatrix} = \begin{pmatrix} 2 & 1 \\ 1 & 2 \end{pmatrix}\)

9. [传递性] 若 \(f, g\) 都是算子单调的,其复合函数 \(f \circ g\) 也是吗?

参考答案

是的。\(A \succeq B\),由 \(g\) 的单调性 \(g(A) \succeq g(B)\)。再由 \(f\) 的单调性,\(f(g(A)) \succeq f(g(B))\)。结论成立。

10. [极限] 随着 \(p \to 0\),幂函数 \(f(t) = (t^p - 1)/p\) 趋于什么?其算子性质如何?

参考答案

结论: 趋于 \(\ln t\)。 由于对每个 \(p \in (0, 1)\)\((t^p-1)/p\) 都是算子单调的,作为极限的 \(\ln t\) 也继承了这一性质。这展示了算子单调函数簇的闭合性。

本章小结

算子单调函数是矩阵分析中最严苛的“秩序维护者”:

  1. 偏序的守卫:它界定了哪些非线性变换能够尊重矩阵空间的 Loewner 序结构,过滤掉了像“平方”这样看似简单但在高维空间具有破坏性的函数。
  2. 解析的纽带:Loewner 定理揭示了实数轴上的矩阵不等式与复平面上的 Pick 解析函数之间的深度对应,是数学中跨领域统一的范例。
  3. 物理的根基:作为对数、幂函数等核心算子的属性,算子单调性为量子信息熵的性质、算子均值定义的合法性以及系统稳定性提供了终极的代数保障。