准希尔伯特空间

本章中我们以二次型和双线性型为基础研究准希尔伯特空间，即带有内积算子的线性空间。这个空间有时也被称为内积空间。

基本定义

若$\varphi$为实线性空间$E$上的一个正定对称双线性型，那么$\varphi$可称为$E$的一个内积，记为$(\cdot \; | \; \cdot)$或$\langle \cdot \; | \; \cdot \rangle$。这个实线性空间和其内积一起，合称为（实）准希尔伯特空间。

在准希尔伯特空间上，两个重要的不等式总是成立：

柯西-施瓦茨不等式： $(x | y)^2 \le (x | x) \cdot (y | y)$
闵可夫斯基不等式（三角不等式）： $\sqrt{(x+y | x+y)} \le \sqrt{(x | x)} + \sqrt{(y | y)}$

这两个命题的证明在此前已经出现过了。

范数

接下来我们关注有限维实数向量空间。

我们定义，一个函数$N : E \to \mathbb R_+$若满足：
1）分离性： $N(x) = 0 \implies x = 0$ 2）正齐次性： $N(\lambda x) = | \lambda | N(x)$ 3）三角不等式： $N(x + y) \le N(x) + N(y)$ 那么就称它为$E$的一个范数。

若$N$为有限维实向量空间$E$的一个范数，那么和这个范数相关的距离定义为： $\begin{array}{cccc} d: & E^2 & \to & \mathbb R_+ \\ & (x, y) & \mapsto & N(y - x) \end{array}$

任何一个范数的距离满足以下三条性质：

$d(x,y) = 0 \iff x = y$
$d(x,y) = d(y,x)$
$d(x,z) \le d(x,y) + d(y,z)$

这些性质都非常显然。

欧氏范数

记$E$为一实准希尔伯特空间，$(\cdot \; | \; \cdot)$为其上的内积，那么函数： $\begin{array}{cccc} N: & E & \to & \mathbb R_+ \\ & x & \mapsto & \sqrt{(x | x)} \end{array}$ 是一个范数，称为欧几里得范数，简称欧氏范数。

容易验证这个映射满足所有范数的公理。

欧氏范数满足以下四个等式： $\begin{aligned} \Vert x + y \Vert^2 &= \Vert x \Vert^2 + \Vert y \Vert^2 + 2 (x | y) \\ \Vert x - y \Vert^2 &= \Vert x \Vert^2 + \Vert y \Vert^2 - 2 (x | y) \\ \Vert x + y \Vert^2 - \Vert x - y \Vert^2 &= 4 (x | y) \\ \Vert x + y \Vert^2 + \Vert x - y \Vert^2 &= 2( \Vert x \Vert^2 + \Vert y \Vert^2) \\ \end{aligned}$ 最后一个等式叫做平行四边形等式。

这些等式都很容易由计算验证。

（极化恒等式）任何一个满足平行四边形等式的范数$N$都有一个对应的内积： $(x, y) \mapsto \frac{1}{2} \left(N^2(x+y) - N^2(x) - N^2(y) \right)$

正交性

接下来我们回到对一般的实空间的研究。

若准希尔伯特空间中的两个向量的内积为零，则称这两个向量为正交的。

这个正交定义是对一般的平面几何中的垂直的推广。

记$(f|g) = \int_0^{2\pi} f \cdot g$，那么$e_n = \cos nx$和$f_m = \sin mx$是正交的。这个正交性是傅里叶分析的基础。

（勾股定理）若两个向量$u,v$正交，那么有： $\Vert u + v \Vert^2 = \Vert u \Vert^2 + \Vert v \Vert^2$

\[\begin{aligned} \Vert u + v \Vert^2 &= \Vert u \Vert^2 + \Vert v \Vert^2 + 2 (u | v) \\ &= \Vert u \Vert^2 + \Vert v \Vert^2 \end{aligned}\]

正交子空间

设$E$为一准希尔伯特空间，内积为$(\cdot \;|\; \cdot)$，$x \in E$。 $x$的正交子空间，记为$x^\perp$，表示： $x^\perp = \{ y \in E \;|\; y \perp x \} = \{ y \in E \;|\; (x|y) = 0 \}$ 同理，设$A$，为$E$中一个子集（可以不是子空间），则$A^\perp$表示： $A^\perp = \{ y \in E \;|\; \forall x \in A, x \perp y \}$ 单个向量或一个子集的正交子空间是一个子空间。

设$\varphi_x: y \mapsto (x|y)$，不难验证这个映射是线性的，因此$x^\perp$是其核空间，从而是一个子空间。 $A^\perp$可以视作所有元素的正交子空间的交集，因此也是一个子空间。

正交子空间的性质

正交子空间具有以下这些性质。

$E^\perp = \{ 0 \}$，$0^\perp = E$
$A \subset B \implies B^\perp \subset A^\perp$
$F = \mathrm{Vect}(\mathcal G) \implies F^\perp = \mathcal G^\perp$
$A \subset (A^\perp)^\perp$
若$F$为$E$的子空间，那么$F \oplus F^\perp$
若$F,G$为$E$的两个子空间，那么$(F+G)^\perp = F^\perp \cap G^\perp$，$F^\perp + G^\perp \subset (F \cap G)^\perp$

前几点比较显然，此处只证明第六点。设$x \in (F+G)^\perp$，那么$\forall x_F \in F \subset F+G$，因此$x \perp x_F$，同理可得$x \perp x_G$，因此 $x \in F^\perp \wedge x \in G^\perp \implies x \in F^\perp \cap G^\perp \implies (F+G)^\perp \subset F^\perp \cap G^\perp$ 反之，设$x \in F^\perp \cap G^\perp$，那么$\forall x_F \in F, x_G \in G$： $(x | x_F + x_G) = (x | x_F) + (x | x_G) = 0$ 从而$x \in (F+G)^\perp$。因此$(F+G)^\perp \supset F^\perp \cap G^\perp$。因此$(F+G)^\perp = F^\perp \cap G^\perp$。对后者，不难发现$F \cap G \subset F$，$F \cap G \subset G$，从而 $F^\perp \subset (F \cap G)^\perp$，$G^\perp \subset (F \cap G)^\perp$，从而 $F^\perp + G^\perp \subset (F \cap G)^\perp$。

注意到第四点和第六点中是包含而非等于，且第五点中的直和不一定等于全空间。我们接下来将会看到对有限维空间的特殊情况。

子空间的正交

对两个子空间$F,G$，称其为正交的，若从中任取两个向量都是正交的： $\forall x \in F, y \in G, \; x \perp y$ 对于有限维的子空间，这相当于限定两个子空间的所有基底都是两两正交的。

若两个子空间$F,G$是正交的，那么： $F \subset G^\perp ,\; G \subset F^\perp \text{且} F \cap G = \{ 0 \}$ 反之，若$F \subset G^\perp$或$G \subset F^\perp$，那么这两个子空间是正交的。

关于集合包含关系的四个命题容易根据定义证明，实际上，两个子空间正交当且仅当一个子空间在另一个的正交子空间之中。最后不难发现：$F \cap G \subseteq F \cap F^\perp = \{ 0 \}$。

正交向量组

一组向量$(x_i)$是正交的，若其中的向量两两正交；是标准正交的，若满足： $\forall i,j, \; (x_i | x_j) = \delta_{i,j}$ $\delta$为克罗内克符号。

所有不含零向量的正交向量组$(x_i)$是线性无关的。

根据线性无关的定义，设$\exists (\lambda_i)$满足$\sum \lambda_i x_i = 0$。 $\forall k \quad (\sum \lambda_i x_i | x_k) = \lambda_k \Vert x_k \Vert^2 = 0$ 从而$(\lambda_i) = 0$，因此线性无关。

根据这一命题，不难发现，任何$n$维的欧氏空间（即有限维的内积空间）中的一组$n$个向量是标准正交基底，当且仅当其标准正交。

设$(x_i)$为一组正交的向量，那么： $\left\Vert \sum x_i^2 \right\Vert = \sum \Vert x_i \Vert^2$

这一命题不难由计算验证。

我们之前提到过，一个子空间与其正交子空间构成直和，但是和空间不一定是全空间。对有限维的内积空间，我们有：

有限维的正交

设$E$为一$n$维欧氏空间，且$F \subset E$为一个子空间，那么 $F \oplus F^\perp = E$ 称$F^\perp$为$F$的正交补空间。

若$F$为$E$的平凡子空间则显然，现在不妨设$\dim F = p \in [\![ 1, n-1 ]\!]$。记： $\begin{array}{cccc} f: & E & \to & \mathbb R^+ \\ & x & \mapsto & \left( (x_1 | f_1), \cdots, (x_p | f_p) \right) \end{array}$ 其中$(f_1, \dots, f_p)$是$F$的一组基底。不难验证这是良定义的线性变换，且$\ker f = F^\perp$。根据秩-零化度定理，有：$\dim F = n = \dim \ker f + \mathrm{rank}(f)$。我们又知道$\mathrm{rank}(f) \le p$，从而有$\dim F^\perp \ge n - p$。因此$\dim F^\perp + \dim F \ge \dim E$。又显然$\dim F^\perp + \dim F \le \dim E$，因为两者都是$E$的子空间，从而有： $\dim F^\perp + \dim F = \dim E$ 又两者构成直和，因此其直和一定为全空间。

在欧几里得空间中，有： $\begin{aligned} \dim F^\perp &= \dim E - \dim F \\ (F^\perp)^\perp &= F \\ \dim (F^\perp)^\perp &= \dim F \end{aligned}$

正如此前所述，这些关系仅在有限维空间成立。

正交投影

设$E$为一任意维准希尔伯特空间，而$F$为其中一个子空间，满足$F \oplus F^\perp = E$，那么平行于$F^\perp$向$F$的投影称为$F$的正交投影，记作$p_F$。

不难验证正交投影是唯一的。正交投影是唯一一个满足： $\forall x \in E, \quad \left\{ \begin{aligned} p_F \in F \\ x - p_F \in F^\perp \end{aligned} \right.$ 的线性变换。

对无限维空间，不是所有子空间都满足直和关系，因此不是所有子空间都有正交投影。

投影算子

准希尔伯特空间中直线$u$的投影算子定义为： $\begin{array}{cccc} \mathrm{Proj}: & E \times E & \to & E \\ & (u,v) & \mapsto & \mathrm{Proj}_u(v) = \frac{(u|v)}{(u|u)} u \end{array}$ 规定若$u=0$，那么其投影算子为零映射。

不难验证若$u \neq 0$，那么其投影算子为向$\mathbb K_u$的正交投影。

设$E$为一任意维数的准希尔伯特空间，$F$为一个有限维子空间，其一组正交基底为$(e_1, \dots, e_p)$。 $F$的正交投影是良定义的，且： $\forall x \in E, \quad p_F = \sum_{i = 1}^p \mathrm{Proj}_{e_i} x$ 更进一步地，若这组基底是标准正交的，那么： $p_F = \sum_{i = 1}^p (x | e_i) e_i$

$\begin{aligned} \forall k, \; (e_k | x - p_F(x)) &= (e_k | x - \sum_{i = 1}^p \frac{(e_i|x)}{(e_i|e_i)} e_i) \\ &= (e_k | x) - (e_k | \frac{(e_k | x)}{(e_k | e_k)} e_k) = 0 \end{aligned}$ 从而$x - p_F(x) \in F^\perp$。不难验证$p_F(x) \in F$，因此$F \oplus F^\perp = E$，从而正交投影是良定义的。最后容易验证其确实是向$F$平行于$F^\perp$的投影变换，因为其在$F$上恒等且$x - p_F(x) \in F^\perp$。

我们间接证明了只要子空间是有限维的，尽管全空间是无穷维的，这个直和关系依然成立。

施密特正交化

设$E$为一$n$维欧氏空间，那么其上的任何一个基底$(f_i)$都有至少一个正交标准基底$(e_i)$与其对应，且满足： $\forall i \in [\![ 1,n ]\!], \; \mathrm{Span}(f_1, \dots, f_i) = \mathrm{Span}(e_1, \dots, e_i)$ 若我们限定$(f_i | e_i) > 0$那么这组正交标准基底是唯一的。

我们用格拉姆-施密特算法来求解这组基底： $\begin{array}{cccccc} g_1 &=& f_1 & e_1 &=& \frac{g_1}{\Vert g_1 \Vert} \\ g_2 &=& f_2 - p_{F_1}(f_2) & e_2 &=& \frac{g_2}{\Vert g_2 \Vert} \\ g_3 &=& f_3 - p_{F_2}(f_3) & e_3 &=& \frac{g_3}{\Vert g_3 \Vert} \\ \vdots && \vdots & \vdots && \vdots \\ g_n &=& f_n - p_{F_{n-1}}(f_n) & e_n &=& \frac{g_n}{\Vert g_n \Vert} \end{array}$ 其中$F_i$表示前$i$个向量$f_i$构成的子空间。

根据生成这组基底的方法，我们容易看出，从基底$(f_i)$到$(e_i)$的过渡矩阵为一个上三角矩阵，这个结论在QR分解之中会被用到。

最后我们总结一下有限维下关于标准正交基底的命题：

所有有限的正交向量都可以补充成一组正交基底；
所有有限的标准正交向量都可以补充成一组标准正交基底；
特别地，只要$E$不为零空间，就一定存在标准正交基底。

有限维子空间的正交投影

设$p$为$E$上的一个投影，这个投影是正交的，当且仅当 $\forall x \in E, \; \Vert p(x) \Vert \le \Vert x \Vert$

左推右是显然的： $\Vert x \Vert^2 = \Vert x_F \Vert^2 + \Vert x_{F^\perp} \Vert^2 \ge \Vert x_F \Vert^2 = \Vert p_F (x) \Vert^2$ 考虑左推右，我们设$F = \mathrm{Im} p$、$G = \ker p$，则由投影的性质可知$F \oplus G = E$，我们只需要证明两者正交即可。 $\begin{aligned} \Vert p(x_F + \lambda x_G) \Vert^2 &= \Vert x_F \Vert^2 \\ &\le \Vert x_F + \lambda x_G \Vert^2 \\ &\le \Vert x_F \Vert^2 + 2 \lambda (x_F | x_G) + \lambda^2 \Vert x_G \Vert^2\\ \implies & 2 \lambda (x_F | x_G) + \lambda^2 \Vert x_G \Vert^2 \ge 0 \end{aligned}$ 这个二次函数大于等于零，因此其判别式小于等于零，从而我们得出$(x_F | x_G) = 0$，因此两个空间正交。

（贝塞尔不等式）设$E$为一准希尔伯特空间，$(e_i), i \in I$为一组标准正交向量（不一定是基底，不一定有限），那么 $\forall f \in E, \; \sum_{i \in I} (f | e_i)^2 \le \Vert f \Vert^2$

设$\alpha_1, \dots, \alpha_r$为$I$的一个有限子集，那么 $\sum_{i=1}^r (f | e_{\alpha_i})^2 = \Vert p(f) \Vert^2 \le \Vert f \Vert^2$ 其中$p$是向空间$\mathrm{Vect}(e_{\alpha_i})$的正交投影。从而这个数列是随着$r$升高而单调有界，从而收敛，并小于$\Vert f \Vert^2$。

设$\mathcal B = (e_1, \dots, e_n)$为欧几里得空间$E$的一个标准正交基底，那么空间中的所有向量都可以写为： $\forall x \in E ,\; x = \sum_{i=1}^n (x | e_i) e_i$

这个命题比较显然，只需要把向量向所有标准正交基底投影即可。

任何两个标准正交基底之间的过渡矩阵满足： $P_{\mathcal B \to \mathcal B^\prime}^{-1} = P_{\mathcal B^\prime \to \mathcal B} = P_{\mathcal B \to \mathcal B^\prime}^\top$ 满足自己的逆和转置相同的矩阵称为正交矩阵。

简记$P = P_{\mathcal B \to \mathcal B^\prime}$。 $P^\top P = (a_{i,j}) = C_i^\top C_j = (C_i | C_j)$ 其中$C_i$表示矩阵$P$的第$i$列，也就是$\mathcal B^\prime$的第$i$个向量在$\mathcal B$下的坐标。那么$a_{i,j} = (e_i^\prime | e_j^\prime) = \delta_{i,j}$当且仅当$\mathcal B^\prime$标准正交，从而若标准正交，则转置的矩阵与原矩阵的积为单位阵，从而互为逆。

子空间的距离

设$X$为希尔伯特空间$E$的一个非空子集，那么从向量$u$到$X$的距离定义为： $\mathrm{d} (u,X) = \inf_{v \in X} \Vert u - v \Vert$

设$F$为$E$中一个子空间，满足$F \oplus F^\perp = E$，那么从$u$到该子空间$F$的距离在$v = p_F(u)$处唯一地取得： $\exists ! v = p_F(u), \; \mathrm{d}(u,F) = \mathrm{d}(u,v) = \Vert u - v \Vert$

$\begin{aligned} \Vert u - v \Vert^2 &= \Vert u - p_F(u) + p_F(u) - v \Vert^2 \\ &= \Vert u - p_F(u) \Vert^2 + \Vert p_F(u) - v \Vert^2 \\ &\ge \Vert u - p_F(u) \Vert^2 \end{aligned}$ 当且仅当$p_F(u) = v$时可以取等。

但若子空间的正交补不存在，那么距离可能不能在正交投影处取得。

计算距离

设$F$为欧几里得空间$E$的一个子空间，从而设$\mathcal B = (f_1, \dots, f_p)$为$F$的一组基底，$\mathcal C = (g_1, \dots, g_q)$为$F^\perp$的一组基底。我们提出几种计算距离的方法。

若$\mathcal B$为一组正交的基底，那么$p_F(x)$可以非常容易地求出；
若$\mathcal B$不是正交的基底，那么我们可以使用施密特正交化将其化为正交的基底；
若$\mathcal B$不是正交的基底，且正交化计算量过大，那么我们可以直接设$p_F = a_1 f_1 + \cdots + a_n f_n$然后解方程： $\left\{ \begin{aligned} (x - p_F(x) | f_1) &= 0 \\ \vdots \\ (x - p_F(x) | f_n) &= 0 \end{aligned} \right.$ 得出投影算子之后再求距离。
除此之外，我们不难发现$\mathrm{d}(x, F) = \Vert p_{F^\perp}(x) \Vert$，从而我们可以直接在其正交补空间中求解其距离。

利用这一性质，我们可以计算线性空间中的最小值问题。

求$(2x+y-1)^2 + (x-3y)^2 + (y-1)^2$的最小值。
注意到这个式子可以改写为： $\Vert x (2,1,0)^\top + y (1,-3,1)^\top - (1,0,1)^\top \Vert^2$ 因此我们可以认为这是从$(1,0,1)^\top$到$\mathrm{Span}((2,1,0)^\top, (1,-3,1)^\top)$的距离的最小值。考虑到距离的最小值总是在正交投影处取得，可以利用正交投影计算其值。

线性函数

本节中，我们总是假设$E$为一欧氏空间。

对所有的非空向量$a$，$a^\perp$为一超平面；设$H$为一超平面，则任何一个与其正交的向量称为其法向量。

设$f$为$E$的一个线性函数，那么存在唯一的向量$a$，满足： $\forall x \in E,\; f(x) = (a | x)$

若$f = 0$，那么取$a = 0$即可。现在设$f \neq 0$，那么其核空间总是一个超平面，记为$H$，从而存在一个单位长度的法向量，记为$n$，我们接下来验证$a = \lambda n$，其中$\lambda = f(n)$。设$x = x^\prime + \alpha n$，其中$x^\prime \in \ker f$。那么 $\begin{aligned} f(x) = f(x^\prime) + \alpha f(n) = \alpha f(n) \\ (a|x) = (f(n)n | x^\prime) + \alpha (f(n)n | n) = \alpha f(n) \end{aligned}$ 最后验证其唯一性。首先注意到$\forall x \in H, (a|x) = f(x) = 0$，从而$a$一定与$n$共线。然后注意到若存在两个不同的$a$，那么一定有$(a^\prime - a | x) = 0$，从而$a^\prime = a$。

高维向量的外积

利用此前提到的性质，我们可以定义高维空间中向量的外积（叉乘）。

设$E$为一$n$维欧几里得空间，一组$n-1$个向量$(a_1, \dots, a_{n-1})$的外积由以下方法定义： $\forall x \in E, \det (a_1, \cdots, a_{n-1}, x) = (a | x)$ 行列式对任何一个元素都是线性的，从而存在一个向量时其可以表示为内积的形式，那么这个向量就是这些向量的外积，记为： $a = a_1 \wedge \cdots \wedge a_{n-1}$

不难验证这个定义与三维空间的定义是自洽的。

$a_1 \wedge \cdots \wedge a_{n-1}$与$a_1, \dots, a_{n-1}$正交，且： $\det (a_1, \cdots, a_{n-1}, a_1 \wedge \cdots \wedge a_{n-1}) = 0$

QR分解

任何一个可逆的矩阵都可以分解成一个正交矩阵$Q$和上三角矩阵$R$之积。

这是我们学习的第五个矩阵分解算法，前四个分别为LU分解（即高斯消元）、特征值分解（也称谱分解）、若尔当-谢瓦莱分解和若尔当标准型分解。

我们可以这样理解这个分解方法：若矩阵可逆（即满秩），那么它的列向量一定组成一个基底，记为$\mathcal A$。我们设空间的典范标准基底为$\mathcal C$，基底通过施密特正交化取得的对应的正交标准基底为$\mathcal B$，那么这个分解相当于： $P_{\mathcal C \to \mathcal A} = P_{\mathcal C \to \mathcal B} P_{\mathcal B \to \mathcal A}$ 注意到任何两个正交标准基底之间的过渡矩阵为一个正交矩阵，因此$P_{\mathcal C \to \mathcal B}$是一个正交矩阵。由于$\mathcal B$是通过施密特正交化获得的，因此$P_{\mathcal B \to \mathcal A}$正是一个上三角矩阵。

设$A = (a_1 | \cdots | a_n)$，$(q_1, \dots, q_n)$为$\mathrm{Im} A$的一个标准正交基底，利用施密特正交化计算$q_i$： $\begin{array}{cclccl} q_1 &=& \frac{a_1}{v_1} & v_1 &=& \Vert a_1 \Vert \\ \vdots &&& \vdots \\ q_k &=& \frac{a_k - \sum_{i=1}^{k-1} (q_i | a_k) q_i }{v_k} & v_k &=& \Vert a_k - \sum_{i=1}^{k-1} (q_i | a_k) q_i \Vert \end{array}$ 从而 $\begin{aligned} a_1 &= v_1 q_1 \\ a_k &= (q_1 | a_k) q_1 + \cdots + (q_{k-1}|a_k)q_{k-1} + v_k q_k \end{aligned}$ 那么有： $(a_1 | \cdots | a_n) = (q_1 | \cdots | q_n) \begin{pmatrix} v_1 & (q_1|a_2) & (q_1|a_3) & \cdots & (q_1|a_n) \\ 0 & v_2 & (q_2|a_3) & \cdots & (q_2|a_n) \\ 0 & 0 & v_3 & \cdots & (q_3|a_n) \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & 0 & \cdots & v_n \end{pmatrix}$

注意到 $(q_1 | \cdots | q_n)^\top \cdot (a_1 | \cdots | a_n) = \begin{pmatrix} v_1 & (q_1|a_2) & (q_1|a_3) & \cdots & (q_1|a_n) \\ 0 & v_2 & (q_2|a_3) & \cdots & (q_2|a_n) \\ 0 & 0 & v_3 & \cdots & (q_3|a_n) \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & 0 & \cdots & v_n \end{pmatrix}$ 我们有$v_k = (q_k | a_k)$。

Twitter Facebook LinkedIn

mmmhj2