最后更新: 2024-09-06 19:05 查看: 372 次反馈刷题

二次型合同对角化的几何意义

## 二次型合同对角化的几何意义

二次型对角化就是把二次型化简成标准形或规范形, 或者说把二次型度量矩阵化成对角矩阵, 这就是二次型的对角化问题。

对角化二次型必须要是矩阵的合同变换, 或者说度量矩阵和变换后的度量矩阵 (对角阵)必须是合同的。因为只有这样才能使二次型的函数值保持不变, 才能使向量长度保持不变。其他方法比如矩阵的相似对角化法能使矩阵对角化, 但这与二次型度量矩阵的对角化不是一回事,相似对角化法不能保证二次型的值不变。

从几何意义上讲, 相似对角化法是使矩阵本身所表示的某种线性变换不变进而对角化, 而二次型对角化法是保证矩阵背后所代表二次型的值不变。它们所要求的不变量是不同的。
什么样的合同变换可以保证二次型的值不变呢? 其实这是一个简单的变量替换过程:

对于一个二次型:

$$
f(x)=x^{\mathrm{T}} A x
$$

有一个向量替换关系 $\boldsymbol{x}=\boldsymbol{C} \boldsymbol{y}$, 把它带入式 (7-4), 则函数值不变, 得到

$$
f(\boldsymbol{x})=\boldsymbol{x}^{\mathrm{T}} \boldsymbol{A} \boldsymbol{x}=(\boldsymbol{C} \boldsymbol{y})^{\mathrm{T}} \boldsymbol{A C} \boldsymbol{y}=\boldsymbol{y}^{\mathrm{T}} \boldsymbol{C}^{\mathrm{T}} \boldsymbol{A C y}=\boldsymbol{y}^{\mathrm{T}}\left(\boldsymbol{C}^{\mathrm{T}} \boldsymbol{A C}\right) \boldsymbol{y}
$$

式 (7-5) 最后的表达式中的度量矩阵是 $\boldsymbol{C}^{\mathrm{T}} \boldsymbol{A C}$, 这正是一个合同变换。
确实是矩阵的 “合同” 变换, 对矩阵 $\boldsymbol{A}$ 的左、右同时变换 (左乘 $\boldsymbol{C}^{\mathrm{T}}$ 和右乘 $\boldsymbol{C}$ ), 行和列的变换 “合同” 进行。
简单的变向量替换实际上就是基坐标系的变换:
基变了, 原来向量的坐标系当然变了, 即 $\boldsymbol{x} \rightarrow \boldsymbol{y}$, 这时如果仍然保持二次型值不变的话只能把原度量矩阵变成一个新的度量矩阵 $\boldsymbol{A} \rightarrow \boldsymbol{C}^{\mathrm{T}} \boldsymbol{A C}$ 。
和广义内积的度量矩阵是一样的, 选不同的基, 二次型度量矩阵就不同, 二次型的表达式
也就不同, 但二次型的值在不同基下是不变的。因此, 选何种基的问题就变成了对度量矩阵进行何种变换的问题, 二次型的化简就成了度量矩阵的对角化问题。
如果新的度量矩阵是一个对角矩阵 $\boldsymbol{C}^{\top} \boldsymbol{A C}=\boldsymbol{\Lambda}$, 我们就说把二次型合同对角化了。
合同变化的方法有多种, 比如正交变换、配方法、行列初等变换法等。
要选择什么样的合同变换对矩阵 $\boldsymbol{A}$ 进行对角化呢? 这与你应用目的有关系。
常见的二次型的应用主要有两类, 一类是与二次曲面相关的, 一类是与多元函数的极值有关的。比如, 在低维空间里如果要看这个几何图形是个什么二次曲线或二次曲面的话, 就只能对矩阵 $\boldsymbol{A}$ 进行正交变换, 即通过旋转或镜像变换来保持原几何图形不变形; 将这个二次型通过正交变换化成标准形, 然后通过这个标准形判断二次型代表何种曲面。主轴定理告诉我们, 标准形的参数就是二次型的矩阵的特征值。所以, 根据特征值的符号或者根据惯性定理就能确定或判断曲面的类型。

如果要判断这个函数是不是在任意变量下都是正值或是负值的情况或者求这个函数的极值,就可以使用其他的可逆变换对矩阵 $\boldsymbol{A}$ 进行各种合同变换, 比如初等变换、配方法等。这些变换在背景坐标系下看起来可能会改变图形的形状, 比如把一个球变成一个粗球, 但变换后的图形该凸的还是凸、该凹的还是凹，(复）向量的长度平方该正值仍正值、该负值还负值。
7. 3. 1 二次型对角化之正交变换

我们把二次型变换成标准形时, 要求的是合同变换, 而一般来说没有现成的方法可以直接求合同变换。但我们发现二次型对应的是一个实对称矩阵, 而实对称矩阵是一定可以通过相似变换为对角阵的, 更重要的是在实对称情况下, 这种相似变换还可以是正交的, 这时候相似变换就成了合同变换了。所以我们是用正交的相似变换代替了合同变换来求二次型的标准形的。因此, 正交变换既是相似变换同时又是合同变换。
对于一个正交矩阵 $\boldsymbol{Q}$, 因为 $\boldsymbol{Q}^{\mathrm{T}} \boldsymbol{Q}=\boldsymbol{E}$, 所以有 $\boldsymbol{Q}^{\mathrm{T}}=\boldsymbol{Q}^{-1}$ 。如果用正交矩阵进行合同变换,
那么有向量替换关系 $x=Q y$ 使

$$
f(x)=x^{\mathrm{T}} A \boldsymbol{x}=\boldsymbol{y}^{\mathrm{T}}\left(Q^{\mathrm{T}} A Q\right) y=\boldsymbol{y}^{\mathrm{T}}\left(Q^{-1} A Q\right) y
$$

因此, 正交变换既是相似变换同时又是合同变换。
由于正交变换保持变换前后的向量内积不变, 从而保持向量的长度与夹角不变, 所以正交变换属于刚体变换, 是代表空间的一个旋转/镜像变换。利用矩阵乘积分解的方法, 这种变换的转轴、转角可以用矩阵的特征参数量化地表示出来。

和其他合同变换 (又称为可逆线性替换) 不保持图形的 “形状”, 如可以把祁圆变成圆的特点相比, 正交变换则保持原图形的 “形状”。
例如, 椭球面的方程为

$$
\frac{x^2}{1}+\frac{y^2}{4}+\frac{z^2}{9}=1
$$

将其通过可逆线性替换 $\left(\begin{array}{l}x \\ y \\ z\end{array}\right)=\left(\begin{array}{ll}1 & \\ & 2 \\ & 3\end{array}\right)\left(\begin{array}{l}x^{\prime} \\ y^{\prime} \\ z^{\prime}\end{array}\right)$ 化为 $x^{\prime 2}+y^{\prime 2}+z^{\prime 2}=1$, 即椭球面变成了球面, 不保持图形的 “形状”。

椭球面方程也通过不可逆线性变换 $\left(\begin{array}{l}x \\ y \\ z\end{array}\right)=\left(\begin{array}{rr}1 & \\ & 2 \\ & 0\end{array}\right)\left(\begin{array}{l}x^{\prime} \\ y^{\prime} \\ z^{\prime}\end{array}\right)$ 化为 $x^{\prime 2}+y^{\prime 2}=1$, 即椭球面变成了圆柱面, 也不保持图形的 “形状”。

而正交变换保持向量长度和角度不变, 因此几何图形不变。所以在讨论二次方程决定的图形时, 必须用正交变换; 如果只考虑它所属的类型, 则可以用可逆的合同变换(当然也包括正交变换)。
用正交变换 $\boldsymbol{x}=\boldsymbol{Q} \boldsymbol{y}$ 把三元二次型 $f(\boldsymbol{x})=\boldsymbol{x}^{\mathrm{T}} \boldsymbol{A} \boldsymbol{x}$ 化为标准形 $\lambda_1 y_1^2+\lambda_2 y_2^2+\lambda_3 y_3^2$, 在几何上就是把坐标轴变换到与二次曲面 $\boldsymbol{x}^{\mathrm{T}} \boldsymbol{A} \boldsymbol{x}=1$ 的主轴（即对称轴）重合的位置。其中 $\boldsymbol{Q}$ 的列向量恰好给出了二次曲面的主轴的方向。因此, 关于用正交变换化二次型为标准形的定理也称为主轴定理。这同时也是主轴定理的几何意义。
下面插一下主轴定理的定义:
对于任意一个 $n$ 元二次型:

$$
f\left(x_1, x_2, \cdots, x_n\right)=\boldsymbol{x}^{\mathrm{T}} \boldsymbol{A} \boldsymbol{x}
$$

存在正交变换 $x=Q y$ ( $Q$ 为 $n$ 元正交矩阵), 使得

$$
\boldsymbol{x}^{\mathrm{T}} \boldsymbol{A} \boldsymbol{x}=\boldsymbol{y}^{\mathrm{T}}\left(\boldsymbol{Q}^{\mathrm{T}} \boldsymbol{A} \boldsymbol{Q}\right) \boldsymbol{y}=\lambda_1 y_1^2+\lambda_2 y_2^2+\cdots+\lambda_n y_n^2
$$

其中: $\lambda_1, \lambda_2, \cdots, \lambda_n$ 是实对称矩阵 $\boldsymbol{A}$ 的 $n$ 个特征值; $\boldsymbol{Q}$ 的 $n$ 个列向量是对应于特征值 $\lambda_1, \lambda_2, \cdots, \lambda_n$的标准正交特征向量。

因此, 从几何图形上寻找二次型主轴的问题, 在线性代数中就等价于让矩阵 $A$ 经过正交变换 (同时也是相似变换) 使矩阵 $\boldsymbol{A}$ 对角化。要对角化就要找它的主轴的大小和方向, 也就是找它的特征值和特征向量。
找到了特征向量就可以用它们组成一个正交矩阵, 用这个正交矩阵就可以把二次型转到对角化, 实际上就是把坐标轴转到二次型曲面的主轴方向, 由此可以简化二次型。在许多工程问题中, 可以使它的某些物理意义变得清晰起来, 因而得到了广泛应用。
例 7.1 用正交变换化简下列二次曲面方程为标准形:

$$
x_1^2+x_2^2+x_3^2-2 x_1 x_2=1
$$

解 将左边的二次型表示为矩阵/向量形式:

$$
x_1^2+x_2^2+x_3^2-2 x_1 x_2=\boldsymbol{x}^{\top} \boldsymbol{A} \boldsymbol{x}=\left(\begin{array}{l}
x_1 \\
x_2 \\
x_3
\end{array}\right)^T\left[\begin{array}{ccc}
1 & 0 & -1 \\
0 & 1 & 0 \\
-1 & 0 & 1
\end{array}\right]\left(\begin{array}{l}
x_1 \\
x_2 \\
x_3
\end{array}\right)
$$

容易求出矩阵 $\boldsymbol{A}$ 的特征多项式:

$$
|\lambda \boldsymbol{E}-\boldsymbol{A}|=\left|\begin{array}{ccc}
\lambda-1 & 0 & -1 \\
0 & \lambda-1 & 0 \\
-1 & 0 & \lambda-1
\end{array}\right|=\lambda(\lambda-1)(\lambda-2)
$$

其实到了这里得到了特征值, 我们就已经知道了二次型的标准形, 如果要知道正交矩阵的话, 继续:
由每个特征值 $\lambda=1,2,0$, 计算出对应的特征向量, 并单位化:

$$
\boldsymbol{e}_1=\left(\begin{array}{l}
0 \\
1 \\
0
\end{array}\right), \boldsymbol{e}_2=\frac{1}{\sqrt{2}}\left(\begin{array}{c}
-1 \\
0 \\
1
\end{array}\right), e_3=\frac{1}{\sqrt{2}}\left(\begin{array}{l}
1 \\
0 \\
1
\end{array}\right)
$$

因为它们是对应于不同的特征值的特征向量, 因此彼此正交, 是 $\boldsymbol{R}^3$ 的规范正交基, 不用施密特正交化了。令 $x=Q y$, 其中

$$
\boldsymbol{Q}=\left[\boldsymbol{e}_1, \boldsymbol{e}_2, \boldsymbol{e}_3\right]=\left[\begin{array}{ccc}
0 & -\frac{1}{\sqrt{2}} & \frac{1}{\sqrt{2}} \\
1 & 0 & 0 \\
0 & \frac{1}{\sqrt{2}} & \frac{1}{\sqrt{2}}
\end{array}\right]
$$

将其代入式 (7-6), 并化简为 $y_1^2+2 y_2^2=1$ 。
图 7-10 (a) 是旧坐标系下的二次型图形, 建立以特征向量为基的新坐标系。新坐标系 $\left\{o, y_1, y_2, y_3\right\}$ 的基为 $\left\{\boldsymbol{e}_1, \boldsymbol{e}_2, \boldsymbol{e}_3\right\}$, 原曲面在新坐标系下 (见图 7-10 (b)) 容易看出来是一个椭圆柱面。它的准线是 $y_1 y_2$ 平面上的椭圆, 对称轴是 $y_3$ 轴。我们看到, 二次型矩阵 $\boldsymbol{A}$ 的三个特征向量 $e_1 、 e_2 、 e_3$ 的方向就是椭圆的长轴、短轴和对称轴的方向, 正是由于我们取了 $\boldsymbol{A}$ 的正交规范特征向量为新基, 原方程才得以化简。由于过渡矩阵 $Q=\left[\boldsymbol{e}_1, \boldsymbol{e}_2, \boldsymbol{e}_3\right]$ 的行列式为 1 , 故新坐标系仍然是右手直角坐标系。
![图片](/uploads/2024-01/image_202401126aeee4f.png)

7. 3. 2 其他二次型对角化的方法
      其他的二次型的合同对角化方法还有配方法、初等变换法等。
      配方法是可逆的线性变量替换, 属于合同变换。该方法咱中学都学过, 用其对付简单的二次型还比较适用, 不妨简单地总结一下其步骤:
      (1) 如果二次型 $f\left(x_1, x_2, \cdots, x_n\right)$ 中至少有一项平方系数不为零, 比如 $a_{11} x_1^2 \neq 0$, 那么就把所有含有 $x_1$ 的交叉项进行配方。
      (2) 配方后, 进行第一次变量替换 $\left\{\begin{array}{l}y_1=a_{11} x_1+a_{12} x_2+\cdots+a_{1 n} x_n \\ y_2=x_2 \\ \vdots \\ y_n=x_n\end{array}\right.$, 简写为 $\boldsymbol{y}=\boldsymbol{D} \boldsymbol{x}=\left[\begin{array}{cccc}a_{11} & a_{12} & \cdots & a_{1 n} \\ & 1 & 0 \\ & \ddots & \vdots \\ & & 1\end{array}\right] \boldsymbol{x}$ 。如果写成带入的形式就是 $\boldsymbol{x}=\boldsymbol{D}^{-1} \boldsymbol{y}=\boldsymbol{C} \boldsymbol{y}, \boldsymbol{D}$ 显然是可逆的。

(3) 原二次型变为 $f\left(x_1, x_2, \cdots, x_n\right)=\frac{1}{a_{11}} y_1^2+f^{\prime}\left(y_2, y_3, \cdots, y_n\right)$ 的形式。如果二次型 $f^{\prime}\left(y_2, y_3, \cdots, y_n\right)$ 中还有不为零的平方项系数, 重复以上步骤, 直到平方项系数为零。
(4) 对于平方项系数为零的只含有交叉乘积项的二次型, 比如 $2 h x_1 x_2$, 就使用平方差公式:

$$
\left\{\begin{array}{l}
x_1=y_1+y_2 \\
x_2=y_1-y_2 \\
x_3=y_3 \\
\vdots \\
y_n=x_n
\end{array}\right.
$$

即

$$
\boldsymbol{x}=\boldsymbol{C}_i \boldsymbol{y}=\left[\begin{array}{ccccc}
1 & 1 & 0 & \cdots & 0 \\
1 & -1 & 0 & \cdots & 0 \\
& & 1 & & 0 \\
& & & \ddots & \vdots \\
& & & & \\
& & & &
\end{array}\right] \boldsymbol{y}
$$

代入化成平方项, 转换成前述的情况继续配方, 直至化成标准形。
对于一个二次型, 用上述的配方法, 总可以使所有的交叉混合项消失, 变成标准形。以上两种情况变量替换所用的变换矩阵都是可逆矩阵, 因此, 总存在一系列可逆矩阵 $C_1, C_2, \cdots, C_i, \cdots, C_s$ 使得

$$
f\left(x_1, x_2, \cdots, x_n\right)=\boldsymbol{x}^{\mathrm{T}} \boldsymbol{A} \boldsymbol{x}=\boldsymbol{y}^{\mathrm{T}}\left(\boldsymbol{C}_s^{\mathrm{T}} \cdots \boldsymbol{C}_i^{\mathrm{T}} \cdots \boldsymbol{C}_2^{\mathrm{T}} \boldsymbol{C}_1^{\mathrm{T}}\right) \boldsymbol{A}\left(\boldsymbol{C}_1 \boldsymbol{C}_2 \cdots \boldsymbol{C}_i \cdots \boldsymbol{C}_s\right) \boldsymbol{y}=d_1 y_1^2+d_2 y_2^2+\cdots+d_n y_n^2
$$

所以, 配方法也是多次合同变换的结果。
初等变换法也是合同变换, 有一个定理给出了二次型度量矩阵的初等变换法:
任给一个实对称矩阵 $\boldsymbol{A}$, 肯定存在一连串的初等矩阵 $\boldsymbol{T}_1, \boldsymbol{T}_2, \cdots, \boldsymbol{T}_n$, 使 $\boldsymbol{A}$ 对角化:

$$
\boldsymbol{T}_s^{\mathrm{T}} \cdots \boldsymbol{T}_2^{\mathrm{T}} \boldsymbol{T}_1^{\mathrm{T}} \boldsymbol{A} \boldsymbol{T}_1 \boldsymbol{T}_2 \cdots \boldsymbol{T}_s=\left(\boldsymbol{T}_1 \boldsymbol{T}_2 \cdots \boldsymbol{T}_s\right)^{\mathrm{T}} \boldsymbol{A}\left(\boldsymbol{T}_1 \boldsymbol{T}_2 \cdots \boldsymbol{T}_s\right)=\boldsymbol{C}^{\mathrm{T}} \boldsymbol{A} \boldsymbol{C}=\left[\begin{array}{llll}
d_1 & & \\
& d_2 & \\
& & { }_2 \\
& & d_n
\end{array}\right]
$$

实际的操作是
$$
\boldsymbol{T}_1^{\mathrm{T}} \boldsymbol{A} \boldsymbol{T}_1 \rightarrow \boldsymbol{T}_2^{\mathrm{T}} \boldsymbol{T}_1^{\mathrm{T}} \boldsymbol{A} \boldsymbol{T}_1 \boldsymbol{T}_2 \rightarrow \boldsymbol{T}_s^{\mathrm{T}} \cdots \boldsymbol{T}_2^{\mathrm{T}} \boldsymbol{T}_1^{\mathrm{T}} \boldsymbol{A} \boldsymbol{T}_1 \boldsymbol{T}_2 \cdots \boldsymbol{T}_s \rightarrow\left[\begin{array}{llll}
d_1 & & & \\
& d_2 & \\
& & d_n \\
& & d_n
\end{array}\right]

$$
其中矩阵 $\boldsymbol{A}$ 左乘 $\boldsymbol{T}_i^{\mathrm{T}}$ 是对其进行初等行变换, 右乘 $\boldsymbol{T}_i$ 是对其进行初等列变换。出题的考官为了圆满, 常常让你给出马后炮一一变换矩阵 $C$; 变换矩阵 $C=T_1 T_2 \cdots T_s$, 如何得到? 因为 $C=T_1 T_2 \cdots T_s=E T_1 T_2 \cdots T_s$, 所以只要对 $n$ 阶单位矩阵 $E$ 作同样的初等列变换就可以同步求出了。

式 (7-7) 的运算过程是每一个步骤进行一次行变换就马上进行一次列变换, 这样每个步骤都是合同的。当然, 在一个步骤里可以先进行多次行变换再紧接着进行同样多次列变换。

配方法、初等变换法都是合同变换, 但得到的对角矩阵的对角线上的元素一般不是特征值,这与正交变换不同。当然它们具有一致的几何意义, 只是手段稍异, 本质相同罢了。
$$

刷题

做题，是检验是否掌握数学的唯一真理

上一篇：正定二次型与图像判定

下一篇：阅读：正定定理

本文对您是否有用？有用 (0) 无用 (0)