科数网
题库
在线学习
高中数学
高等数学
线性代数
概率统计
高中物理
复变函数
离散数学
实变函数
数论
群论
科数
题库
在线学习
赞助
你好
游客,
登录
注册
在线学习
线性代数
第七篇 二次型与正定型
矩阵的合同
最后
更新:
2025-04-25 07:53
查看:
328
次
反馈
刷题
矩阵的合同
### 为什么引入合同? 在二次多项式里,比如 $f=x_1^2+2 x_1 x_2+ x_2 ^2$ 就很好,因为他可以写成 $f=(x_1+x_2^2)^2$ 这样,他的图形就和初中学过的$y=x^2$类似,$f$的很多性质也一目了然,比如 $f=(x_1+x_2^2)^2$ 可以知道他的函数开口向上,而且有最小值,甚至知道最小值$f \ge 0$。 但是,如果我们给$f$交叉项修改一下 $f=x_1^2+ x_1 x_2+ x_2 ^2$ 此时,就发现$f$不是完全平方项了,想知道$f$的极值也变的困难。 因此,首要的任务是一个二次多项式能否通过线性替换,去掉交叉项,让$f$仅包含平方项,这样方便我们研究函数的性质。答案是肯定的。所以,我们的首要任务是**消灭交叉项**。 ### 合同的几何意义 > 在线性代数里,合同的本意是“重合后相同”,这和日常生活中说的“法律合同”完全不相干。核心思想是两个二次型如果可以通过坐标系的旋转、缩放互相转换,它们就是合同的。 `例`举一个最简单的例子:$x^2+y^2=1$ 表示半径为1的圆。 而 $x^2+y^2=4$ 表示半径为2的圆,我们容易看到,圆1通过放大2倍,就可以变成圆2,因此,我们说 “圆1与圆2”是图形是合同的。 {width=200px} 根据二次型的定义,如果写出圆1的二次型矩阵为 $$ A_1=\left(\begin{array}{c} 1 & 0 \\ 0 & 1 \end{array} \right) $$ ,圆2的二次型矩阵为 $$ A_2=\left( \begin{array}{c} \frac{1}{2} & 0 \\ 0 & \frac{1}{2} \end{array} \right) $$ 直觉告诉我们,$A_1$和$A_2$是合同的,那么怎么用数学语言证明来说两个矩阵是“合同”的呢? 参考上图,一个简单方式是圆的$x,y$轴同时放大相同倍数即可。 因此,我们定义 $$ B=C^TAC $$ > **从几何意义上简单理解就是,$A,B$是合同的。 这里矩阵A左乘$C^T$相当于作用在行轴进行放大N倍,而矩阵A右乘$C$相当于作用在列轴上进行放大同样的N倍。放大后,$A=B$,所以是重合的。** 合同除了缩放,还有旋转的意义在里面,见下例。 `例` 方程 $3 x^2+2 \sqrt{3} x y+5 y^2=6$ 表示怎样的曲线?是不是标准的椭圆,或者双曲线,或者抛物线呢? 解:从方程可以看到,该方程表示的是一条中心与坐标原点重合的曲线,并且曲线关于原点对称(为什么?因为没有一次项,详见二次型的意义),但是并不能从该方程上直接看出它表示图形是不是日常见到的椭圆,双曲线,或者抛物线,或者是其他怎样的曲线.为此,考虑对左侧的关于 $x, y$ 变量的二次多项式作线性变换(可以使用配方法实现,后面会简单解释),令 $$ x=\frac{u}{2}-\frac{\sqrt{3} v}{2}, y=\frac{\sqrt{3} u}{2}+\frac{v}{2} $$ 这里使用了一个正交矩阵,由于旋转变换是一个正交变换,表示的是将坐标轴逆时针旋转 $\theta$ 角的变换。因此变换后的方程与原方程表示的同一条曲线。 如果不使用正交矩阵也可以,那么图形会变形(例如圆是拉伸乘椭圆)。 这里他是逆时钟旋转 $\frac{\pi}{3}$ 的旋转变换。 代入上面的二次多项式,可得 $$ \begin{aligned} 2\left(3 u^2+v^2\right) & =6 \\ \text { 即 } u^2+\frac{v^2}{3} & =1 . \end{aligned} $$ 从方程可以看到它是一个椭圆。 {width=300px} 红色的是原方程曲线,蓝色的是旋转后的曲线. 上述变换过程,从代数的观点来看,二次型就是通过一个可逆线性变换将一个二次齐次多项式(只含二次项)化为只含平方项的多项式的过程. ## 合同 任给一个二次型就确定了一个对称矩阵,反之,任给一个对称矩阵,也可以唯一缺点一个二次型,这样二次型与对称矩阵就存在一一对应的关心。 设 $f(X)=X^{ T } A X$ 为一个 $n$ 元二次型,$X=C Y$ 为可逆线性变换,将 $X=C Y$ 代入该二次型中,得 $$ \begin{aligned} f(X) & =X^{T} A X=(C Y)^{T} A(C Y) \\ & =Y^{T}\left(C^{T} A C\right) Y \end{aligned} $$ 令 $B=C^{ T } A C$ ,则 $B$ 即为变换后所得新二次型的矩阵。 如果存在 $n$ 阶可逆矩阵 $C$ ,使得 $B=C^T A C $ 则称矩阵$A$合同矩阵$B$。 >注意这里不要与相似变换混渚的概念,相似变换是 $B=P^{-1} A P$ ,相似变换是在不同基的同一矩阵进行变换,而合同变换则表示二次型到标准型的变换,关于矩阵的等价、合同、相似请点击[此处](https://kb.kmath.cn/kbase/detail.aspx?id=772) 矩阵间的合同关系是一个等价关系,满足 **(1)** 反身性:每一个方阵都与它自身合同. 这是因为 $A=E^{\mathrm{T}} A E$. **(2)** 对称性: 如果 $A$ 与 $B$ 合同,则 $B$ 与 $A$ 也合同. 这是因为由 $B=C^{\mathrm{T}} A C$ 及矩阵 $C$ 可逆可 得 $A=P^{\mathrm{T}} B P$ ,其中 $P=C^{-1}$. **(3)** 传递性: 如果 $A$ 与 $B$ 合同, $B$ 与 $C$ 合同,则 $A$ 与 $C$ 也合同. 这是因为由 $B=P^{\mathrm{T}} A P$ 及 $\boldsymbol{C}=\boldsymbol{Q}^{\mathrm{T}} \boldsymbol{B} \boldsymbol{Q}$ 可得 $\boldsymbol{C}=(\boldsymbol{P} \boldsymbol{Q})^{\mathrm{T}} A(\boldsymbol{P Q})$. ### 合同的性质 - $F$ 上 $n$ 阶方阵的合同关系是等价关系。 - 若 $A$ 与 $B$ 合同,则 $A$ 与 $B$ 相抵。 - 若 $A$ 与 $B$ 合同,则 $A$ 与 $B$ 的秩相同。 - 若 $A$ 与 $B$ 合同且 $A^T=A$ ,则 $B^T=B$ 。 - 若 $A$ 与 $B$ 合同且 $A^T=-A$ ,则 $B^T=-B$ 。 - 若 $A$ 与 $B$ 正交相似,则 $A$ 与 $B$ 相似且 $A$ 与 $B$ 合同。 - 设对称矩阵 $A$ 与矩阵 $B$ 合同,即存在可逆矩阵 $C$ ,使得 $B=C^T A C$ 。 >提示:单独看合同的定义,$B=C^T A C $ 并不要求$A$一定是对称矩阵。但是如果$A$是对称矩阵,合同会有更好的性质。 ## 二次型的标准形 对于二次型 $$ \begin{array}{r} f\left(x_1, x_2, \cdots, x_n\right)=a_{11} x_1^2+2 a_{12} x_1 x_2+\cdots+2 a_{1 n} x_1 x_n \\ +a_{22} x_2^2+\cdots+2 a_{2 n} x_2 x_n \\ +\cdots+a_{n n} x_n^2 \end{array} ...(1) $$ 去掉他的交叉项,就是标准形。这里的“去掉”是通俗说法,因为真的去掉会更改$f$的值,正确说法是线性替换,设$x=cy$,通过引入一个线性替换,消去交叉项。 > 所谓二次型标准型就是去掉二次型里烦人的交叉项 **定义:** 如果 $n$ 元二次型 $f\left(x_1, x_2, \cdots, x_n\right)$ 只含有平方项,即$f\left(x_1, x_2, \cdots, x_n\right)=\lambda_1 y_1^2+\lambda_2 y_2^2+\cdots+\lambda_n y_n^2$ 称这样的二次型为**标准形**. 既然标准形本质仍是二次型,因此可以快速写出他的二次型矩阵: $$ \Lambda=\left(\begin{array}{ccc} \lambda_1 & 0 & 0 \\ 0 & \lambda_2 & 0 \\ 0 & 0 & \lambda_n \end{array}\right) =\left(\begin{array}{ccc} \lambda_1 & & \\ & \lambda_2 & \\ & & \lambda_n \end{array}\right) $$ 即: $$ \begin{aligned} f & =\lambda_1 y_1^2+\lambda_2 y_2^2+\cdots+\lambda_n y_n^2 \\ & =\left(\begin{array}{llll} y_1 & y_2 & \cdots & y_n \end{array}\right)\left(\begin{array}{cccc} \lambda_1 & & & \\ & \lambda_2 & & \\ & & \ddots & \\ & & & \lambda_n \end{array}\right)\left(\begin{array}{c} y_1 \\ y_2 \\ \vdots \\ y_n \end{array}\right) \\ & = y ^{T} \Lambda y \end{aligned} ...(2) $$ 现在,我们核心工作是怎么寻找一个线性替换,把(1)中的$x$多项式转换为(2)中的$y$多项式。 >这里的 $xx$ 是二次型中的未知数,$yy$ 是该二次型对应的标准型中的未知数,我们不关心向量y是什么样的, 我们只关心中间的矩阵怎么找,为此先引入线性替换 ## 线性替换 关系式 $$ \left\{\begin{array}{c} x_1=c_{11} y_1+c_{12} y_2+\cdots+c_{1 n} y_n \\ x_2=c_{21} y_1+c_{22} y_2+\cdots+c_{2 n} y_n \\ \vdots \quad \vdots \quad \vdots \\ x_n=c_{n 1} y_1+c_{n 2} y_2+\cdots+c_{n n} y_n \end{array}\right. ...(3) $$ 称为由变量 $x_1, x_2, \cdots, x_n$ 到变量 $y_1, y_2, \cdots, y_n$ 的线性替换。 记 $$ C=\left(\begin{array}{cccc} c_{11} & c_{12} & \cdots & c_{1 n} \\ c_{21} & c_{22} & \cdots & c_{2 n} \\ \vdots & \vdots & \ddots & \vdots \\ c_{n 1} & c_{n 2} & \cdots & c_{n n} \end{array}\right), \quad X=\left(\begin{array}{c} x_1 \\ x_2 \\ \vdots \\ x_n \end{array}\right), \quad Y=\left(\begin{array}{c} y_1 \\ y_2 \\ \vdots \\ y_n \end{array}\right) $$ 则(3)可以表示为 $X=C Y$ 。 当 $C$ 可逆矩阵时,线性替换称为**可逆线性替换或非退化线性替换**。 当 $C$ 不可逆矩阵时,线性替换称为**不可逆线性替换或退化线性替换**。 当 $C$ 正交矩阵时,线性替换称为**正交线性替换**。 设 $A, B$ 均为 $n$ 阶对称方阵。则二次型 $$ f\left(x_1, x_2, \cdots, x_n\right)=X^T A X $$ 经过可逆线性替换 $X=C Y$ 化为 $$ g\left(y_1, y_2, \cdots, y_n\right)=Y^T B Y $$ 的充分必要条件是存在可逆矩阵 $C$ ,使得 $$ C^T A C=B . $$ 所以我们引入了一个新概念:合同。 `例` 设二次型 $$ \begin{aligned} & f(x, y)=3 x^2+2 \sqrt{3} x y+5 y^2, \\ & g(u, v)=6 u^2+2 v^2 \end{aligned} $$ 试求可逆矩阵 $C$ ,使得 $f$ 的二次型矩阵 $A$ 与 $g$ 的二次型矩阵 $B$ 合同,即 $B=C^{ T } A C$ . 解 :两二次型的矩阵分别为 $$ A=\left[\begin{array}{cc} 3 & \sqrt{3} \\ \sqrt{3} & 5 \end{array}\right], B=\left[\begin{array}{ll} 6 & 0 \\ 0 & 2 \end{array}\right] . $$ 通过凑项配方原二次型来得到 $$ \begin{aligned} f(x, y) & =3 x^2+2 \sqrt{3} x y+5 y^2 \\ & =\frac{3}{2}(x+\sqrt{3} y)^2+\frac{1}{2}(y-\sqrt{3} x)^2 . \end{aligned} $$ 于是令 $u=x+\sqrt{3} y, v=y-\sqrt{3} x$ ,可以将原二次型转换为标准二次型, 这个变换可以改写为 $$ \begin{aligned} & x=\frac{1}{4}(u-\sqrt{3} v) \\ & y=\frac{1}{4}(\sqrt{3} u+v) . \end{aligned} $$ 用矩阵可以描述为 $$ \left[\begin{array}{l} x \\ y \end{array}\right]=\left[\begin{array}{cc} \frac{1}{4} & -\frac{\sqrt{3}}{4} \\ \frac{\sqrt{3}}{4} & \frac{1}{4} \end{array}\right]\left[\begin{array}{l} u \\ v \end{array}\right] $$ 于是有 $$ \begin{aligned} C^{T} A C & =\left[\begin{array}{cc} \frac{1}{4} & \frac{\sqrt{3}}{4} \\ -\frac{\sqrt{3}}{4} & \frac{1}{4} \end{array}\right]\left[\begin{array}{ll} 3 & \sqrt{3} \\ \sqrt{3} & 5 \end{array}\right]\left[\begin{array}{cc} \frac{1}{4} & -\frac{\sqrt{3}}{4} \\ \frac{\sqrt{3}}{4} & \frac{1}{4} \end{array}\right] \\ & =\left[\begin{array}{cc} \frac{3}{2} & 0 \\ 0 & \frac{1}{2} \end{array}\right]=B' \end{aligned} $$ 这里$B'$和$B$相比,图像不变但是缩放了4倍。 ## 再次讨论一下合同 为什么合同的定义是 $B=C^T A C $ 而不是其它,例如不是定义 $B=C T A C $ 为合同呢? ### 数学上解释 假设我们有一个二次型 $f(x) = x^T A x$,其中 $x$ 是列向量,$A$ 是对称矩阵。 当进行变量替换 $\mathbf{x} = C \mathbf{y}$($C$ 是可逆矩阵,$\mathbf{y}$ 是新变量)时,原二次型变为: $$ f(x) = (C \mathbf{y})^T A (C \mathbf{y}) = \mathbf{y}^T (C^T A C) \mathbf{y}. $$ 此时,新二次型的矩阵必须为 $C^T A C$,否则表达式无法保持二次型的标量性质(即右边必须是标量)。 关键点: • 变量替换后,矩阵乘法需要满足维度匹配,转置 $C^T$ 的作用是调整矩阵位置,使表达式合法。 • 若直接用 $C^{-1} A C$(相似变换),会导致 $\mathbf{y}^T C^{-1} A C \mathbf{y}$ 的维度不匹配(除非 $C$ 是方阵且对称,但这限制了变换类型)。 ### 几何意义:保持二次型的“本质形状” 合同变换的核心目的是通过坐标变换(旋转、缩放)改变二次型的表示形式,但保持其几何本质(如椭圆还是双曲线)。 • 转置的作用: 当 $C$ 是正交矩阵(即 $C^T = C^{-1}$)时,合同变换 $C^T A C$ 相当于旋转或反射坐标系,不改变向量的长度和内积(即保持几何形状)。 例如,将斜椭圆旋转为标准椭圆时,转置矩阵 $C^T$ 对应旋转操作,消除交叉项 $xy$。 • 缩放操作: 如果 $C$ 是对角矩阵(缩放矩阵),则 $C^T A C$ 相当于沿坐标轴缩放,调整二次型的系数,但保持正负惯性指数不变。 ### 为什么不用其他操作? 1. 为什么不用 $C^{-1} A C$(相似变换)? 相似变换会改变二次型的正负惯性指数,无法保持几何本质。例如,椭圆可能被错误地映射为双曲线。 2. 为什么不用普通的矩阵乘法 $C A C$? 若不用转置,表达式 $\mathbf{x}^T C A C \mathbf{x}$ 会变成向量(非标量),破坏二次型的标量性质。 3. 转置的独特作用: 转置 $C^T$ 是调整矩阵位置的“桥梁”,既保证了变量替换后的表达式仍是标量,又维持了内积结构(即 $x^T A x = y^T (C^T A C) y$)。 > **一句话:转置矩阵 $C^T$ 是合同变换的“灵魂”,它通过调整坐标系的方向和尺度,让二次型的本质形状在变换中保持不变。** 请注意:矩阵的相似不改变矩阵的值,矩阵的合同不改变函数的图像,如果我们希望既不改变函数的值又不改变函数的图像,那就需要使用“正交相似”,仔细看一下合同和相似的定义 合同: $B=C^{T} A C$ 相似:$B=C^{-1} A C$ **如果$C^T=C^{-1}$ 该多好啊,这就是“正交相似”,正交相似是线性代数研究的重点。关于他们的总结,请参考[附录2: 等价、相似与合同](https://kb.kmath.cn/kbase/detail.aspx?id=772)**
刷题
做题,是检验是否掌握数学的唯一真理
上一篇:
二次型的定义
下一篇:
实对称矩阵的对角化
本文对您是否有用?
有用
(
0
)
无用
(
0
)
初中数学
高中数学
高中物理
高等数学
线性代数
概率论与数理统计
复变函数
离散数学
实变函数
数学分析
数论
群论
纠错
高考
考研
关于
赞助
公式
科数网是专业专业的数学网站。