科数网
学习
高中数学
高中物理
微积分
线性代数
概率论
人工智能
赞助本站
在线教程
线性代数
第四篇 相似矩阵及二次型
惯性定理
日期:
2024-01-12 12:39
查看:
172
次
编辑
导出本文
惯性定理
定理1 设有二次型 $f(x)=\boldsymbol{x}^{\mathrm{T}} A \boldsymbol{x}$ ,它的秩为 $r$ ,有两个可逆变换 $$ x=C y \quad \text { 及 } x=P z $$ 使 $$ f=k_1 y_1^2+k_2 y_2^2+\cdots+k_r y_r^2 \quad\left(k_i \neq 0\right), $$ 及 $$ f=\lambda_1 z_1^2+\lambda_2 z_2^2+\cdots+\lambda_r z_r^2 \quad\left(k_i \neq 0\right), $$ 则 $k_1, \cdots, k_r$ 中正数的个数与 $\lambda_1, \cdots, \lambda_r$ 中正数的个数相等. 这个定理称为惯性定理,这里不予证明. ## 惯性定理的几何及物理意义 在上面的各种对角化的不同变换中得到的标准形一般是不一样的, 比如正交变换时, 并没有规定对角矩阵中对角元的顺序, 所以对角矩阵是不唯一的。类似地, 其他合同对角化方法的每个步骤也不是唯一的, 得到的对角矩阵也不是唯一的, 得到的标准形自然也不是唯一的。 尽管 “沧海桑田”, 仍有能够 “永恒” 之物, 那就是标准形中非零系数个数、正系数个数、负系数个数都是不变的, 此即西尔维斯特(Sylvester)惯性定理: 设 $n$ 阶二次型 $f(x)=x^{\mathrm{T}} A x$ 的秩为 $r$, 若可逆线性变换 $x=C y$ 及 $x=P y$ 分别将二次型 $f$ 化成标准形 : 及 $$ f=k_1 y_1^2+k_2 y_2^2+\cdots+k_r y_r^2 \quad\left(k_i \neq 0, i=1,2, \cdots, r\right) $$ $$ f=\lambda_1 z_1^2+\lambda_2 z_2^2+\cdots+\lambda_r z_r^2 \quad\left(\lambda_i \neq 0, i=1,2, \cdots, r\right) $$ 则 $k_1, k_2, \cdots, k_r$ 与 $\lambda_1, \lambda_2, \cdots, \lambda_r$ 中带正号的系数个数相同 (同时负号系数个数也相同 )。 任何一个实二次型都可以经过一个线性变换化为标准形。惯性定理是说, 标准形的正系数的个数与负系数的个数与标准形的坐标基选择无关, 二次型对满秩线性替换是不变量。正因为它们是不变量, 所以我们叫这个定理为惯性定理, 其中正系数个数称为正惯性指数 (可记为 $P$ ),负系数个数称为负惯性指数 (可记为 $N$ )。正惯性指数加上负惯性指数等于秩, 即 $P+N=r$ 。 惯性定理的几何意义: 惯性定理反映到几何上, 就是经过可逆的合同变换把二次曲线/面方程化成标准方程。方程的系数与所作的线性变换有关; 而曲线的类型 (是椭圆型、双曲线型等) 是不会因为所作的线性变换的不同而改变的。曲线的类型在几何图形上就像是图形的轮廓, 这些不同的轮廓与基的选择无关。例如, 一个马鞍面无论选择的基是什么, 都是一个马鞍面, 尽管马鞍面可以变大变小, 变陡峭或平坦, 亦可横着、坚着、斜着、倒着等。马鞍面的这些改变取决于基向量的不同取法。 二次型图形的对称性是显然的, 从标准形的代数式 $f=k_1 y_1^2+k_2 y_2^2+\cdots+k_r y_r^2$ 可以看出,对于任一个坐标轴 $y_i, k_i y_i^2$ 的图形是关于坐标零点左右对称的, 这些平方项叠加起来仍然关于每个坐标轴对称。这些对称性图形可以通过观察后续的二次型的图形来体会。 上面几何意义的解释是比较常见的说法, 其实质是假定存在一个绝对的世界坐标系作为背景, 它是永远都是刻度不变的标准正交坐标系, 所变的是二次型的几何图形。 其实更好的解释和正交变换的坐标系旋转/镜像的几何解释类似: 二次型的几何图形不变,变的是坐标系: 原来的标准正交系变成了刻度和坐标轴夹角都不同的仿射坐标系。想象二次型所表示的几何图形是一个物理实体, 各种合同变换所变换的是坐标系。因为坐标系的变化向量之坐标和度量矩阵一起变, 因而二次型的函数表达式也相应地改变了一一每一个坐标系下对应着一个函数表达式; 然而仍要记住这个物理实体是不变的。这个说法看起来像二次型的物理意义的解释。 惯性定理又叫主轴定理, 因为二次型的图形在化成标准形体现出了最完美的对称性, 每一个基向量所在的直线都成为二次齐次函数图形的对称轴,我们称这些对称轴为二次型的主轴。 惯性定理或主轴定理的命名由来更像是直接来自于力学中的惯性张量矩阵二次型。惯性矩二次型是描述刚体绕定点转动的总惯量。转动物体的转动惯量和直线运动物体的质量一样都是描述惯性大小的标量, 因此具有不变性。惯性矩二次型经过正交变换得到了由三个主轴转动惯量所组成的对角阵。 惯性定理在相对论中的应用 正如前面所讲, 二次型惯性定理的更本质一些的几何意义是二次型图形本身可以看做不变的物理实体, 二次型在选择不同的基/坐标轴时并不能改变这个物理实体, 只是这个物理实体的数学描述式 $f=k_1 y_1^2+k_2 y_2^2+\cdots+k_r y_r^2$ 在随着不同的基而改变而已 (呵呵, 数学是不是有点唯心)。这个数学描述式再改变也是描述的同一个物理实体啊, 因此, 在线性映射下, 一个球体再怎么投影也就变成个小球、大球或椭圆球面, 不会变成马鞍面那样的波澜起伏的丘陵加山壑。 二次型的这个不变的 “惯性” 被闵可夫斯基成功地运用于描述㹨义相对论的四维时空线性空间 (被称为闵可夫斯基空间) 里的度规不变量, 这个二次型在不同的惯性系 (坐标系间保持静止或匀速直线运动) 变换下是不变量。 闵可夫斯基空间的二次型不变的来源是因为假设光速不变。假设三维空间坐标零点发出一个光脉冲, 光线向四面八方随着时间 $t$ 的延长而扩散开来, 最外面的光波阵面是一个迅速扩张的球面, 这个球面的半径等于光速和时间的积 $c t$, 因此这个球面方程为 两边平方得到 $$ \sqrt{x^2+y^2+z^2}=c t $$ $$ x^2+y^2+z^2=c^2 t^2 $$ 那么我们把这个关系式定义为一个二次型 $$ f(x, y, z, t)=x^2+y^2+z^2-c^2 t^2=0 $$ 在洛仑兹变换 (坐标变换) 下, 坐标系从 $\{o, x, y, z, t\}$ 变换为 $\left\{o, x^{\prime}, y^{\prime}, z^{\prime}, t^{\prime}\right\}$, 这个二次型 $f$ 的值仍然等于 0 , 也就是总有 $$ f(x, y, z, t)=x^2+y^2+z^2-c^2 t^2=x^{\prime 2}+y^{\prime 2}+z^{\prime 2}-c^2 t^{\prime 2}=f\left(x^{\prime}, y^{\prime}, z^{\prime}, t^{\prime}\right) $$ 7.5 二次型正定性的几何意义 二次型的定义式 $f(x)=\boldsymbol{x}^{\mathrm{T}} \boldsymbol{A x}$ 看起来与内积的推广定义式 $\langle\boldsymbol{x}, \boldsymbol{y}\rangle=\boldsymbol{x}^{\mathrm{T}} \boldsymbol{S y}$ 是类似的; 同时,二次型矩阵 $\boldsymbol{A}$ 和内积的度量矩阵 $\boldsymbol{S}$ 都是实对称矩阵, 看起来渊源颇深啊。 泛泛地看来, 二次型只是内积的特殊形式一一是一个向量与自身的内积, 或者说是向量长度的平方。实际上, 因为在实线性空间里内积度量矩阵是一个正定对称方阵, 任意一个正定对称方阵 $\boldsymbol{S}$ 可一一对应一个内积 $\boldsymbol{x}^{\mathrm{T}} \boldsymbol{S y}$; 如果一个二次型方阵 $\boldsymbol{A}$ 也是一个正定实阵, 则根据二次型和实对称方阵的一一对应性, 我们当然可以把一个正定二次型看做一个内积了, 甚至更自然的是向量长度的平方了。 正定具体是指什么意思, 通过对二次型进行分类, 事情可能更清晰一些。 7.5.1 二次型正定性的几何意义 对二次型的分类主要有五类: 正定, 负定, 半正定, 半负定, 不定。它们的几何意义都是什么呢? 先看定义: 设有二次型 $f(\boldsymbol{x})=\boldsymbol{x}^{\mathrm{T}} \boldsymbol{A} \boldsymbol{x}$ 。 - 若对任何 $\boldsymbol{x} \neq \boldsymbol{0}$, 都有 $f(\boldsymbol{x})>0$, 则称 $f(\boldsymbol{x})$ 为正定二次型, 并称对称矩阵 $\boldsymbol{A}$ 是正定矩阵, 记为 $\boldsymbol{A}>\mathbf{0}$ 。 - 若对任何 $\boldsymbol{x} \neq \mathbf{0}$, 都有 $f(\boldsymbol{x})<0$, 则称 $f(\boldsymbol{x})$ 为负定二次型, 并称对称矩阵 $\boldsymbol{A}$ 是负定矩阵, 记为 $\boldsymbol{A}<\mathbf{0}$ 。 - 若对任何 $\boldsymbol{x} \neq \mathbf{0}$, 都有 $f(\boldsymbol{x}) \geqslant 0$, 则称 $f(\boldsymbol{x})$ 为半正定的; 若 $-f(\boldsymbol{x})$ 为半正定的, 则称 $f(x)$ 为半负定 (负半定) 的; 若 $f(x)$ 既不是半正定又不是半负定的, 则称 $f(x)$ 为不定的。 对上述四平八稳的定义麻木了就看不到细节了, 换个讲法: 在欧氏空间 $\mathbf{R}^n$, 实二次型 $f\left(x_1, x_2, \cdots, x_n\right)$ 作为定义在 $\mathbf{R}^n$ 的一个二次实函数 $z=f\left(x_1, x_2, \cdots, x_n\right)$,则当 $f\left(x_1, x_2, \cdots, x_n\right)$ 为正定时就是只要取 $x_1, x_2, \cdots, x_n$ 为一组不全为 0 的实数, 均有 $z>0$ (只有当 $x_1=x_2=\cdots=x_n=0$ 时, $\left.z=0\right)$; 也就是说, 这个函数的值域是 $z \geqslant 0$, 但只有在 $\mathbf{R}^n$ 的原点取得 $z=0$,而在其他点上均有 $z>0$ 。这个地方好多人都忽略了。 半正定呢, 就是在此二次型在整个定义域 $\mathbf{R}^n$ 上也有值域 $z \geqslant 0$, 但除了原点使 $z=0$ 外, 尚有其他一些点也使 $z=0$, 此外便是 $z>0$ (负定和半负定相应地有类似的结果, 只是 $z \leqslant 0$ )。 当二次型为不定时, 则函数值域既有正实数也有负实数和 0 。 下面举几个正定、半正定和不定的例子及其三维图形供参考。 例 $7.2 z=f(x, y)=\frac{1}{4} x^2+y^2$ 是一个正定二次型, 它的图像如图 7-11 (a) 所示, 是一个开口向上的椭圆抛物面, 整个曲面除一点 (顶点) 在坐标平面 $x o y$ 的原点上, 其余均在 $x o y$ 平面的上方。 ![图片](/uploads/2024-01/image_20240112abe1209.png) 正定二次型有着明显的几何意义, 当 $f(x, y)$ 为二维的正定二次型时, 它可由可逆线性替换 (坐标变换) 化为系数全为正的标准形, 于是 $f(x, y)=c(c>0)$ 的图形是以原点为中心的椭圆,当把 $c$ 看做任意正常数时,则是一族椭圆线,这族椭圆随着 $c$ (沿着抛物线) 减小且趋于零而收缩到原点 (见图 7-11 (a)); 当 $f$ 为三维正定二次型时, $f(x, y, z)=c(c>0)$ 的图形则是一族椭球面, 这族椭球面随着 $c$ (沿着抛物面) 减小且趋于零而收缩到原点。 例 $7.3 z=f(x, y)=2 x^2$ 是半正定二次型, 它的图形如图 7-11 (b) 所示, 是一个开口向上, 以 $x o y$ 面上的抛物线 $z=2 x^2$ 为准线, 以平行于 $y$ 轴的直线为母线的抛物柱面。整个曲面有一条母线在 $x o y$ 面上 (即 $y$ 轴, 轴上二次型等于零), 其余均在 $x o y$ 平面上方。 例 $7.4 z=f(x, y)=x y$ 是一个不定二次型, 其图形如图 7-11 (c) 所示, 是一个过原点的马鞍面。显然, 马鞍面上正值、负值和零都有。 7.5. 2 二次型正定性判别法的直观理解 知道了二次型的函数图形当然比较容易判定二次型的正定性, 一旦碰到超多元的二次型就麻烦了, 还是需要代数的计算手段。我们知道了一个实二次型对应一个实对称矩阵, 是否从矩阵本身就可以知道这个二次型的正定性? 应该如此。因为合同变换不改变二次型函数的值, 原来大于零的还是大于零, 所以合同对角化矩阵就可以了, 如果对角线上的元素是大于零的数就是正定的了 (这说明标准形的系数都是正值)。 对角化判定方法之一是特征值法, 因为特征值是正交变换(也是合同变换)对角化矩阵的对角线上的元素。特征值大于零, 当然二次型也是正定的了。 还有个矩阵正定性判定的方法, 比如顺序主子式法: 还有个矩阵正定性判定的方法, 比如顺序主子式法: (1) $\boldsymbol{A}$ 是正定矩阵的充要条件是它的所有主子式都大于 0 。 (2) $\boldsymbol{A}$ 是负定矩阵的充要条件是它的所有奇数阶主子式都小于 0 , 并且它的所有偶数阶主子式都大于 0 。 顺序主子式法能理解就好了, 我们看一个例子, 见表 7-1。 ![图片](/uploads/2024-01/image_20240112cb2b869.png) ![图片](/uploads/2024-01/image_2024011269a03ea.png) 咱来看看: 顺序 1 中, 一阶二次型是正定的等价于 $a_{11}>0$ 。 顺序 2 中, 二阶二次型矩阵 $\boldsymbol{A}$ 经过行和列同时的初等变换, 得到了包含 $a_{11}$ 和 $d_2$ 的对角阵 $\boldsymbol{\Lambda}$ 。注意, $\boldsymbol{A}$ 和 $\boldsymbol{\Lambda}$ 的行列式是同符号的, 因为 $|\boldsymbol{\Lambda}|=\left|\boldsymbol{C}^{\mathrm{T}} \boldsymbol{A C}\right|=|\boldsymbol{C}|^2|\boldsymbol{A}|$ 。 显然, $a_{11}$ 和 $d_2$ 要同时大于 0 的话, 二次型就是正定; 反之亦然。 $a_{11}$ 和 $d_2$ 要同时大于 0 等价于 $a_{11}>0$ 和 $a_{11} d_2>0$, 换句话说, $A$ 的顺序主子式全大于 0 。随着变量逐步地增加, 显然各阶主子式必须大于 0 , 才是各阶二次型正定的充要条件。 我相信, 通过仔细地比对上述的二次型函数式、顺序主子式, 各位能顺利地理解正定的主子式判定定理。 另外, 表 7-1 给出了顺序 $\mathrm{n}$ 是为了和顺序 3 进行比对, 应该看出, 各阶顺序主子式也可认为是变量 $x_1 、 x_2 、 x_3$ 中批量取零得到矩阵行列式。如对于三阶二次型, 令 $x_3=0$ 得到二阶主子式, 令 $x_2=x_3=0$ 得到一阶主子式。 俺衷心希望你能顺利地理解下面的判断。 例 7.5 判别二次型 $f=-3 x^2-5 y^2-7 z^2+4 x y+4 x z$ 的正定性。 解 $f$ 的矩阵为 $$ A=\left[\begin{array}{ccc} -3 & 2 & 2 \\ 2 & -5 & 0 \\ 2 & 0 & -7 \end{array}\right] $$ 因为 $$ a_{11}=-3<0,\left|\begin{array}{ll} a_{11} & a_{12} \\ a_{21} & a_{22} \end{array}\right|=\left|\begin{array}{cc} -3 & 2 \\ 2 & -5 \end{array}\right|=11>0,|\boldsymbol{A}|=-57<0 $$ 故由上述顺序主子式法定理知 $f$ 为负定的。 7.6 二次型的分类与二次曲面的分类 对二次型分类方式, 除了前面讲到的正定性的分法, 几何上也有多种说法, 比如投影分类、仿射分类或者度量分类等, 无论怎么分类, 最好都要把 $n$ 元二次型化为标准形再说: $$ f\left(x_1, x_2, \cdots, x_n\right)=f\left(y_1, y_2, \cdots, y_r\right)=k_1 y_1^2+k_2 y_2^2+\cdots+k_r y_r^2\left(k_i \neq 0\right) $$ 化成如上的标准形, 我们再看这个二次型正定性就一目了然: - 正定 $\Leftrightarrow P=r=n$, 就是所有的系数 $k_i$ 大于 0 , 系数个数是 $n$ 。 - 负定 $\Leftrightarrow P=0, r=n$, 就是所有的系数 $k_i$ 小于 0 , 系数个数是 $n$ 。 - 半正定 $\Leftrightarrow P=r<n$, 就是所有的系数 $k_i$ 大于 0 , 但系数个数小于 $n$ 。 - 半负定 $\Leftrightarrow P=0, r<n$, 就是所有的系数 $k_i$ 小于 0 , 但系数个数小于 $n$ 。 - 不定 $\Leftrightarrow 0<P<r(\leqslant n)$, 就是系数 $k_i$ 既有大于 0 的也有小于 0 的。 这里 $P$ 是二次型的正惯性指数, $n$ 是二次型阶数, $r$ 是二次型的秩。 好了, 二次型的分类确定了, 由二次型的切片或截面得到的二次曲面/线也得到了分类。所谓二次型的切片, 就是使二次型等于一个实数 $d$, 即令 $f\left(x_1, x_2, \ldots, x_n\right)=d$ 。这个实数 $d$ 可以是大于 0 、小于 0 或等于 0 。 当然, 为了让切片能在实数空间里切到实物, 正定或半正定的二次曲面就让 $d$ 大于 0 或 $d$大于等于 0 ; 负定或半负定的二次曲面就让 $d$ 小于 0 或 $d$ 小于等于 0 ; 不定的二次曲面就让 $d$取三个值: 大于、小于和等于 0 。这样一来, 图形就全面了。好, 我们先以简单的二元二次型给出对比, 见表 7-2 (为了方便, 这里假定 $k_i$ 大于 0 )。 ![图片](/uploads/2024-01/image_202401127ed9593.png) ![图片](/uploads/2024-01/image_2024011297b3c1b.png) ![图片](/uploads/2024-01/image_202401125e099e0.png) ![图片](/uploads/2024-01/image_20240112ae903a5.png) ![图片](/uploads/2024-01/image_20240112dca154f.png)
上一篇:
用配方法化二次型为标准形
下一篇:
正定二次型与正定阵
本文对您是否有用?
有用
(
0
)
无用
(
0
)
赞助我们
0
篇笔记
写笔记
更多笔记
提交笔记