科数网知识库
首页
目录
知识库
线性代数[教程类] Linear Algebra (考研专区)
第四篇 相似矩阵及二次型
二次型及其标准形的定义
二次型及其标准形的定义
日期:
2023-11-06 13:21
查看:
62
次
更新
导出Word
## 为什么研究二次项? 二次型是变量的二次乘积项的和, 类似于 $a x^2+b x y+c y^2$ 的多项式子, 一般包括两个变量乘积项和一个变量平方两种形式。二次型是个函数, 如上式可以写成 $f(x, y)=a x^2+b x y+c y^2$ 的等式形式。 有人疑惑: 这个多项式不是线性函数啊, 这二次型和线性代数有什么关系? 我们知道, 一个一元 $n$ 次多项式可以用一个向量来表示, 次数不超过 $n$ 的多项式全体可以构成一个向量空间。那么一个二次型是一个二元二次多项式, 是不是也可以用向量表示出来?基本答对了! 这个二元二次型可以用几个向量的联合一一矩阵来表示! 如果我们把函数 $f(x, y)=a x^2+b x y+c y^2$ 的自变量换一下, 把单变量 $x 、 y$ 合成一个变向量 $\boldsymbol{x}$,即 $\boldsymbol{x}=(x, y)$, 那么再引入矩阵, 原二元二次函数就可以改写成一元二次向量函数: $$ f(x)=\left(\begin{array}{ll} x & y \end{array}\right)\left[\begin{array}{ll} a & \frac{b}{2} \\ \frac{b}{2} & c \end{array}\right]\left(\begin{array}{l} x \\ y \end{array}\right) $$ 这个样子的向量函数就是传说中的二次型 (其中的矩阵要写成对称矩阵)。这个对称矩阵: $$ \left[\begin{array}{cc} a & \frac{b}{2} \\ \frac{b}{2} & c \end{array}\right] $$ 就可以表示二次型 $f(x, y)=a x^2+b x y+c y^2$ 。 嘿, 改写成这个样子后, 又有向量又有矩阵, 果然是线性代数的内容。一旦改写成这个样子就可以利用矩阵的强大功能了。其实, 前面讲的矩阵的各种变换还真不能直接利用, 因此人们又发明了矩阵的合同变换应用到二次型的研究上。 其实,二次型的内容就是研究线性空间里的一个几何图形如何在不同的坐标基下的不同的矩阵表示,合同的矩阵表示的是同一个二次函数的几何图形 (这可能是“合同”吩称的由来)。 二次型的应用广泛, 比如信号处理里面的噪声功率、物理学里面的势能和动能、力学里面的惯性张量矩阵、微分几何中曲面的法曲率和统计学里的置信椭圆体等, 这些函数都是二次的,都可以转化为二次型对称矩阵的研究。 我们不应觉得奇怪, 比如功率是电压电流的乘积二次项, 动能的公式 $m v^2 / 2$ 中有平方项出现。据说二次型起源于解析几何中三维坐标系下二次曲线、二次曲面方程的研究。然而一般的 $n$ 元二次型的一些概念和理论, 比起解析几何中二次曲线及曲面的概念和理论, 已变得有点抽象。但由于它们之间的内在联系, 使得我们可以将二次曲线及曲面的几何图形用于理解二次型的几何意义。比如, 二次型的一个典型的应用就是对诸如椭圆曲面、双曲抛物面之类的二次曲面进行清晰地分类。因此, 在正式引入二次型的定义前, 俺想从二次曲面图形的绘制开始讨论。 **二次函数的哪些系数对图形是重要的** 在中学的解析几何中, 对于一元二次函数 $f(x)=a x^2$ 在二维平面上看 (把函数值看做 $y$ 轴: $y=a x^2$ ) 我们有非常清晰的几何图形, 就是过原点的抛物线: $a>0$ 开口向上, 整个曲线在横坐标之上; $a<0$ 开口向下, 整个曲线在横坐标之下; $a=0$, 抛物线蜕化成直线 $x$ 轴。 那么对于函数 $f(x)=a x^2+c$ 图形呢? 我们依然清晰地知道, 这是一条在纵轴方向平移后的图形, 仍是一条抛物线或直线, 偏离原点了, 但图形仍然相同。 那么对于函数 $f(x)=a x^2+b x+c$ 图形呢? 虽然不是那么清晰了, 但我们依然知道这也是一条偏离原点的抛物线或直线, 只不过在横轴和纵轴方向上同时进行了平移, 但图形仍然相同。因为可以把它经过配方得到上面的形式: $$ f(x)=a x^2+b x+c=a\left(x+\frac{b}{2 a}\right)^2+\left(c-\frac{b^2}{4 a}\right) $$ 到这里我们有一个小小的结论, 就是三个函数的几何图形是合同的, 合同的意思是它们经过平移后图形会完全重合。 既然是这样, 如果是要考察几何图形的话, 对于 $f(x)=a x^2+b x+c$ 类的函数我们只要考察 $f(x)=a x^2$ 的形式就可以了。换句话说, 我们只需研究这个二次函数的二次项。 对于二元二次函数, 同样有类似的情况。 二元函数 $f(x, y)=a x^2+c y^2$ 的图形在三维空间中观看 (即 $z=a x^2+c y^2$ ), 其典型的图形是粗圆抛物面或双曲抛物面 (见图 7-1, 至于其退化图形如抛物柱面等我们不再提及), 其中的双曲拋物面俗称马鞍面, 如图 7-1 (b) 所示。  在图中, 添加了一个平行于 $x o y$ 平面的平面。平面与曲面的相交线让我们清晰地看出, 椭圆抛物面的交线是椭圆, 双曲抛物面的交线是双曲线 (之所以称之为抛物面, 是因为曲面与 $x o z$ 、 $y o z$ 平行平面的交线是抛物线)。 对于添加了交叉项的二元函数 $f(x, y)=a x^2+b x y+c y^2$ 的图形, 在三维空间中观看(即令 $z=a x^2+b x y+c y^2$ ), 其典型的图形同样是椭圆抛物面或双曲拋物面, 只是它们的图形在坐标 比如上面的双曲抛物面图形, 如果我们改变系数 $b$ 的值, 通过与平面的截线的变化看出曲面在旋转, 图 7-2(a)到(c)的图形变化是改变交叉项 $b x y$ 的系数 $b$ 由 $-5 \rightarrow 0 \rightarrow 5$ 变化得到的。可以看出, 双曲抛物面向右进行了旋转, 同时曲面的形状发生了一些不明显的伸缩变化 (再伸缩也是双曲抛物面)。另外可以看出, 当 $b=0$ 即 $f(x, y)=a x^2+c y^2$ 时, 曲面的图形相对于 $x$ 和 $y$ 轴是对称的 (见图 7-2(b)), 旋转后图形明显与坐标轴不再对称了 (见图 7-2(c))。  我们再来看看一般的二元二次函数 $f(x, y)=a x^2+b x y+c y^2+d x+e y+f$ 的图形, 函数式与前者比较看来, 式中增添了一次项和常数项。根据一元二次函数的经验, 增添了一次项和常数项的函数图形只是把原来的图形在各个坐标轴 $(x, y, z)$ 方向上分别平移了一个距离。对于二元函数来说同样如此。 比如双曲抛物面图形, 如果我们改变函数系数 $d$ 的值, 通过与平面的截线的变化看出曲面在沿着 $x$ 轴的方向 (图 7-3 中左右方向为 $x$ 轴方向) 上移动, 图 7-3(a)到(c)的图形变化是改变一次项 $d x$ 的系数 $d$ 由 $-30 \rightarrow 0 \rightarrow 30$ 变化得到的。另外, 也可以看出, 当 $d=0$ 时, 曲面的图形相对于 $y$ 轴是对称的 (见图 7-3(b)), 平移后图形明显与坐标轴不再对称了 (见图 7-3(c))。  通过以上的图形可以看出, 由二次函数的二次项的系数就可以完全看出图形的类型。一次项和常数项并不能影响图形类型的本身。至此我们可以有个总结就是, 如果考察几何图形, 对于 $f(x, y)=a x^2+b x y+c y^2+d x+e y+f$ 类的函数, 只需考察 $f(x, y)=a x^2+b x y+c y^2$ 的形式就可以了。换句话说, 我们只研究这个二次函数的二次项就可以了。 ## 定义 定义1 含有 $n$ 个变量 $x_1, x_2... x_n$ 的二次齐次多项式 $$ \begin{aligned} & f\left(x_1, x_2, \cdots, x_n\right)=a_{11} x_1^2+2 a_{12} x_1 x_2+2 a_{13} x_1 x_3+\cdots+2 a_{1, n} x_1 x_n \\ & +a_{22} x_2^2+2 a_{23} x_2 x_3+\cdots+2 a_{2, n} x_2 x_n+\cdots+a_{n-1, n-1} x_{n-1}^2+2 a_{n-1, n} x_{n-1} x_n+a_{m n} x_n^2 \end{aligned} $$ 称为二次型. 如果所有系数 $a_{i j}(1 \leq i, j \leq n)$ 均为实数,则称二次型为实二次型. 特别地, 如果 $n$ 元二次型 $f\left(x_1, x_2, \cdots, x_n\right)$ 只含有平方项,即 $$ f\left(x_1, x_2, \cdots, x_n\right)=k_1 x_1^2+k_2 x_2^2+\cdots+k_n x_n^2 , $$ 称这样的二次型为二次型的标准形. 如果标准形的系数 $k_1, k_2, \cdots, k_n$ 只在 $1,-1,0$ 三个数中 取值,也就是 $$ f\left(x_1, x_2, \cdots, x_n\right)=x_1^2+\cdots+x_p^2-x_{p+1}^2-\cdots-x_r^2, $$ 就称其为二次型的规范形.  记 $$ \boldsymbol{A}=\left(\begin{array}{cccc} a_{11} & a_{12} & \cdots & a_{1 n} \\ a_{21} & a_{22} & \cdots & a_{2 n} \\ \vdots & \vdots & & \vdots \\ a_{n 1} & a_{n 2} & \cdots & a_{n n} \end{array}\right), \quad \boldsymbol{x}=\left(\begin{array}{l} x_1 \\ x_2 \\ \vdots \\ x_n \end{array}\right), $$ 则二次型可记作 $$ f(\boldsymbol{x})=\boldsymbol{x}^{\mathrm{T}} \boldsymbol{A} \boldsymbol{x}, $$ 其中 $A$ 为对称阵. 例如,二次型 $f=x_1^2-3 x_3^2-4 x_1 x_2+x_2 x_3$ 用矩阵记号写出来,就是 $$ f\left(x_1, x_2, x_3\right)=\left(x_1, x_2, x_3\right)\left(\begin{array}{ccc} 1 & -2 & 0 \\ -2 & 0 & \frac{1}{2} \\ 0 & \frac{1}{2} & -3 \end{array}\right)\left(\begin{array}{l} x_1 \\ x_2 \\ x_3 \end{array}\right) . $$ ## 几何意义 二次型中二次项的系数构成了矩阵, 这个构成如下对应关系:  上述对应关系显示, 在写二次型的矩阵时, 要将交叉项 $x_i x_j$ 的系数 $a_{i j}$ 一分为二, 分别放在矩阵的第 $(i, j)$ 和 $(j, i)$ 的位置上, 而平方项 $x_i^2$ 的系数 $a_{i i}$ 就直接放在矩阵的对角线上的 $(i, i)$ 位置上。 显然, 二次型的矩阵将是一个实对称矩阵。有人会问, 为啥要把交叉项的系数一分为二的放? 因为这样处理我们会得到一个对称矩阵, 对称矩阵有很优良的性质, 对处理二次型方便很多。再说了, 不这样把系数对半分的话, 一个二次型将有无数个矩阵相对应, 麻烦大了。 可见, 任给一个二次型, 就唯一确定一个对称矩阵; 反之, 任给一个对称矩阵, 也就唯一确定一个二次型。其中矩阵 $\left[\begin{array}{cccc}a_{11} & a_{12} & \cdots & a_{1 n} \\ a_{12} & a_{22} & \cdots & a_{2 n} \\ \vdots & \vdots & & \vdots \\ a_{1 n} & a_{2 n} & \cdots & a_{n n}\end{array}\right]$ 被称为二次型 $f\left(x_1, x_2, \cdots, x_n\right)$ 的矩阵。 改写其为矩阵形式的表达式 $f(\boldsymbol{x})=\boldsymbol{x}^{\mathrm{T}} \boldsymbol{A} \boldsymbol{x}$ 是为了方便。那么, 今后对二次型的研究就归结到对实对称矩阵的研究上来。 ## 物理意义 二次型的几何图形是二次曲线或曲面, 多元的二次型图形是超二次曲线或曲面, 这也算是二次型的几何意义, 不过是解析意义而不是向量意义, 它们是向量末端集合的图形。如果在复数域上讨论向量, 则可以说二次型的几何意义是向量的长度的平方, 而且就是向量在不同坐标系下长度的平方。我们来看: $n$ 维向量在标准正交基下的坐标式为 $\boldsymbol{x}=\left(x_1, x_2, \cdots, x_n\right)$, 那么它的长度的平方就是 $$ |\boldsymbol{x}|^2=\left(\sqrt{x_1^2+x_2^2+\cdots+x_n^2}\right)^2=x_1^2+x_2^2+\cdots+x_n^2 $$ 这就是二次型的规范形。 这个向量如果放在一个保持单位和坐标轴正交关系都不变的新坐标系(基的正交变换)下,那么向量长度重新表示为 $$ |\boldsymbol{x}|^2=\left(x_1^{\prime}\right)^2+\left(x_2^{\prime}\right)^2+\cdots+\left(x_n^{\prime}\right)^2=x_1^{\prime 2}+x_2^{\prime 2}+\cdots+x_n^{\prime 2} $$ 这也是二次型的规范形。 这个向量如果放在一个保持坐标轴正交关系不变但单位不同的新坐标系下, 那么向量长度重新表示为 $$ |\boldsymbol{x}|^2=\left(a_1 x_1^{\prime}\right)^2+\left(a_2 x_2^{\prime}\right)^2+\cdots+\left(a_n x_n^{\prime}\right)^2=a_1^2 x_1^{\prime 2}+a_2^2 x_2^{\prime 2}+\cdots+a_n^2 x_n^{\prime 2} $$ 这就是二次型的标准形。 这个向量如果放在一个任意的 $n$ 维新坐标系下, 这个新基的度量矩阵为 $S$, 那么向量长度由推广的内积定义重新表示为 $$ |\boldsymbol{x}|^2=\left(\sqrt{\boldsymbol{x}^{\prime \mathrm{T}} \boldsymbol{S} \boldsymbol{x}^{\prime}}\right)^2=\boldsymbol{x}^{\prime \mathrm{T}} \boldsymbol{S} \boldsymbol{x}^{\prime}=\left(x_1^{\prime}, x_2^{\prime}, \cdots, x_n^{\prime}\right)\left[\begin{array}{cccc} a_{11} & a_{12} & \cdots & a_{1 n} \\ a_{12} & a_{22} & \cdots & a_{2 n} \\ \vdots & \vdots & & \vdots \\ a_{1 n} & a_{2 n} & \cdots & a_{n n} \end{array}\right]\left(\begin{array}{c} x_1^{\prime} \\ x_1^{\prime} \\ \vdots \\ { }_2 \\ x_n^{\prime} \end{array}\right) $$ 这就是二次型的一般形式。 一句话, 二次型是向量的长度的平方, 这个平方值不随坐标基的变化而变化, 是个不变量,是绝对性的, 而二次型函数的数学表达式却随着坐标基的变化而变化。 那么二次型有物理意义吗? 是的, 有对应的物理解释。 因为二次型和广义内积的联系, 咱自然而然地把它的物理意义与距离以及能量联系在一起。二次圆雉曲线首先是和距离联系在一起的。比如: 圆的轨迹是与到原点的距离为恒常数联系在一起的, 用向量函数可表示为 $(x, y)\left[\begin{array}{ll}1 & 0 \\ 0 & 1\end{array}\right]\left(\begin{array}{l}x \\ y\end{array}\right)=f$; 椭圆的轨迹是与到两个焦点的距离的和是恒常数联系在一起的, 用向量函数可表示为: $(x, y)\left[\begin{array}{ll}a & 0 \\ 0 & b\end{array}\right]\left(\begin{array}{l}x \\ y\end{array}\right)=f$; 双曲线的轨迹是与到两个焦点的距离的差是恒常数联系在一起的, 用向量函数可表示为 $(x, y)\left[\begin{array}{cc}a & 0 \\ 0 & -b\end{array}\right]\left(\begin{array}{l}x \\ y\end{array}\right)=f$; 抛物线的轨迹是到一个点 (焦点) 的距离等于到一根直线 (准线) 的距离的点联系在一起的, 用向量函数可表示为 $(x, y)\left[\begin{array}{ll}0 & 0 \\ 0 & 1\end{array}\right]\left(\begin{array}{l}x \\ y\end{array}\right)=(d, 0)\left(\begin{array}{l}x \\ y\end{array}\right)$, 即 $(x, y)\left[\begin{array}{ll}0 & 0 \\ 0 & 1\end{array}\right]\left(\begin{array}{l}x \\ y\end{array}\right)+(-d, 0)\left(\begin{array}{l}x \\ y\end{array}\right)=0$ 。
上一篇:
实对称矩阵的特征值和特征向量的性质
下一篇:
用正交变换化二次型为标准形
知识库是科数网倾心打造的大型数学知识网站,欢迎各位老师、数学爱好者加入,联系微信 18155261033, 制作不易,也欢迎
赞助
本站。