科数网
首页
高中数学
高等数学
线性代数
概率统计
实变函数
复变函数
离散数学
数论
群论
搜索
公式
高中数学公式
高等数学公式
线性代数公式
概率论公式
初中数学公式
关于
高中
高数
线性
概率
复变
搜索
游客,
登录
注册
在线学习
线性代数
第七篇 二次型与正定型
二次型的意义
最后
更新:
2025-01-09 16:02
●
参与者
查看:
456
次
纠错
分享
参与项目
词条搜索
二次型的意义
## 为什么研究二次项? 二次型是变量的二次乘积项的和, 类似于 $a x^2+b x y+c y^2$ 的多项式子, 一般包括两个变量乘积项和一个变量平方两种形式。二次型是个函数, 如上式可以写成 $f(x, y)=a x^2+b x y+c y^2$ 的等式形式。 有人疑惑: 这个多项式不是线性函数啊, 这二次型和线性代数有什么关系? 我们知道, 一个一元 $n$ 次多项式可以用一个向量来表示, 次数不超过 $n$ 的多项式全体可以构成一个向量空间。那么一个二次型是一个二元二次多项式, 是不是也可以用向量表示出来?基本答对了! 这个二元二次型可以用几个向量的联合一一矩阵来表示! 如果我们把函数 $f(x, y)=a x^2+b x y+c y^2$ 的自变量换一下, 把单变量 $x 、 y$ 合成一个变向量 $\boldsymbol{x}$,即 $\boldsymbol{x}=(x, y)$, 那么再引入矩阵, 原二元二次函数就可以改写成一元二次向量函数: $$ f(x)=\left(\begin{array}{ll} x & y \end{array}\right)\left[\begin{array}{ll} a & \frac{b}{2} \\ \frac{b}{2} & c \end{array}\right]\left(\begin{array}{l} x \\ y \end{array}\right) $$ 这个样子的向量函数就是传说中的二次型 (其中的矩阵要写成对称矩阵)。这个对称矩阵: $$ \left[\begin{array}{cc} a & \frac{b}{2} \\ \frac{b}{2} & c \end{array}\right] $$ 就可以表示二次型 $f(x, y)=a x^2+b x y+c y^2$ 。 嘿, 改写成这个样子后, 又有向量又有矩阵, 果然是线性代数的内容。一旦改写成这个样子就可以利用矩阵的强大功能了。其实, 前面讲的矩阵的各种变换还真不能直接利用, 因此人们又发明了矩阵的合同变换应用到二次型的研究上。 其实,二次型的内容就是研究线性空间里的一个几何图形如何在不同的坐标基下的不同的矩阵表示,合同的矩阵表示的是同一个二次函数的几何图形 (这可能是“合同”吩称的由来)。 二次型的应用广泛, 比如信号处理里面的噪声功率、物理学里面的势能和动能、力学里面的惯性张量矩阵、微分几何中曲面的法曲率和统计学里的置信椭圆体等, 这些函数都是二次的,都可以转化为二次型对称矩阵的研究。 我们不应觉得奇怪, 比如功率是电压电流的乘积二次项, 动能的公式 $m v^2 / 2$ 中有平方项出现。据说二次型起源于解析几何中三维坐标系下二次曲线、二次曲面方程的研究。然而一般的 $n$ 元二次型的一些概念和理论, 比起解析几何中二次曲线及曲面的概念和理论, 已变得有点抽象。但由于它们之间的内在联系, 使得我们可以将二次曲线及曲面的几何图形用于理解二次型的几何意义。比如, 二次型的一个典型的应用就是对诸如椭圆曲面、双曲抛物面之类的二次曲面进行清晰地分类。因此, 在正式引入二次型的定义前, 俺想从二次曲面图形的绘制开始讨论。 **二次函数的哪些系数对图形是重要的** 在中学的解析几何中, 对于一元二次函数 $f(x)=a x^2$ 在二维平面上看 (把函数值看做 $y$ 轴: $y=a x^2$ ) 我们有非常清晰的几何图形, 就是过原点的抛物线: $a>0$ 开口向上, 整个曲线在横坐标之上; $a<0$ 开口向下, 整个曲线在横坐标之下; $a=0$, 抛物线蜕化成直线 $x$ 轴。 那么对于函数 $f(x)=a x^2+c$ 图形呢? 我们依然清晰地知道, 这是一条在纵轴方向平移后的图形, 仍是一条抛物线或直线, 偏离原点了, 但图形仍然相同。 那么对于函数 $f(x)=a x^2+b x+c$ 图形呢? 虽然不是那么清晰了, 但我们依然知道这也是一条偏离原点的抛物线或直线, 只不过在横轴和纵轴方向上同时进行了平移, 但图形仍然相同。因为可以把它经过配方得到上面的形式: $$ f(x)=a x^2+b x+c=a\left(x+\frac{b}{2 a}\right)^2+\left(c-\frac{b^2}{4 a}\right) $$ 到这里我们有一个小小的结论, 就是三个函数的几何图形是合同的, 合同的意思是它们经过平移后图形会完全重合。 既然是这样, 如果是要考察几何图形的话, 对于 $f(x)=a x^2+b x+c$ 类的函数我们只要考察 $f(x)=a x^2$ 的形式就可以了。换句话说, 我们只需研究这个二次函数的二次项。 对于二元二次函数, 同样有类似的情况。 二元函数 $f(x, y)=a x^2+c y^2$ 的图形在三维空间中观看 (即 $z=a x^2+c y^2$ ), 其典型的图形是粗圆抛物面或双曲抛物面 (见图 7-1, 至于其退化图形如抛物柱面等我们不再提及), 其中的双曲拋物面俗称马鞍面, 如图 7-1 (b) 所示。 ![图片](/uploads/2023-11/image_20231106e25c4e8.png) 在图中, 添加了一个平行于 $x o y$ 平面的平面。平面与曲面的相交线让我们清晰地看出, 椭圆抛物面的交线是椭圆, 双曲抛物面的交线是双曲线 (之所以称之为抛物面, 是因为曲面与 $x o z$ 、 $y o z$ 平行平面的交线是抛物线)。 对于添加了交叉项的二元函数 $f(x, y)=a x^2+b x y+c y^2$ 的图形, 在三维空间中观看(即令 $z=a x^2+b x y+c y^2$ ), 其典型的图形同样是椭圆抛物面或双曲拋物面, 只是它们的图形在坐标 比如上面的双曲抛物面图形, 如果我们改变系数 $b$ 的值, 通过与平面的截线的变化看出曲面在旋转, 图 7-2(a)到(c)的图形变化是改变交叉项 $b x y$ 的系数 $b$ 由 $-5 \rightarrow 0 \rightarrow 5$ 变化得到的。可以看出, 双曲抛物面向右进行了旋转, 同时曲面的形状发生了一些不明显的伸缩变化 (再伸缩也是双曲抛物面)。另外可以看出, 当 $b=0$ 即 $f(x, y)=a x^2+c y^2$ 时, 曲面的图形相对于 $x$ 和 $y$ 轴是对称的 (见图 7-2(b)), 旋转后图形明显与坐标轴不再对称了 (见图 7-2(c))。 ![图片](/uploads/2023-11/image_2023110666fb3d3.png) 我们再来看看一般的二元二次函数 $f(x, y)=a x^2+b x y+c y^2+d x+e y+f$ 的图形, 函数式与前者比较看来, 式中增添了一次项和常数项。根据一元二次函数的经验, 增添了一次项和常数项的函数图形只是把原来的图形在各个坐标轴 $(x, y, z)$ 方向上分别平移了一个距离。对于二元函数来说同样如此。 比如双曲抛物面图形, 如果我们改变函数系数 $d$ 的值, 通过与平面的截线的变化看出曲面在沿着 $x$ 轴的方向 (图 7-3 中左右方向为 $x$ 轴方向) 上移动, 图 7-3(a)到(c)的图形变化是改变一次项 $d x$ 的系数 $d$ 由 $-30 \rightarrow 0 \rightarrow 30$ 变化得到的。另外, 也可以看出, 当 $d=0$ 时, 曲面的图形相对于 $y$ 轴是对称的 (见图 7-3(b)), 平移后图形明显与坐标轴不再对称了 (见图 7-3(c))。 ![图片](/uploads/2023-11/image_20231106e59ff45.png) 通过以上的图形可以看出, 由二次函数的二次项的系数就可以完全看出图形的类型。一次项和常数项并不能影响图形类型的本身。至此我们可以有个总结就是, 如果考察几何图形, 对于 $f(x, y)=a x^2+b x y+c y^2+d x+e y+f$ 类的函数, 只需考察 $f(x, y)=a x^2+b x y+c y^2$ 的形式就可以了。换句话说, 我们只研究这个二次函数的二次项就可以了。 > 二元二次函数的几何图形是否合同呢?包含变量交叉项的函数的图形较不包含交叉项的函数图形发生了旋转和伸缩变化,如果只是旋转,图形是一样合同的;如果图形再伸缩变化,就不一定了,比如原来同一平面的截线是一个圆,伸缩变化后变成了一个大圆或一个小圆甚至变成了椭圆形,这还叫合同吗?看起来几何图形不是合同的:大圆与小圆硬说是合同还勉强些,但椭圆和圆无论如何不能重合啊。看来合同的含义有问题啊。这个问题可以解决,解决的方法是先假定几何图形是不变的,类同一个刚体,函数式变了的原因是因为坐标系变了……这样就可以自圆其说了——可以把椭圆说成是圆——都是同一个刚体的在不同坐标系下的像……这其实正是二次型的内涵 ### 二次函数与二次方程的关系 比如二元二次型函数: $$ f(x, y)=\frac{1}{4} x^2+y^2 (7.1) $$ 其几何图形绘制在三维坐标系 $\{o, x, y, z\}$ 中是一个椭圆抛物面。令 $f(x, y)=1$, 则截痕方程 $\frac{1}{4} x^2+y^2=1$ 在二维坐标系 $\{o, x, y\}$ 中的图形是椭圆。这个椭圆就是椭圆抛物面与平面 $z=1$ 的截线投影到到 xoy (或 $z=0$ ) 平面上的图形, 它与在平面 $z=1$ 上的椭圆完全相同, 即 $$ \left\{\begin{array}{l} z=f(x, y)=\frac{1}{4} x^2+y^2 \\ z=1 \end{array} \Rightarrow \frac{1}{4} x^2+y^2=1\right. $$ 其图形见图 7-4。 ![图片](/uploads/2024-09/fa7e95.jpg) 如果我们是二维的平面动物, 将无法看到二元二次型函数的 3 D 全貌, 但我们可以通过用平行平面多次截图, 并把截线投影到二维平面上来想象三维的图形。 由此可以推广为: 如果数域 $F$ 上一个 $n$ 元二次型是 $f\left(x_1, x_2, \ldots, x_n\right)$ ,则方程 $f\left(x_1, x_2, \ldots, x_n\right)=d$ 的图形就是:定义在 $F^n$ 的一个二次函数 $z=f\left(x_1, x_2, \ldots, x_n\right)$ ,它在 $n+1$ 维空间 $F^{n+1}$ 的图形(二次超曲面)与平面 $z=d$ 相截交,此截交线在 $F^{n+1}$ 的 $n$ 维子空间—— "坐标平面" $\left\{o, x_1, x_2, \cdots, x_n\right\}$ 上的正投影 (超曲线) 的图形。 ![图片](/uploads/2024-09/b17cec.jpg) 同样的,对于三元二次函数 $\varphi=f(x, y, z)$, 我们在一个三维坐标空间里同时绘制出 $\varphi$ 为不同数值的方程图形, 比如令 $\varphi$ 为负数、零和正数时的三维图形, 这些三维图形正是四维截痕图形的三维投影, 把这些投影大范围地组合起来, 就可以想象三元二次函数的四维图形了。 ### 通过坐标简化方程 二维平面空间中的几何图形比如圆、椭圆、抛物线及双曲线等也属于二次曲线图形, 这些曲线又称为圆锥曲线,因为它们可以看成是由平面和双圆雉面相交而得到的截线,见图7-7。 双圆锥面和平面相截交的方程组是 $$ \left\{\begin{array}{l} f(x, y)=a x^2+2 b x y+c y^2+d x+e y+f \\ f(x, y)=g \end{array}\right. $$ 其中, $f(x, y)=g$ 就是那个截平面方程。由此, 平面上的二次曲线的一般形式为 $$ a x^2+2 b x y+c y^2+d x+e y+f=0 $$ 那么此方程的向量及矩阵的形式可以是 $$ (x, y)\left[\begin{array}{ll} a & b \\ b & c \end{array}\right]\binom{x}{y}+(d, e)\binom{x}{y}+(f)=(0) $$ (注: $x y$ 的系数写为 $2 b$ 是为了得到矩阵方程的一般形式。) ![图片](/uploads/2024-09/ac281e.jpg) 根据我们中学的经验, 如果把方程 (7-2) 化简为 $a^{\prime} x^{\prime 2}+c^{\prime} y^{\prime 2}=f^{\prime}$ 的形式, 我们就比较容易看出来是椭圆还是双曲线等。下面我们对方程进行分类分析, 看如何化简成想要的形式。 对于不包含交叉项的方程 ( $b=0$ 时) $a x^2+c y^2+d x+e y+f=0$, 我们可以对它进行配方得到 $a^{\prime}(x+g)^2+c^{\prime}(y+h)^2=f^{\prime}$ 的形式, 并对它进一步进行平移变换: $$ \left\{\begin{array}{l} x^{\prime}=x+g \\ y^{\prime}=y+h \end{array} \text { 或 }\binom{x^{\prime}}{y^{\prime}}=\binom{x}{y}+\binom{g}{h}\right. $$ 平移变换使曲线的对称中心平移到坐标原点, 进而得到想要的形式 $a^{\prime} x^{\prime 2}+c^{\prime} y^{\prime 2}=f^{\prime}$ 。 对于只剩下二次项和常数项的方程形式, 也就是二次曲线的对称中心与坐标原点重合时,其方程形式为 $$ a x^2+2 b x y+c y^2=f $$ 为了判别该曲线的类型, 需要作坐标旋转, 消去乘积项 $2 b x y$, 只含平方项。引入旋转线性变换: $$ \left\{\begin{array}{l} x=x^{\prime} \cos \theta-y^{\prime} \sin \theta \\ y=x^{\prime} \sin \theta-y^{\prime} \cos \theta \end{array} \text { 或 }\binom{x}{y}=\left[\begin{array}{ll} \cos \theta & -\sin \theta \\ \sin \theta & -\cos \theta \end{array}\right]\binom{x^{\prime}}{y^{\prime}}\right. $$ 代入二次曲线方程, 简化得到想要的方程形式 $a^{\prime} x^{\prime 2}+c^{\prime} y^{\prime 2}=f^{\prime}$ 。 实际上, 对于完整的方程 (7-2) 的形式, 应该先进行旋转变换, 消掉交叉项, 然后再进行平移变换,消掉一次项,才能顺利地得到平方项形式的方程。 以上是中学的处理方法, 适用于低维的空间。随着二次函数的变量的增加, 函数变得更加复杂起来。为了方便研究二次函数, 需要使用向量和矩阵工具来分析。比如, 方程是高维空间的函数如下: $$ a_1 x_1^2+a_2 x_2^2+\cdots+a_n x_n^2+2 b_{12} x_1 x_2+2 b_{13} x_1 x_3+\cdots+2 b_{n-1, n} x_{n-1} x_n+c_1 x_1+c_2 x_2+\cdots+c_n x_n+f=0 $$ 一次线性部分仍然可以配方法处理, 但首先二次交叉项如何处理呢, 如何确定这个高维空间里的旋转变换呢?好复杂,类似前面的写法,把它改写成向量方程就简洁多了: $$ \left(x_1, x_2, \cdots, x_n\right)\left[\begin{array}{cccc} a_1 & b_{1,2} & \cdots & b_{1, n-1} \\ b_{1,2} & a_2 & \cdots & b_{2, n-1} \\ \vdots & \vdots & & \vdots \\ b_{1, n-1} & b_{2, n-1} & \cdots & a_n \end{array}\right]\left(\begin{array}{c} x_1 \\ x_2 \\ \vdots \\ x_n \end{array}\right)+\left(c_1, c_2, \cdots, c_n\right)\left(\begin{array}{c} x_1 \\ x_2 \\ \vdots \\ x_n \end{array}\right)+(f)=(0) $$ 等式左边这三部分当中,最左边的部分是最复杂、最重要、最需要研究的,我们把它拿出来专门研究。这么复杂的式子是否仍然可以用旋转变换消掉交叉项呢? 答案是肯定的。这就是我们研究二次项的主要目的 ## 附:二次型的物理意义 二次型的几何图形是二次曲线或曲面, 多元的二次型图形是超二次曲线或曲面, 这也算是二次型的几何意义, 不过是解析意义而不是向量意义, 它们是向量末端集合的图形。如果在复数域上讨论向量, 则可以说二次型的几何意义是向量的长度的平方, 而且就是向量在不同坐标系下长度的平方。我们来看: $n$ 维向量在标准正交基下的坐标式为 $\boldsymbol{x}=\left(x_1, x_2, \cdots, x_n\right)$, 那么它的长度的平方就是 $$ |\boldsymbol{x}|^2=\left(\sqrt{x_1^2+x_2^2+\cdots+x_n^2}\right)^2=x_1^2+x_2^2+\cdots+x_n^2 $$ 这就是二次型的规范形。 这个向量如果放在一个保持单位和坐标轴正交关系都不变的新坐标系(基的正交变换)下,那么向量长度重新表示为 $$ |\boldsymbol{x}|^2=\left(x_1^{\prime}\right)^2+\left(x_2^{\prime}\right)^2+\cdots+\left(x_n^{\prime}\right)^2=x_1^{\prime 2}+x_2^{\prime 2}+\cdots+x_n^{\prime 2} $$ 这也是二次型的规范形。 这个向量如果放在一个保持坐标轴正交关系不变但单位不同的新坐标系下, 那么向量长度重新表示为 $$ |\boldsymbol{x}|^2=\left(a_1 x_1^{\prime}\right)^2+\left(a_2 x_2^{\prime}\right)^2+\cdots+\left(a_n x_n^{\prime}\right)^2=a_1^2 x_1^{\prime 2}+a_2^2 x_2^{\prime 2}+\cdots+a_n^2 x_n^{\prime 2} $$ 这就是二次型的标准形。 这个向量如果放在一个任意的 $n$ 维新坐标系下, 这个新基的度量矩阵为 $S$, 那么向量长度由推广的内积定义重新表示为 $$ |\boldsymbol{x}|^2=\left(\sqrt{\boldsymbol{x}^{\prime \mathrm{T}} \boldsymbol{S} \boldsymbol{x}^{\prime}}\right)^2=\boldsymbol{x}^{\prime \mathrm{T}} \boldsymbol{S} \boldsymbol{x}^{\prime}=\left(x_1^{\prime}, x_2^{\prime}, \cdots, x_n^{\prime}\right)\left[\begin{array}{cccc} a_{11} & a_{12} & \cdots & a_{1 n} \\ a_{12} & a_{22} & \cdots & a_{2 n} \\ \vdots & \vdots & & \vdots \\ a_{1 n} & a_{2 n} & \cdots & a_{n n} \end{array}\right]\left(\begin{array}{c} x_1^{\prime} \\ x_1^{\prime} \\ \vdots \\ { }_2 \\ x_n^{\prime} \end{array}\right) $$ 这就是二次型的一般形式。 一句话, 二次型是向量的长度的平方, 这个平方值不随坐标基的变化而变化, 是个不变量,是绝对性的, 而二次型函数的数学表达式却随着坐标基的变化而变化。 那么二次型有物理意义吗? 是的, 有对应的物理解释。 因为二次型和广义内积的联系, 咱自然而然地把它的物理意义与距离以及能量联系在一起。二次圆雉曲线首先是和距离联系在一起的。比如: 圆的轨迹是与到原点的距离为恒常数联系在一起的, 用向量函数可表示为 $(x, y)\left[\begin{array}{ll}1 & 0 \\ 0 & 1\end{array}\right]\left(\begin{array}{l}x \\ y\end{array}\right)=f$; 椭圆的轨迹是与到两个焦点的距离的和是恒常数联系在一起的, 用向量函数可表示为: $(x, y)\left[\begin{array}{ll}a & 0 \\ 0 & b\end{array}\right]\left(\begin{array}{l}x \\ y\end{array}\right)=f$; 双曲线的轨迹是与到两个焦点的距离的差是恒常数联系在一起的, 用向量函数可表示为 $(x, y)\left[\begin{array}{cc}a & 0 \\ 0 & -b\end{array}\right]\left(\begin{array}{l}x \\ y\end{array}\right)=f$; 抛物线的轨迹是到一个点 (焦点) 的距离等于到一根直线 (准线) 的距离的点联系在一起的, 用向量函数可表示为 $(x, y)\left[\begin{array}{ll}0 & 0 \\ 0 & 1\end{array}\right]\left(\begin{array}{l}x \\ y\end{array}\right)=(d, 0)\left(\begin{array}{l}x \\ y\end{array}\right)$, 即 $(x, y)\left[\begin{array}{ll}0 & 0 \\ 0 & 1\end{array}\right]\left(\begin{array}{l}x \\ y\end{array}\right)+(-d, 0)\left(\begin{array}{l}x \\ y\end{array}\right)=0$ 。 实际上, 上述的向量函数不是直接与距离的量联系在一起, 而是与距离的乘积或距离的平方联系在一起的, 或者说向量函数实际上是与内积的概念直接联系的。 前面讲过, 一般的二次型向量方程如下: $$ \left(x_1, x_2, \cdots, x_n\right)\left[\begin{array}{cccc} a_1 & b_{1,2} & \cdots & b_{1, n-1} \\ b_{1,2} & a_2 & \cdots & b_{2, n-1} \\ \vdots & \vdots & & \vdots \\ b_{1, n-1} & b_{2, n-1} & \cdots & a_n \end{array}\right]\left(\begin{array}{c} x_1 \\ x_2 \\ \vdots \\ x_n \end{array}\right)+\left(c_1, c_2, \cdots, c_n\right)\left(\begin{array}{c} x_1 \\ x_2 \\ \vdots \\ x_n \end{array}\right)+(f)=(0) $$ 这个方程细看起来有点意思: $(f)$ 是一个实数值; $\left(c_1, c_2, \cdots, c_n\right)\left(\begin{array}{c}x_1 \\ x_2 \\ \vdots \\ x_n\end{array}\right)$ 的形式就是内积运算, 是常向量和变向量的内积, 结果是一个实变量; $\left(x_1, x_2, \cdots, x_n\right)\left[\begin{array}{cccc}a_1 & b_{1,2} & \cdots & b_{1, n-1} \\ b_{1,2} & a_2 & \cdots & b_{2, n-1} \\ \vdots & \vdots & & \vdots \\ b_{1, n-1} & b_{2, n-1} & \cdots & a_n\end{array}\right]\left(\begin{array}{c}x_1 \\ x_2 \\ \vdots \\ x_n\end{array}\right)$ 的形式也是内积运算, 是同一个向量与自己的内积 (即长度的平方), 确切的讲是推广的内积运算 (参见第四章的内积推广部分), 结果也是一个实变量; 如果把 $(f)$ 也看做内积, 那么这三部分都是内积, 方程 (7-3) 就是三个内积和等于 0 。 因此二次型就具有了内积所具有的物理意义, 比如向量的元素都是速度的值, 那么二次型就有总能量的意义。让二次型等于一个实数, 就是说, 向量运动总是保持这个值不变一一能量守恒, 这样二次型的图形就是能量守恒时向量的运动的轨迹一一难怪圆雉曲线可以描述天体运动的规律。难怪狭义相对论中的度规不变量是一个二次型(进一步的解释放在了本章的最后一节)。 如果在复向量空间里定义内积, 那么二次型的对称矩阵也就完全类同于内积的度量矩阵的含义了。 其实二次型和内积都属于一种更广泛意义的函数一一双线性函数。如用双线性来理解二次型, 我们才能安然地接受二次型也属于线性代数的研究范盽。
上一篇:
没有了
下一篇:
二次型的定义
本文对您是否有用?
有用
(
0
)
无用
(
0
)
学习导航:
初中数学
高中数学
高中物理
高等数学
线性代数
概率论与数理统计
复变函数
离散数学
实变函数
数论
群论
搜索
纠错
题库
高考
考研
关于本站
广告赞助
App下载
科数网是专业专业的数学网站。