科数网
首页
题库
试卷
学习
VIP
你好
游客,
登录
注册
在线学习
线性代数
第七篇 二次型与正定型
二次型的意义
最后
更新:
2025-04-24 21:40
查看:
653
次
反馈
同步训练
二次型的意义
## 为什么研究二次项? 二次型是变量的二次乘积项的和, 类似于 $a x^2+b x y+c y^2$ 的多项式子, 一般包括两个变量乘积项和一个变量平方两种形式。二次型是个函数, 如上式可以写成 $f(x, y)=a x^2+b x y+c y^2$ 的等式形式。 有人疑惑: 这个多项式不是线性函数啊, 这二次型和线性代数有什么关系? 我们知道, 一个一元 $n$ 次多项式可以用一个向量来表示, 次数不超过 $n$ 的多项式全体可以构成一个向量空间。那么一个二次型是一个二元二次多项式, 是不是也可以用向量表示出来?基本答对了! 这个二元二次型可以用几个向量的联合一一矩阵来表示! 如果我们把函数 $f(x, y)=a x^2+b x y+c y^2$ 的自变量换一下, 把单变量 $x 、 y$ 合成一个变向量 $\boldsymbol{x}$,即 $\boldsymbol{x}=(x, y)$, 那么再引入矩阵, 原二元二次函数就可以改写成一元二次向量函数: $$ f(x)=\left(\begin{array}{ll} x & y \end{array}\right)\left[\begin{array}{ll} a & \frac{b}{2} \\ \frac{b}{2} & c \end{array}\right]\left(\begin{array}{l} x \\ y \end{array}\right) $$ 这个样子的向量函数就是传说中的二次型 (其中的矩阵要写成对称矩阵)。这个对称矩阵: $$ \left[\begin{array}{cc} a & \frac{b}{2} \\ \frac{b}{2} & c \end{array}\right] $$ 就可以表示二次型 $f(x, y)=a x^2+b x y+c y^2$ 。 嘿, 改写成这个样子后, 又有向量又有矩阵, 果然是线性代数的内容。一旦改写成这个样子就可以利用矩阵的强大功能了。其实, 前面讲的矩阵的各种变换还真不能直接利用, 因此人们又发明了矩阵的合同变换应用到二次型的研究上。 其实,二次型的内容就是研究线性空间里的一个几何图形如何在不同的坐标基下的不同的矩阵表示,合同的矩阵表示的是同一个二次函数的几何图形 (这可能是“合同”吩称的由来)。 二次型的应用广泛, 比如信号处理里面的噪声功率、物理学里面的势能和动能、力学里面的惯性张量矩阵、微分几何中曲面的法曲率和统计学里的置信椭圆体等, 这些函数都是二次的,都可以转化为二次型对称矩阵的研究。 我们不应觉得奇怪, 比如功率$P=UI$是电压电流的乘积二次项, 动能的公式 $m v^2 / 2$ 中有平方项出现。据说二次型起源于解析几何中三维坐标系下二次曲线、二次曲面方程的研究。然而一般的 $n$ 元二次型的一些概念和理论, 比起解析几何中二次曲线及曲面的概念和理论, 已变得有点抽象。但由于它们之间的内在联系, 使得我们可以将二次曲线及曲面的几何图形用于理解二次型的几何意义。比如, 二次型的一个典型的应用就是对诸如椭圆曲面、双曲抛物面之类的二次曲面进行清晰地分类。因此, 在正式引入二次型的定义前, 我们想从二次曲面图形的绘制开始讨论。 ## 二次函数的哪些系数对图形是重要的 在中学的解析几何中, 对于一元二次函数 $f(x)=a x^2$ 在二维平面上看 (把函数值看做 $y$ 轴: $y=a x^2$ ) 我们有非常清晰的几何图形, 就是过原点的抛物线: $a>0$ 开口向上, 整个曲线在横坐标之上; $a<0$ 开口向下, 整个曲线在横坐标之下; $a=0$, 抛物线蜕化成直线 $x$ 轴。 那么对于函数 $f(x)=a x^2+c$ 图形呢? 我们依然清晰地知道, 这是一条在纵轴方向平移后的图形, 仍是一条抛物线或直线, 偏离原点了, 但图形仍然相同。 那么对于函数 $f(x)=a x^2+b x+c$ 图形呢? 虽然不是那么清晰了, 但我们依然知道这也是一条偏离原点的抛物线或直线, 只不过在横轴和纵轴方向上同时进行了平移, 但图形仍然相同。因为可以把它经过配方得到上面的形式: $$ f(x)=a x^2+b x+c=a\left(x+\frac{b}{2 a}\right)^2+\left(c-\frac{b^2}{4 a}\right) $$ 到这里我们有一个小小的结论, 就是三个函数的几何图形是合同的, 合同的意思是它们经过平移后图形会完全重合。 既然是这样, 如果是要考察几何图形的话, 对于 $f(x)=a x^2+b x+c$ 类的函数我们只要考察 $f(x)=a x^2$ 的形式就可以了。换句话说, 我们只需研究这个二次函数的二次项的性质就能大致推导出通用二次项的性质。 对于二元二次函数, 同样有类似的情况。二元函数 $f(x, y)=a x^2+c y^2$ 的图形在三维空间中观看 (即 $z=a x^2+c y^2$ ), 其典型的图形是椭圆抛物面或双曲抛物面 (见图 7-1, 至于其退化图形如抛物柱面等我们不再提及), 其中的双曲拋物面俗称马鞍面, 如图 7-1 (b) 所示。  在上图中, 添加了一个平行于 $x o y$ 平面的平面。平面与曲面的相交线让我们清晰地看出, 椭圆抛物面的交线是椭圆, 双曲抛物面的交线是双曲线 (之所以称之为抛物面, 是因为曲面与 $x o z$ 、 $y o z$ 平行平面的交线是抛物线)。 对于添加了交叉项的二元函数 $f(x, y)=a x^2+b x y+c y^2$ 的图形, 在三维空间中观看(即令 $z=a x^2+b x y+c y^2$ ), 其典型的图形同样是椭圆抛物面或双曲拋物面, 只是它们的图形在坐标上进行了移动。 比如上面的双曲抛物面图形, 如果我们改变系数 $b$ 的值, 通过与平面的截线的变化看出曲面在旋转, 图 7-2(a)到(c)的图形变化是改变交叉项 $b x y$ 的系数 $b$ 由 $-5 \rightarrow 0 \rightarrow 5$ 变化得到的。可以看出, 双曲抛物面向右进行了旋转, 同时曲面的形状发生了一些不明显的伸缩变化 (再伸缩也是双曲抛物面)。另外可以看出, 当 $b=0$ 即 $f(x, y)=a x^2+c y^2$ 时, 曲面的图形相对于 $x$ 和 $y$ 轴是对称的 (见图 7-2(b)), 旋转后图形明显与坐标轴不再对称了 (见图 7-2(c))。  > 现在你明白,为什么我们研究二次函数不带常数项了吧,因为常数项(比如 $+5,-10$)可以通过普通的二次函数上下平移得到。 再来,为什么二次型里不研究一次项比,因为一次项(比如$3x+4y$)类似坐标轴可以左右移动得到。稍后可以看到,对于交叉项,是我们研究的重点,我们的目的首先是**消灭交叉项**,对于 $xy$ 这样的交叉项,如果令 $x=m+n$,$y=m-n$, 那么 $xy$ 就变成了 $m^2-n^2$ 这样就可以把交叉项去掉,这种变量替换就是后面二次型化标准型的方法之一。 我们再来看看一般的二元二次函数 $f(x, y)=a x^2+b x y+c y^2+d x+e y+f$ 的图形, 函数式与前者比较看来, 式中增添了一次项和常数项。根据一元二次函数的经验, 增添了一次项和常数项的函数图形只是把原来的图形在各个坐标轴 $(x, y, z)$ 方向上分别平移了一个距离。对于二元函数来说同样如此。 比如双曲抛物面图形, 如果我们改变函数系数 $d$ 的值, 通过与平面的截线的变化看出曲面在沿着 $x$ 轴的方向 (图 7-3 中左右方向为 $x$ 轴方向) 上移动, 图 7-3(a)到(c)的图形变化是改变一次项 $d x$ 的系数 $d$ 由 $-30 \rightarrow 0 \rightarrow 30$ 变化得到的。另外, 也可以看出, 当 $d=0$ 时, 曲面的图形相对于 $y$ 轴是对称的 (见图 7-3(b)), 平移后图形明显与坐标轴不再对称了 (见图 7-3(c))。  通过以上的图形可以看出, 由二次函数的二次项的系数就可以完全看出图形的类型。一次项和常数项并不能影响图形类型的本身。至此我们可以有个总结就是, 如果考察几何图形, 对于 $f(x, y)=a x^2+b x y+c y^2+d x+e y+f$ 类的函数, 只需考察 $f(x, y)=a x^2+b x y+c y^2$ 的形式就可以了。换句话说, 我们只研究这个二次函数的二次项就可以了。 #### 结论 通过上面的解释,对于通用的二次函数 $f(x, y)=a x^2+b x y+c y^2+d x+e y+f$ 我们可以忽略一次性和常数项,只研究二次项就可以了,即 $f(x, y)=a x^2+b x y+c y^2$ > **小结**:$f_1(x, y)=a x^2+b x y+c y^2+d x+e y+f$ 可以由 $f_2(x, y)=a x^2+b x y+c y^2$ 通过一系列旋转、平移得到。 由于$f_1$可以由$f_2$得到,因此,我们说$f_1$和$f_2$是“合同”的。 这里的合同不是日常生活中说的法律合同,这里的合同可以理解为通过坐标变换后图形“重合后相同” ## 通过坐标简化方程 二维平面空间中的几何图形比如圆、椭圆、抛物线及双曲线等也属于二次曲线图形, 这些曲线又称为圆锥曲线,因为它们可以看成是由平面和双圆锥面相交而得到的截线,见图7-7。 双圆锥面和平面相截交的方程组是 $$ \left\{\begin{array}{l} f(x, y)=a x^2+2 b x y+c y^2+d x+e y+f \\ f(x, y)=g \end{array}\right. $$ 其中, $f(x, y)=g$ 就是那个截平面方程。由此, 平面上的二次曲线的一般形式为 $$ x^2+2 b x y+c y^2+d x+e y+f=0 ...(7.2) $$ 那么此方程的向量及矩阵的形式可以表示为 $$ (x, y)\left[\begin{array}{ll} a & b \\ b & c \end{array}\right]\binom{x}{y}+(d, e)\binom{x}{y}+(f)=(0) $$ (注: $x y$ 的系数写为 $2 b$ 是为了得到矩阵方程的一般形式。) {width=500px} 根据我们中学的经验, 如果把方程 (7-2) 化简为 $a^{\prime} x^{\prime 2}+c^{\prime} y^{\prime 2}=f^{\prime}$ 的形式, 我们就比较容易看出来是椭圆还是双曲线等。下面我们对方程进行分类分析, 看如何化简成想要的形式。 对于不包含交叉项的方程 ( $b=0$ 时) $a x^2+c y^2+d x+e y+f=0$, 我们可以对它进行配方得到 $a^{\prime}(x+g)^2+c^{\prime}(y+h)^2=f^{\prime}$ 的形式, 并对它进一步进行平移变换: $$ \left\{\begin{array}{l} x^{\prime}=x+g \\ y^{\prime}=y+h \end{array} \text { 或 }\binom{x^{\prime}}{y^{\prime}}=\binom{x}{y}+\binom{g}{h}\right. $$ 平移变换使曲线的对称中心平移到坐标原点, 进而得到想要的形式 $a^{\prime} x^{\prime 2}+c^{\prime} y^{\prime 2}=f^{\prime}$ 。 对于只剩下二次项和常数项的方程形式, 也就是二次曲线的对称中心与坐标原点重合时,其方程形式为 $$ a x^2+2 b x y+c y^2=f $$ 为了判别该曲线的类型, 需要作坐标旋转, 消去乘积项 $2 b x y$, 只含平方项。为此引入旋转线性变换, 旋转矩阵解释参见[此处](https://kb.kmath.cn/kbase/detail.aspx?id=2605): $$ \left\{\begin{array}{l} x=x^{\prime} \cos \theta-y^{\prime} \sin \theta \\ y=x^{\prime} \sin \theta-y^{\prime} \cos \theta \end{array} \text { 或 }\binom{x}{y}=\left[\begin{array}{ll} \cos \theta & -\sin \theta \\ \sin \theta & -\cos \theta \end{array}\right]\binom{x^{\prime}}{y^{\prime}}\right. $$ 代入二次曲线方程, 简化得到想要的方程形式 $a^{\prime} x^{\prime 2}+c^{\prime} y^{\prime 2}=f^{\prime}$ 。 实际上, 对于完整的方程 (7-2) 的形式, 应该先进行旋转变换, 消掉交叉项, 然后再进行平移变换,消掉一次项,才能顺利地得到平方项形式的方程。 以上是中学的处理方法, 适用于低维的空间。随着二次函数的变量的增加, 函数变得更加复杂起来。为了方便研究二次函数, 需要使用向量和矩阵工具来分析。比如, 方程是高维空间的函数如下: $$ a_1 x_1^2+a_2 x_2^2+\cdots+a_n x_n^2+2 b_{12} x_1 x_2+2 b_{13} x_1 x_3+\cdots+2 b_{n-1, n} x_{n-1} x_n+c_1 x_1+c_2 x_2+\cdots+c_n x_n+f=0 $$ 一次线性部分仍然可以配方法处理, 但首先二次交叉项如何处理呢, 如何确定这个高维空间里的旋转变换呢?好复杂,类似前面的写法,把它改写成向量方程就简洁多了: $$ \left(x_1, x_2, \cdots, x_n\right)\left[\begin{array}{cccc} a_1 & b_{1,2} & \cdots & b_{1, n-1} \\ b_{1,2} & a_2 & \cdots & b_{2, n-1} \\ \vdots & \vdots & & \vdots \\ b_{1, n-1} & b_{2, n-1} & \cdots & a_n \end{array}\right]\left(\begin{array}{c} x_1 \\ x_2 \\ \vdots \\ x_n \end{array}\right)+\left(c_1, c_2, \cdots, c_n\right)\left(\begin{array}{c} x_1 \\ x_2 \\ \vdots \\ x_n \end{array}\right)+(f)=(0) $$ 等式左边这三部分当中,最左边的部分是最复杂、最重要、最需要研究的,我们把它拿出来专门研究。这么复杂的式子是否仍然可以用旋转变换消掉交叉项呢? 答案是肯定的。这就是我们研究二次项的主要目的 ## 例题 > 下面这些例题,可以等学完本章内容后,再来细细了解二次型的思维。 ### 初步了解二次型的作用 一个二次方程为两个变量 $x$ 和 $y$ 的标准方程 $$ \boxed{ a x^2+2 bxy+c y^2+d x+e y+f=0 ...(1.0) } $$ 方程(1.0)可写为 $$ \boxed{ \left[\begin{array}{ll} x & y \end{array}\right]\left[\begin{array}{ll} a & b \\ b & c \end{array}\right]\left[\begin{array}{l} x \\ y \end{array}\right]+\left[\begin{array}{ll} d & e \end{array}\right]\left[\begin{array}{l} x \\ y \end{array}\right]+f=0 ...(2) } $$ 令 $$ \boldsymbol{x} =\left[\begin{array}{l} x \\ y \end{array}\right] \quad \text { 和 } \quad A=\left[\begin{array}{ll} a & b \\ b & c \end{array}\right] $$ 则 $$ \boxed{ x ^{T} A x =a x^2+2 b x y+c y^2 ...(1.1) } $$ 称为与 (1.0) 相关的二次型 (quadratic form). 由上面讨论,我们知道 (1,1)和 (1.0) 的图像是合同的 ### 圆锥曲线 在高中已经写过圆锥曲线,这里简单回顾一下,一个形如 $$ a x^2+2 bxy+c y^2+d x+e y+f=0 ...(1) $$ 的方程对应的图形称为圆锥曲线. ①如果没有有序对$(x,y)$ 满足(1),则称方程表示一个虚圆锥曲线. ②如果(1)的图形仅含有一个点,一条直线或两条直线,则称(1)表示一个**退化的圆锥曲线**. ③出来上面两种情况,我们更关心的是**非退化的圆锥曲线**.非退化的圆锥曲线为圆,椭圆,抛物线或双曲线 .当圆锥曲线的方程可以化为下列标准形式之一时,其草图很容易绘制: (i) $x^2+y^2=r^2$(圆) (ii) $\frac{x^2}{\alpha^2}+\frac{y^2}{\beta^2}=1$(椭圆) (iii) $\frac{x^2}{\alpha^2}-\frac{y^2}{\beta^2}=1$ (双曲线) (iv) $x^2=\alpha y$(抛物线) 我们称这些曲线是以原点为中心的. 且关于坐标轴对称的曲线为标准圆锥曲线  不是标准形式的圆锥曲线又如何呢?考虑下列情况. **情形 1**:圆锥曲线由从标准位置水平移动得到.这出现在(1)中当 $x^2$ 和 $x$ 均有非零系数时。 **情形 2**:圆锥曲线由从标准位置垂直移动得到.这出现在(1)中当 $y^2$ 和 $y$ 均有非零系数时(即 $c \neq 0$ ,且 $e \neq 0$ ). **情形 3**:圆锥曲线由标准位置旋转一个不是 $90^{\circ}$ 的倍数得到.这出现在当 $x y$ 项的系数非零时(即 $b \neq 0$ ). 下面通过例题进一步解释。 ### 平移 `例` 绘制方程$9 x^2-18 x+4 y^2+16 y-11=0$的草图. 解 为看到如何选择新的坐标系,我们进行配方: $$ 9\left(x^2-2 x+1\right)+4\left(y^2+4 y+4\right)-11=9+16 $$ 这个方程可化简为 $$ \dfrac{(x-1)^2}{2^2}+\dfrac{(y+2)^2}{3^2}=1 $$ 若令 $$ x^{\prime}=x-1 \quad \text { 及 } \quad y^{\prime}=y+2 $$ 方程化为 $$ \dfrac{\left(x^{\prime}\right)^2}{2^2}+\dfrac{\left(y^{\prime}\right)^2}{3^2}=1 $$ 它在 $x^{\prime}$ 和 $y^{\prime}$ 下是标准形式. 因此图形为在 $x^{\prime} y^{\prime}$ 坐标系下标准位置的一个椭圆. 椭圆的中心在 $x^{\prime} y^{\prime}$ 平面中的原点,不难看出新坐标系的中心点坐标为 $(x,
免费注册看余下 50%
非VIP会员每天15篇文章,开通VIP 无限制查看
上一篇:
没有了
下一篇:
二次型的定义
本文对您是否有用?
有用
(
0
)
无用
(
0
)
更多
学习首页
数学试卷
同步训练
投稿
题库下载
会议预约系统
数学公式
关于
科数网是专业专业的数学网站 版权所有 本站部分教程采用AI辅助生成,请学习时自行鉴别
如果页面无法显示请联系 18155261033 或 983506039@qq.com