科数网
学习
高中数学
高中物理
微积分
线性代数
概率论
人工智能
赞助本站
在线教程
线性代数
第四篇 相似矩阵及二次型
二次函数与二次方程的关系
日期:
2024-01-12 12:10
查看:
114
次
编辑
导出本文
二次函数与二次方程的关系
7.1.2 二次函数与二次方程的关系 二次型是一个函数, 给定这个函数一个值, 就成为二次曲面方程了。 当然, 函数有几何图形, 方程也有几何图形。两者图形之间的关系是: 方程的几何图形是函数几何图形与直线、平面或超平面的截线。 比如二元二次型函数: $$ f(x, y)=\frac{1}{4} x^2+y^2 $$ 其几何图形绘制在三维坐标系 $\{o, x, y, z\}$ 中是一个椭圆抛物面。令 $f(x, y)=1$, 则截痕方程 $\frac{1}{4} x^2+y^2=1$ 在二维坐标系 $\{o, x, y\}$ 中的图形是椭圆。这个椭圆就是椭圆抛物面与平面 $z=1$ 的截线投影到到 $x o y$ (或 $z=0$ ) 平面上的图形, 它与在平面 $z=1$ 上的椭圆完全相同, 即 $$ \left\{\begin{array}{l} z=f(x, y)=\frac{1}{4} x^2+y^2 \\ z=1 \end{array} \Rightarrow \frac{1}{4} x^2+y^2=1\right. $$ ![图片](/uploads/2024-01/image_202401129873707.png) 如果我们是二维的平面动物, 将无法看到二元二次型函数的 $3 \mathrm{D}$ 全貌, 但我们可以通过用平行平面多次截图, 并把截线投影到二维平面上来想象三维的图形。 比如函数式 (7-1) 的几何图形四次均匀截线在 $\{o, x, y\}$ 平面上的投影是同心椭圆 (见图 7-5),由此我们可以在二维空间近似地想象三维空间里的椭圆抛物曲面的庐山真面目。 由此可以推广为: 如果数域 $F$ 上一个 $n$ 元二次型是 $f\left(x_1, x_2, \ldots, x_n\right)$, 则方程 $f\left(x_1, x_2, \ldots, x_n\right)=d$ 的图形就是:定义在 $F^n$ 的一个二次函数 $z=f\left(x_1, x_2, \ldots, x_n\right)$, 它在 $n+1$ 维空间 $F^{n+1}$ 的图形(二次超曲面)与平面 $z=d$ 相截交, 此截交线在 $F^{n+1}$ 的 $n$ 维子空间—— “坐标平面” $\left\{o, x_1, x_2, \cdots, x_n\right\}$ 上的正投影 (超曲线) 的图形。 ![图片](/uploads/2024-01/image_20240112c52fae6.png) 用截线投影的方法可以绘出更高维的几何图形, 比如四维图形。 如上节二元函数值的图形刚好在三维空间里观察。对于三元二次函数, 它的函数值只能描绘在第四维坐标方向的空间上。但我们是三维动物, 应如何看四维的图形? 类似地, 方法是, 对于三元二次函数 $\varphi=f(x, y, z)$, 我们在一个三维坐标空间里同时绘制出 $\varphi$ 为不同数值的方程图形, 比如令 $\varphi$ 为负数、零和正数时的三维图形, 这些三维图形正是四维截痕图形的三维投影, 把这些投影大范围地组合起来, 就可以想象三元二次函数的四维图形了。或者干脆就叫这些投影组合为类四维几何图形。 稍具体来说, 如果我们假设三元二次函数 $\varphi=a x^2+b y^2+c z^2(a 、 b>0, c<0)$, 当 $\varphi<0$ 时是两个椭圆抛物面, 当 $\varphi=0$ 时是两个圆雉面, 当 $\varphi>0$ 时是两个双曲抛物面, 则这三个部分曲面构成了一个典型的类四维曲面图形 (见图 7-6 (a))。 如果 $\varphi$ 取更多的值, 则我们可得到更多的图形, 进而取得三元二次函数非常丰满的类四维图形的概念 (见图 7-6 (b))。 ![图片](/uploads/2024-01/image_20240112049377d.png) 還想 从图中我们体会到这三个典型的曲面之间存在着许多过渡曲面。这些曲面与某一平面相截将得到各类的所谓 “圆雉曲线”, 与其中的圆锥相截当然得到圆锥曲线, 与其他的曲面相截也得到圆锥曲线。在这里我们扩展了圆锥曲线的几何内涵。 7. 1.3 圆锥曲线的向量方程 这一节咱回顾一下高中时就接触到的著名的圆雉曲线, 讨论它们的向量方程和图形是如何的。 二维平面空间中的几何图形比如圆、椭圆、抛物线及双曲线等也属于二次曲线图形, 这些曲线又称为圆锥曲线, 因为它们可以看成是由平面和双圆雉面相交而得到的截线, 见图 7-7。 双圆雉面和平面相截交的方程组是 $$ \left\{\begin{array}{l} f(x, y)=a x^2+2 b x y+c y^2+d x+e y+f \\ f(x, y)=g \end{array}\right. $$ 其中, $f(x, y)=g$ 就是那个截平面方程。由此, 平面上的二次曲线的一般形式为 $$ a x^2+2 b x y+c y^2+d x+e y+f=0 $$ 那么此方程的向量及矩阵的形式可以是 $$ (x, y)\left[\begin{array}{ll} a & b \\ b & c \end{array}\right]\left(\begin{array}{l} x \\ y \end{array}\right)+(d, e)\left(\begin{array}{l} x \\ y \end{array}\right)+(f)=(0) $$ (注: $x y$ 的系数写为 $2 b$ 是为了得到矩阵方程的一般形式。) ![图片](/uploads/2024-01/image_20240112c6eae9f.png) 根据我们中学的经验, 如果把方程 (7-2) 化简为 $a^{\prime} x^{\prime 2}+c^{\prime} y^{\prime 2}=f^{\prime}$ 的形式, 我们就比较容易看出来是椭圆还是双曲线等。下面我们对方程进行分类分析, 看如何化简成想要的形式。 对于不包含交叉项的方程 ( $b=0$ 时) $a x^2+c y^2+d x+e y+f=0$, 我们可以对它进行配方得到 $a^{\prime}(x+g)^2+c^{\prime}(y+h)^2=f^{\prime}$ 的形式, 并对它进一步进行平移变换: $$ \left\{\begin{array}{l} x^{\prime}=x+g \\ y^{\prime}=y+h \end{array} \text { 或 }\left(\begin{array}{l} x^{\prime} \\ y^{\prime} \end{array}\right)=\left(\begin{array}{l} x \\ y \end{array}\right)+\left(\begin{array}{l} g \\ h \end{array}\right)\right. $$ 平移变换使曲线的对称中心平移到坐标原点, 进而得到想要的形式 $a^{\prime} x^{\prime 2}+c^{\prime} y^{\prime 2}=f^{\prime}$ 。 对于只剩下二次项和常数项的方程形式, 也就是二次曲线的对称中心与坐标原点重合时, 其方程形式为 $$ a x^2+2 b x y+c y^2=f $$ 为了判别该曲线的类型, 需要作坐标旋转, 消去乘积项 $2 b x y$, 只含平方项。引入旋转线性变换: $$ \left\{\begin{array}{l} x=x^{\prime} \cos \theta-y^{\prime} \sin \theta \\ y=x^{\prime} \sin \theta-y^{\prime} \cos \theta \end{array} \text { 或 }\left(\begin{array}{l} x \\ y \end{array}\right)=\left[\begin{array}{ll} \cos \theta & -\sin \theta \\ \sin \theta & -\cos \theta \end{array}\right]\left(\begin{array}{l} x^{\prime} \\ y^{\prime} \end{array}\right)\right. $$ 代入二次曲线方程, 简化得到想要的方程形式 $a^{\prime} x^{\prime 2}+c^{\prime} y^{\prime 2}=f^{\prime}$ 。 实际上, 对于完整的方程 (7-2) 的形式, 应该先进行旋转变换, 消掉交叉项, 然后再进行平移变换, 消掉一次项, 才能顺利地得到平方项形式的方程。 以上是中学的处理方法, 适用于低维的空间。随着二次函数的变量的增加, 函数变得更加复杂起来。为了方便研究二次函数, 需要使用向量和矩阵工具来分析。比如, 方程是高维空间的函数如下: $$ a_1 x_1^2+a_2 x_2^2+\cdots+a_n x_n^2+2 b_{12} x_1 x_2+2 b_{13} x_1 x_3+\cdots+2 b_{n-1, n} x_{n-1} x_n+c_1 x_1+c_2 x_2+\cdots+c_n x_n+f=0 $$ 一次线性部分仍然可以配方法处理, 但首先二次交叉项如何处理呢, 如何确定这个高维空间里的旋转变换呢? 好复杂, 类似前面的写法, 把它改写成向量方程就简洁多了: $$ \left(x_1, x_2, \cdots, x_n\right)\left[\begin{array}{cccc} a_1 & b_{1,2} & \cdots & b_{1, n-1} \\ b_{1,2} & a_2 & \cdots & b_{2, n-1} \\ \vdots & \vdots & & \vdots \\ b_{1, n-1} & b_{2, n-1} & \cdots & a_n \end{array}\right]\left(\begin{array}{c} x_1 \\ x_2 \\ \vdots \\ x_n \end{array}\right)+\left(c_1, c_2, \cdots, c_n\right)\left(\begin{array}{c} x_1 \\ x_2 \\ \vdots \\ x_n \end{array}\right)+(f)=(0) $$ 等式左边这三部分当中, 最左边的部分是最复杂、最重要、最需要研究的, 我们把它拿出来专门研究。这么复杂的式子是否仍然可以用旋转变换消掉交叉项呢? 答案是肯定的。这就是我们要进一步讨论的二次型的主要内容之一。 7. 2. 3 二次型函数与双线性函数的关系 就像本章开头提到的疑问:线性代数主要研究 “线性” 问题,如线性变换、线性空间、线性方程组等, 二次型却是非线性的, 形如 $f(x, y)=a x^2+b x y+c y^2$, 为何能用矩阵等线性工具研究? 实际上, 可以从下面几个方面来理解: 一是, 二次曲线或曲面本身就具有线性的性质, 比如直纹曲面, 一个坐标方向是直线, 一个坐标方向是二次的, 就可以描绘出直纹曲面 (参见图)。 二是, 用向量研究一元多项式, 是用多项式的系数构成向量来等价地替代研究, 不是直接研究多项式本身, 因此化非线性为线性; 同样, 用二次型的系数构建矩阵来等价地替代研究它,同样化非线性为线性了。 三是, 对二次型的研究利用了双线性函数的概念。二次型本来就是一个对称的双线性函数。双线性函数也是线性函数啊, 既然是线性函数, 当然可以用线性代数的向量及矩阵工具进行研究了。那么什么是双线性函数? 简单点说, 双线性函数就是定义了某维线性空间里的双向量 (两个向量) 的一个运算, 运算结果是一个数, 这个数属于某个数域 (如实数、复数域等)。比如, 双向量的内积就是一个双线性函数。双线性具体是嘛意思呢? 我们看 $n$ 维线性空间下的内积运算式: $$ \langle\boldsymbol{x}, \boldsymbol{y}\rangle=\boldsymbol{x}^{\mathrm{T}} \boldsymbol{y}=x_1 y_1+x_2 y_2+\cdots+x_n y_n $$ 如果固定一个向量比如 $\boldsymbol{x}$, 把向量 $\boldsymbol{x}$ 改写成常向量 $\boldsymbol{x}=\left(k_1, k_2, \cdots, k_n\right)$, 则内积变为 $$ \langle\boldsymbol{x}, \boldsymbol{y}\rangle=\boldsymbol{x}^{\mathrm{T}} \boldsymbol{y}=k_1 y_1+k_2 y_2+\cdots+k_n y_n $$ 这是一个线性函数。 相对地, 如果只固定向量 $y$, 同样也是一个线性函数。或者说, 其中一个变元固定时是另一个变元的线性函数, 两个向量互为线性, 称之为双线性。 前面讲过, 推广了的内积定义是: $$ <x, y>=x^{\mathrm{T}} S y $$ 其中 $S$ 是度量矩阵, 是对称的正定方阵。 推广了的内积也是特殊的双线性函数, 因为这个定义与一般的双线性函数的定义式形式是相同的, 只是双线性函数矩阵 $\boldsymbol{S}$ 是一般的 $n$ 阶方阵而已。 设 $P^n$ 是数域 $P$ 上 $n$ 维列向量构成的线性空间, 向量 $\boldsymbol{x}, \boldsymbol{y} \in P^n$, 再设 $\boldsymbol{A}$ 是 $P$ 上的 $n$ 阶方阵。令 $$ f(x, y)=x^{\mathrm{T}} A y $$ 则 $f(x, y)$ 是 $P^n$ 上的一个双线性函数。 现在看二次型, 二次型的矩阵表示式是 $\boldsymbol{x}^{\mathrm{T}} \boldsymbol{A} \boldsymbol{x}$, 显然二次型是双线性函数。实际上, 二次型不过是合并变量的对称双线性函数。所谓对称的就是满足 $f(\alpha, \beta)=f(\beta, \alpha)$ 的要求, 因此矩阵 $\boldsymbol{A}$ 是对称矩阵, 这就与二次型的对称矩阵相一致了。不过这还不够, 因为对称双线性函数的表示式仍然是 $\boldsymbol{x}^{\mathrm{T}} \boldsymbol{A} \boldsymbol{y}$, 还需要把变向量合成一个 $\boldsymbol{x}$ 才称其为二次型。 下面我们画出两个简单的对称双线性函数及其对应的二次型的图形。希望能看到二次型的线性意义出来。 一维线性空间里, 最简单的对称双线性函数为 $f(x, y)=(x)[1] y=x y$, 对应的二次型函数为 $f(x)=(x)[1] x=x^2$, 它们的图形见图 7-8, 可以看出, 对称双线性函数是一个双曲抛物面,俗称马鞍面。 从图 7-8 中可以看出马鞍面的双线性出来: 当用垂直于 $x$ 轴的平面去截马鞍面时得到一个个直线 (见图 7-8 (a), 就是固定 $x$ 变量, 令 $x=k$ 时的函数 $f(k, y)=k y$ 的图像); 同样地, 当用垂直于 $y$ 轴的平面去截马鞍面时得到另外一个个直线 (见图 7-8(b), 就是固定 $y$ 变量, 令 $y=k$时的函数 $f(x, k)=k x$ 的图像)。 从图上也可以看出马鞍面包含的二次型出来: 当 $y=x$ 时, 平面 $y=x$ 所截取的曲线图形就是抛物线 $f(x)=x^2$, 这就是二次型的图形了 (如图 7-8 (c) 所示)。 ![图片](/uploads/2024-01/image_20240112ef638b2.png) 二维线性空间里, 最简单的对称双线性函数为 $\left(x_1 x_2\right)\left[\begin{array}{ll}1 & 0 \\ 0 & 1\end{array}\right]\left(\begin{array}{l}y_1 \\ y_2\end{array}\right)=x_1 y_1+x_2 y_2$, 其二次型函数为 $\left(\begin{array}{ll}x_1 & x_2\end{array}\right)\left[\begin{array}{ll}1 & 0 \\ 0 & 1\end{array}\right]\left(\begin{array}{l}x_1 \\ x_2\end{array}\right)=x_1^2+x_2^2$ 。 二维空间里的双线性函数的图形是一个五维的几何图形, 即使画出来这个图形也是一团乱麻似的难以看出几何图形的规律。若想一窥其真容, 只能用切片法来想象一下了。 前面讲的一维双线性函数的图形是马鞍面, 假设我们不知道这个一维双线性函数的图形是 什么, 如果用切片法的话就是固定一个变量 $x$, 垂直 $x$ 坐标轴切出一个 “直线” 图片; 再固定一个变量 $y$, 垂直切出另一个 “直线” 图片; 然后坚直斜切, 切出一个抛物线; 再水平斜切,切出一个双曲线。我们把这些切片组合就形成了一个天马行空的马鞍面出来。 好,如法炮制,切出二维线性空间里的双线性函数的图形片片: 固定一个向量 $\boldsymbol{x}=\left(x_1, x_2\right)=\left(k_1, k_2\right)$, 就得到一个平面 $f(\boldsymbol{k}, \boldsymbol{y})=k_1 y_1+k_2 y_2$; 另外固定一个向量 $\boldsymbol{y}=\left(y_1, y_2\right)=\left(k_1, k_2\right)$, 就得到另一个平面 $f(\boldsymbol{x}, \boldsymbol{k})=k_1 x_1+k_2 x_2$; 然后坚直斜切, 切出一个抛物面; 再水平斜切, 切出一个马鞍面.......
上一篇:
二次型及其标准形的定义
下一篇:
二次型合同对角化的几何意义
本文对您是否有用?
有用
(
0
)
无用
(
0
)
赞助我们
0
篇笔记
写笔记
更多笔记
提交笔记