科数网
题库
在线学习
高中数学
高等数学
线性代数
概率统计
数学分析
复变函数
离散数学
实变函数
数论
群论
高中物理
词条搜索
科数
试题
高中数学
高数
线代
more
你好
游客,
登录
注册
在线学习
数学分析
第十八章 多元函数微分学及其应用
极值
最后
更新:
2025-02-02 09:27
查看:
7
次
高考专区
考研专区
公式专区
刷题专区
词条搜索
极值
一.多元函数极值的必要条件 这里可以如一元函数情况那样引入极值,极值点的定义,并从 Fermat 定理推广到多元情况。 定理 0.1 (多元函数的 Fermat 定理)设 $f( x )$ 是区域 $D \subset R ^n$ 上的多元函数,点 $a \in D$ 是 $f$ 的极值点,且 $f$ 在 $a$ 存在所有的一阶偏导数,则 $$ \operatorname{grad} f( a )= 0 $$ 证 记 $a =\left(a_1, \cdots, a_n\right)$ ,则对于 $i \in\{1, \cdots, n\}$ ,在 $y=f\left(x_1, \cdots, x_n\right)$ 中,对于 $j \in\{1, \cdots, n\}-\{i\}$ ,固定 $x_j=a_j$ ,这样就得到以 $x_i$ 为自变量的一元函数,它以 $a_i$ 为极值点,且存在对 $x_i$ 的导数.用 Fermat 定理,就知道 $f_{x_i}( a )=0$ .由于对每个 $i=1, \cdots, n$ 都如此,因此 $f$ 在点 $a$ 的梯度向量 $\operatorname{grad} f( a )$ 为零向量. 与一元函数情况相同,将满足条件 $\operatorname{grad} f( a )= 0$ 的点 $a$ 称为函数 $f$ 的驻点. 当然驻点末必是极值点,极值点也未必是驻点.然而,尽管如此,驻点概念在解决极值问题和最值问题中还是有用的.这些都与一元函数相同. 书上举了一个例子,即马鞍面 $z=x y$ ,原点 $(0,0)$ 是驻点,但不是极值点. 二.多元函数极值的充分条件 这里正是高等代数的二次型理论发挥作用的地方。 设 $y=f( x )$ 是区域 $D \subset R ^n$ 上的多元函数,点 $a \in D$ 为驻点,又设 $f$ 在点 $a$的一个邻域中有连续的所有二阶偏导数,则可以写出 $f$ 在该点的带 Peano 型余项的 Taylor 公式: $$ f( x )-f( a )=\frac{1}{2!} \sum_{i, j=1}^n \frac{\partial^2 f}{\partial x_i \partial x_j}\left(a_1, \cdots, a_n\right) \Delta x_i \Delta x_j+o\left(r^2\right)(r \rightarrow 0), $$ 其中 $r=\sqrt{\Delta x_1^2+\cdots+\Delta x_n^2}$ . 显然上式右边出现了二次型.引入矩阵 $$ H =\left(\begin{array}{cccc} f_{11} & f_{12} & \ldots & f_{1 n} \\ f_{21} & f_{22} & \ldots & f_{2 n} \\ \vdots & \vdots & \ddots & \vdots \\ f_{n 1} & f_{n 2} & \ldots & f_{n n} \end{array}\right), $$ 其中 $f_{i j}=\left.\frac{\partial^2 f}{\partial x_i \partial x_j}\right|_{ x = a }, i, j=1, \cdots, n$ .称 $H$ 为 $f$ 在点 $a$ 的 Hesse ${ }^{(1)}$ 矩阵.又记 $\Delta x =\left(\Delta x_1, \cdots, \Delta x_n\right)^T$ ,这样就可以将上面的公式改写为 $$ f( x )-f( a )=\Delta x^T H \Delta x +o\left(r^2\right)(r \rightarrow 0), $$ 这里 $r=|\Delta x |$ . 这样就可以得到下列定理,它比教科书 p .82 上的定理 2 更广一点.对于 Hesse矩阵的定号性可以用高等代数中的 Sylvester ${ }^{(1)}$ 定理解决,即实对称阵为正定的充分必要条件是该矩阵的各阶顺序主子式都大于零。 定理 0.1 (多元函数极值的充分条件)设 $f( x )$ 是区域 $D \subset R ^n$ 上的多元函数, $a$ 为 $f$ 的驻点,且 $f$ 在点 $a$ 的一个邻域内二阶连续可微, $H$ 为 $f$ 在该点的 Hesse矩阵,则 (1)若 $H$ 为正定,则 $a$ 是极小值点; (2)若 $H$ 为负定,则 $a$ 是极大值点; (3)若 $H$ 为不定,则 $a$ 一定不是极值点. 证 ${ }^{(1)}$ 考虑单位球面 $S=\left\{ y \in R ^n| | y \mid=1\right\}$ .同时考虑二次型 $Q( y )= y ^T H y$ . (1)由于 $H$ 正定,函数 $Q$ 在 $S$ 上处处大于 0 .利用连续函数 $Q( y )$ 在有界闭集 $S$ 上取到正最小值 $\lambda$ ,就得到 $$ y ^T H y \geqslant \lambda>0 \forall y \in S $$ 取 $y =\Delta x /|\Delta x|$ 代入,就有 $$ \Delta x ^T H \Delta x \geqslant \lambda \Delta x ^T \Delta x =\lambda r^2 $$ 从而就有 $$ f( x )-f( a ) \geqslant(\lambda+o(1)) r^2(r \rightarrow 0) $$ 因此当 $r$ 充分小时,$f( x ) \geqslant f( a )$ 成立,即 $a$ 是 $f$ 的极小值点. (2) $H$ 负定时的证明同(1). (3)设有某个 $\Delta x$ 使得 $\Delta x ^T H \Delta x <0$ ,则固定 $\Delta x$ ,对于 $t>0$ 有以下表达式 $$ f( a +t \Delta x )-f( a )=t^2\left(\Delta x^T H \Delta x +o(1)|\Delta x |^2\right)(t \rightarrow 0) $$ 可见当 $t>0$ 充分小时 $f( a +t \Delta x )<f( a )$ .因此点 $a$ 不可能是极小值点. 同样设有某个 $\Delta x$ 使得 $\Delta x ^T H \Delta x >0$ ,则可以证明 $a$ 也不可能是极大值点.合并以上可见 $a$ 一定不是极值点。 注 定理中的情况(3)是一元函数中没有的情况.对于一元函数 $f(x)$ 来说,若 $f^{\prime}\left(x_0\right)=0$ ,且存在 $f^{\prime \prime}\left(x_0\right)$ ,则当 $f^{\prime \prime}\left(x_0\right)>0$ 时点 $x_0$ 为极小值点,当 $f^{\prime \prime}\left(x_0\right)<0$ 时点 $x_0$ 为极大值点.这分别相当于上述定理中的情况(1)和(2).当 $f^{\prime \prime}\left(x_0\right)=0$ 时则不能判定,这相当于上述定理所没有讨论的 Hesse 矩阵 $H$ 为半定的情况. 例题 0.1 求 $z=x^2+x y+y^2$ 的极值. 解 用 Fermat 定理,从 $z_x=2 x+y=0$ 和 $z_y=x+2 y=0$ 可见,可疑极值点只可能是 $(0,0)$ . 写出 $z(x, y)$ 在点 $(0,0)$ 的 Hesse 矩阵 $\left(\begin{array}{cc}1 & 0.5 \\ 0.5 & 1\end{array}\right)$ ,从高等代数知识即可知道它是正定二次型,因此点 $(0,0)$ 为极小值点,极小值为 0 .(容易看出这也就是最小值.) (原来的例题较好,目前这个例子太平庸.) 三.最值问题 上面一个补充例题实际上就是解决最值问题的例子.对于多元函数来说,求最值的基本思路与一元函数是类似的,只是这里会出现更为复杂的情况.下面举出两点与一元函数不同之处. (1)对于一元函数来说,如 $y=f(x)$ 在区间内只有一个极小值点(极大值点),则它就是最小值点(最大值点),但对多元函数就没有这样的结论. 例如,设在全平面上有定义的函数 $$ f(x, y)=\left\{\begin{aligned} x^2(1-x)+y^2\left(x-\frac{1}{3}\right)^2, & x \leqslant \frac{1}{3} \\ x^2(1-x)+y\left(x-\frac{1}{3}\right)^2, & x>\frac{1}{3} \end{aligned}\right. $$ 则可分段求出 $f_x$ 和 $f_y$ ,而且发现都在全平面上连续,因此 $f$ 可微. 从 $x>\frac{1}{3}$ 时的 $f_y=\left(x-\frac{1}{3}\right)^2$ 可见在 $x>\frac{1}{3}$ 时没有驻点.对于 $x \leqslant \frac{1}{3}$ 则从 $f_y=2 y\left(x-\frac{1}{3}\right)^2=0$ 只能有 $y=0$ 和 $x=\frac{1}{3}$ .再写出 $f_x=2 x-3 x^2+2 y^2\left(x-\frac{1}{3}\right)=$ 0 ,可见只能得到一个驻点 $(0,0)$ . 从 $f(x, y)=x^2+\frac{1}{9} y^2+O_3$ ,其中 $O_3$ 为高于 2 次的项,可见 $(0,0)$ 是极小值点,极小值为 0 .然而 $f(2,0)=-4$ ,可见上述极小值不是最小值. 注 这个例子用拼接方法作出.利用 $\left(x-\frac{1}{3}\right)^2$ 的方法使得拼接后偏导数仍然连续,从而可微.又利用拼接使得 $x \leqslant \frac{1}{3}$ 时的表达式的另一个落在 $x>\frac{1}{3}$ 的驻点消失.这个驻点是鞍点.当然也可以找出不用拼接方法的例子. (2)在多元函数的最值问题中,主要困难往往在于边界集上的讨论.对于一元函数来说,区间的边界至多只有两点,将该处的函数值计算出来就是.而对于多元函数来说,闭区域的边界千变万化,如何讨论往往比求极值点困难得多.这将在本章的下一节专门讨论。在本节下面我们只举出比较简单的例子,也就是边界容易处理的情况。 补充例题 求 $z=x y \sqrt{1-\frac{x^2}{a^2}-\frac{y^2}{b^2}}$ 的极值,其中设 $a>0, b>0$ . 解 自然定义域是闭区域 $$ \left\{(x, y) \left\lvert\, \frac{x^2}{a^2}+\frac{y^2}{b^2} \leqslant 1\right.\right\} $$ 如右图所示,在定义域内由坐标轴划分为 4 个区域。用粗黑线表示 $z=0$ 的点集,又用 $\pm$ 号标出 $z(x, y)$ 的符号,于是已经可以断定,在一,三象限中有极大值,在二,四象限中有极小值。  又从对称性可以知道,只要求出第一象限的极大值,它也就是第三象限的极大值,又乘以 -1 后也就得到第二和第四象限的极小值. 为方便起见将函数 $z$ 的根号下的表达式简记为 $\Delta$ ,则可以计算 $z_x$ 如下: $$ z_x=y \sqrt{\Delta}-\frac{2 x^2}{a^2 \sqrt{\Delta}}=\frac{y}{a^2 \sqrt{\Delta}}\left(1-\frac{2 x^2}{a^2}-\frac{y^2}{b^2}\right) $$ 由对称性可得到 $z_y$ ,并根据 Fermat 定理列出方程组 $$ \frac{2 x^2}{a^2}+\frac{y^2}{b^2}=1, \quad \frac{x^2}{a^2}+\frac{2 y^2}{b^2}=1 . $$ 于是解出 $\frac{x^2}{a^2}=\frac{y^2}{b^2}=\frac{1}{3}$ ,在第一象限中的解就是 $$ x=\frac{a}{\sqrt{3}}, \quad y=\frac{b}{\sqrt{3}} . $$ 由连续函数的最值定理,$z(x, y)$ 在第一象限一定达到最大值,且大于 0 .由于最大值点为内点,因此必是极大值点.这样就知道上面求出的驻点就是极大值点,也是最大值点.将它代入 $z(x, y)$ 中,可见极大值(即最大值)为 $\frac{a b}{3 \sqrt{3}}$ . 注 这里从连续函数的最值定理就已经可以判定,因此不必计算驻点的 Hesse矩阵.以上解法还充分利用了对称性,从而不必再对函数作变量代换,省去了许多额外的麻烦. 例题 0.2 在闭区域 $D: x^2+y^2 \leqslant 1$ 上求 $z=x^3+x y^2-x$ 的最值. 解 先求极值点,这时只要考虑内点 $x^2+y^2<1$ . 列出方程组 $$ z_x=3 x^2+y^2-1=0, \quad z_y=2 x y=0 $$ 即可解出驻点为 $\left( \pm \frac{1}{\sqrt{3}}, 0\right)$ .(另外两个点 $(0, \pm 1)$ 在边界 $\partial D$ 上不必考虑.)计算出 $$ z\left(\frac{1}{3}, 0\right)=-\frac{2}{3 \sqrt{3}}, \quad z\left(-\frac{1}{3}, 0\right)=\frac{2}{3 \sqrt{3}} $$ 由 $z=x\left(x^2+y^2-1\right)$ 可见在边界上 $z=0$ ,因此在上述两个驻点上的函数值分别为最小值和最大值. 例题 0.3 有一块宽 24 厘米的矩形薄铁皮,把两边折起来,如图做成一个矩形水槽,问当 $x$ 和 $\theta$ 为何值时,水槽的容量最大。 解 这就是要使得水槽截面的梯形面积最大,写出梯形面积为 $$ \begin{aligned} S & =\frac{1}{2}[(24-2 x)+(24-2 x)+2 x \cos \theta] x \sin \theta \\ & =24 x \sin \theta-2 x^2 \sin \theta+x^2 \sin \theta \cos \theta \end{aligned} $$ 其中变量的范围为 $0 \leqslant x \leqslant 12,0 \leqslant \theta \leqslant \pi$ .由此可见 $S$ 在边界上为 0 ,因此最大值必定在内点达到。 用 Fermat 定理,列出方程组 $$ \begin{aligned} & S_x=24 \sin \theta-4 x \sin \theta+2 x \sin \theta \cos \theta=0 \\ & S_\theta=24 x \cos \theta-2 x^2 \cos \theta+x^2 \cos 2 \theta=0 \end{aligned} $$ 由于所求为内点,因此可以约去 $x$ 和 $\sin \theta$ ,得到  $$ 12-2 x+x \cos \theta=0, \quad 24 \cos \theta-2 x \cos \theta+x \cos 2 \theta=0 $$ 将第一式乘 $2 \cos \theta$ 与第二式相减,得到 $$ 2 x \cos \theta-x=0 $$ 并再约去 $x$ ,就可求出 $\theta=\frac{\pi}{3}$ .然后再代入前面的第一式得到 $x=8$ .由于极值点惟一,而边界上 $S=0$ ,因此这就是所求的极大值点。 注 容易理解答案为什么是 $x=8$ 和 $\theta=\frac{\pi}{3}$ .为此只要在图 2 的右边在水平的虚线上边作出与下面对称的梯形,从而问题变成在周长给定时的 6 边形的面积何时最大?显然答案是取正 6 边形,从而答案只能是 $x=24 / 3$ 和 $\theta=\pi / 3$ 。当然在周长给定的 $n$ 边形中面积最大的是正 $n$ 边形这本身是一个有趣的约束最值问题,它一定有许多种不同的数学证明.此问题供思考用.
上一篇:
Taylor 公式
下一篇:
最小二乘法
在线学习仅为您提供最基础的数学知识,
开通会员
可以挑战海量
超难试题
, 分享本文到朋友圈,邀请更多朋友一起学习。
本文对您是否有用?
有用
(
0
)
无用
(
0
)
评论
更多
初中数学
高中数学
高中物理
高等数学
线性代数
概率论与数理统计
复变函数
离散数学
实变函数
数学分析
数论
群论
纠错
高考
考研
关于
赞助
留言
科数网是专业专业的数学网站。