科数网
题库
在线学习
高中数学
高等数学
线性代数
概率统计
数学分析
复变函数
离散数学
实变函数
数论
群论
高中物理
词条搜索
科数
试题
高中数学
高数
线代
more
你好
游客,
登录
注册
在线学习
数学分析
第十八章 多元函数微分学及其应用
Lagrange 乘子法
最后
更新:
2025-02-02 09:33
查看:
9
次
高考专区
考研专区
公式专区
刷题专区
词条搜索
Lagrange 乘子法
二.Lagrange 乘子法 先讲只有一个约束条件的 Lagrange 乘子法.又为了简明起见,只对于两个变量的情况写出定理和证明. 设 $F(x, y)$ 和 $f(x, y)$ 于开集 $D$ 上连续可微,问题是在约束 $F(x, y)=0$ 的条件下求目标函数 $$ z=f(x, y) $$ 的极值,即求 $\max _{F(x, y)=0} f(x, y)$ 或 $\min _{F(x, y)=0} f(x, y)$ 的解. 定义下列 Lagrange 函数 $$ L(x, y, \lambda)=f(x, y)+\lambda F(x, y) $$ 称 Lagrange 函数中的 $\lambda$ 为 Lagrange 乘子,它是新的末知量. 定理 0.1 (最简单情况的 Lagrange 乘子法)设点 $(a, b)$ 是在约束 $F(x, y)=$ 0 的条件下目标函数 $f(x, y)$ 的约束极值点或约束最值点,且梯度 $\operatorname{grad} F=\left(F_x, F_y\right)$在点 $(a, b)$ 处不是零向量,则一定存在数 $\lambda_0$ ,使得 $\lambda_0, a, b$ 是 Lagrange 函数 $L$ 的驻点,即满足 $$ L_x=L_y=L_\lambda=0 $$ 注 定理 1 是极值点的必要条件,不是充分条件.这与过去的 Fermat 定理的意义是相同的.此外,下面的应用中经常是对于条件最值点用 Lagrange 乘子法.这里涉及到条件极值点与条件最值点是否有区别?这在该定理的证明中可以知道,对于等式约束而言,二者没有区别,或者说,条件最值点也是条件极值点. 在证明之前,我们先将这个方法用于例 1 ,看具体如何用法。 例题1的解 4 这时在满足约束条件的点上梯度向量 $(2 x, 2 y)$ 不会是零向量,满足定理的条件.作 Lagrange 函数 $$ L=x+y+\lambda\left(x^2+y^2-1\right) $$ 然后写出驻点的方程为 $$ 1+2 \lambda x=0,1+2 \lambda y=0, x^2+y^2=1 $$ 从中可见 $\lambda \neq 0$ ,且 $x=y$ .这样就得到 $x=y= \pm \frac{\sqrt{2}}{2}, \lambda=\mp \frac{\sqrt{2}}{2}$ .这样就得到两个极值点,其中之一是所求问题的解。 这里要注意,定理1是极值点满足的必要条件,因此求出的只是嫌疑点.对于本题来说,需要从有界闭集 $x^2+y^2=1$ 上目标函数有最大值和最小值出发,知道存在两个最值点。由于上面一共只有两个解,从而已经求出了最大值点和最小值点. 定理 1 的证明 不妨设 $F_x(a, b) \neq 0$ ,按照隐函数存在定理,在点 $(a, b)$ 的一个邻域内存在惟一的连续可微隐函数 $y=y(x)$ ,满足 $y(a)=b$ 和 $F(x, y(x)) \equiv 0$ .对该恒等式求导得到 $$ F_x+F_y y^{\prime}=0 $$ 另一方面,$z=f(x, y(x))$ 在点 $x=a$ 有极值(这里利用隐函数定理中隐函数 $y=y(x)$ 在点 $(a, b)$ 的一个邻域内存在惟一,因此从 $(a, b)$ 为极值点或最值点就推出 $x=a$ 是 $f(x, y(x))$ 的极值点.又利用隐函数在点 $a$ 邻近连续可微,因此用 Fermat 定理计算得到 $$ z_x(a)=f_x(a, b)+f_y(a, b) y^{\prime}(a)=0 $$ 在(1)中用 $x=a$ 代入,得到 $$ F_x(a, b)+F_y(a, b) y^{\prime}(a)=0 $$ 由此可见向量 $\left(f_x(a, b), f_y(a, b)\right)$ 与向量 $\left(F_x(a, b), F_y(a, b)\right)$ 共线.由于后者不是零向量,因此存在 $\lambda_0$ ,使得在点 $(a, b)$ 处 $\left(f_x, f_y\right)=-\lambda_0\left(F_x, F_y\right)$ ,这就是 $$ \left\{\begin{array}{l} f_x(a, b)+\lambda_0 F_x(a, b)=0 \\ f_y(a, b)+\lambda_0 F_y(a, b)=0 \end{array}\right. $$ 也就是对于 $x=a, y=b, \lambda=\lambda_0$ 成立 $L_x=L_y=0 . L_\lambda=0$ 就是约束条件 $F(x, y)=0$ ,对于点 $(a, b)$ 当然满足. 注1 由定理的证明可见在该定理的条件下,条件最值点也是条件极值点,即这时只要求出所有条件极值点,其中取最值的就是条件最值点. 注 2 将定理 1 推广到多于 2 个变量的情况是容易的,细节可作为练习题. 定理 1 有明显的几何意义.下面给出了两个示意图.先看左下图.  图 8 就是例题 1 的几何意义.其中作出了目标函数 $x+y$ 的等值线,同时又用粗黑线作出了约束条件,即圆 $x^2+y^2=1$ .其中的两个黑点就是在圆上与 $x+y$ 的某条等值线相切的点,一条是 $x+y=\frac{\sqrt{2}}{2}$ ,另一条是 $x+y=-\frac{\sqrt{2}}{2}$ .对于满足约束条件,即圆 $x^2+y^2=1$ 上的其他点,设记为 $\left(x_0, y_0\right)$ ,经过它的 $x+y$ 的等值线与圆不相切,于是在点 $\left(x_0, y_0\right)$ 的任意邻近,在满足约束条件的 $x^2+y^2=1$ 上,目标函数 $x+y$ 的值既可大于 $x_0+y_0$ ,也可小于 $x_0+y_0$ ,因此这样的 $\left(x_0, y_0\right)$ 就不会是约束极值点. 图9是更为一般的情况,可以对照定理1的证明来看.其中用粗黑曲线表示约束条件 $F(x, y)=0$ ,又用一族细曲线表示目标函数 $f(x, y)$ 的若干条等值线.点 $(a, b)$ 是约束极值点.如果在点 $(a, b)$ 处的梯度向量 $\operatorname{grad} f$ 不是零向量,且曲线 $F(x, y)=0$ 与等值线 $f(x, y)=f(a, b)$ 在点 $(a, b)$ 处不相切,则当点 $(x, y)$ 在点 $(a, b)$ 处沿曲线 $F(x, y)=0$ 变化时,$f$ 的值就可能取到大于 $f(a, b)$ 和小于 $f(a, b)$的值,从而与 $(a, b)$ 为极值点矛盾.因此 $F, f$ 在该点的两个梯度向量必须共线,即 $$ \operatorname{grad} f(a, b) \| \operatorname{grad} F(a, b) $$ 注 一种特殊情况是 $\lambda_0=0$ .从乘子法可见这时 $f_x(a, b)=f_y(a, b)=0$ ,即点 $(a, b)$ 是目标函数 $f$ 的驻点.这时图 9 所显示的情况,即曲线 $F(x, y)=0$ 与 $f$ 的等值线在点 $(a, b)$ 处相切,就未必成立.例如等值线 $f(x, y)=f(a, b)$ 退化为一个孤立点也是可能的.然而由于 $\operatorname{grad} f= 0 , \operatorname{grad} f \| \operatorname{grad} F$ 仍然成立. (以下两个补充例题未讲.) 补充例题 1 给定三维空间的一张平面 $S: A x+B y+C z+D=0$ ,其中 $a, b, c$不同时为 0 ,又给定一点 $P_0\left(x_0, y_0, z_0\right)$ ,求它到上述平面的最短距离. 解 这是在解析几何中已经解决的问题.现在从约束最值问题的角度来重新考察它.可以将目标函数设为 ${ }^{(1)}$ $$ f(x, y, z)=\left(x-x_0\right)^2+\left(y-y_0\right)^2+\left(z-z_0\right)^2 $$ 问题就是在约束条件 $A x+B y+C z+D=0$ 下求 $f$ 的最小值. 从 Euclid 空间中点到集合的距离概念可见,上述约束最小值问题的解存在惟一,而且约束最小值点也是约束极小值点。 由于 $A, B, C$ 不同时为 0 ,因此梯度非零条件满足.这样就可以用定理 1 . 作 Lagrange 函数 $$ L=\left(x-x_0\right)^2+\left(y-y_0\right)^2+\left(z-z_0\right)^2+\lambda(A x+B y+C z+D) $$ 然后求解方程组 $$ \begin{aligned} & 2\left(x-x_0\right)+\lambda A=0, \\ & 2\left(y-y_0\right)+\lambda B=0, \\ & 2\left(z-z_0\right)+\lambda C=0, \end{aligned} $$ $$ A x+B y+C z+D=0 . $$ 由前三式可见,只要点 $P_0$ 不在约束平面上 $\lambda$ 就不可能等于 0 .从前三个方程将 $x, y, z$ 用 $\lambda$ 表出,代入最后一个方程即可确定 $$ \lambda=2 \frac{A x_0+B y_0+C z_0+D}{A^2+B^2+C^2} . $$ 由此即可解出极值点.由于求解的惟一性,因此也就是最值点. 从计算的简便来看,可以从上述前三个方程得到 $$ f(x, y, z)=\left(x-x_0\right)^2+\left(y-y_0\right)^2+\left(z-z_0\right)^2=\frac{\lambda^2}{4}\left(A^2+B^2+C^2\right), $$ 然后将上面得到的 $\lambda$ 代入并开方就得到所求的答案: $$ \min _{A x+B y+C z+D=0} \sqrt{f(x, y, z)}=\frac{\left|A x_0+B y_0+C z_0+D\right|}{\sqrt{A^2+B^2+C^2}} . $$ 补充例题 2 求平面上点 $\left(x_0, y_0\right)$ 到椭圆 $\frac{x^2}{a^2}+\frac{y^2}{b^2}=1$ 的距离,其中设 $a \neq b$ . 解 这里的距离就是指从点 $\left(x_0, y_0\right)$ 到椭圆上点的最小距离.它的存在性没有问题。同样应用定理 1 的梯度非零条件满足。 这时的目标函数为 $f(x, y)=\left(x-x_0\right)^2+\left(y-y_0\right)^2$ ,作 Lagrange 函数 $$ L(x, y, \lambda)=\left(x-x_0\right)^2+\left(y-y_0\right)^2+\lambda\left(\frac{x^2}{a^2}+\frac{y^2}{b^2}-1\right) $$ 然后列出驻点方程组 $$ \begin{aligned} & L_x=2\left(x-x_0\right)+2 \lambda \frac{x}{a^2}=0, \\ & L_y=2\left(y-y_0\right)+2 \lambda \frac{y}{b^2}=0, \\ & L_\lambda=\frac{x^2}{a^2}+\frac{y^2}{b^2}-1=0 . \end{aligned} $$ 前两个方程的几何意义很清楚,即连接极值点 $(a, b)$ 与点 $\left(x_0, y_0\right)$ 的直线与椭圆在点 $(a, b)$ 的切线正交,也就是说该直线是椭圆在点 $(a, b)$ 的法线(的一部分). 关于从一个给定点作给定的椭圆的法线问题是一个比较复杂的问题,就极值点来说,可能有 $2,3,4$ 个解,而其中长度最小的就是距离问题的解.(其中长度最大的就是从点 $(a, b)$ 到椭圆上的点的最大距离.) 这可以从上述三个方程看出,即若从前两个方程消去 $\lambda$ ,则得到关于 $x, y$ 的两个二次方程。或者从前两个方程解出 $x, y$ 用 $\lambda$ 表出,代入第三个方程,则得到关于 $\lambda$ 的 4 次方程. 在下面的图 10 中给出了各种可能性的示意图.其中除了用粗黑曲线作出椭圆 $\frac{x^2}{a^2}+\frac{y^2}{b^2}=1$ 之外,还用细曲线作出了具有 4 个尖点的曲线,它的方程是 $$ (a x)^{\frac{2}{3}}+(b y)^{\frac{2}{3}}=\left(a^2-b^2\right)^{\frac{2}{3}}, $$ 它是椭圆的渐屈线方程.结论是:从渐屈线外的点出发可引出 2 条法线(见分图 (a));从渐屈线上的非尖点出发可引出 3 条法线(见分图(b)),但从尖点出发则只能引出 2 条法线;从渐屈线内的点出发可引出 4 条法线(见分图(c)).有关的计算细节从略.这里只指出,这个问题最早是古希腊数学家Appollonius ${ }^{(1)}$ 提出和解决的. (参见《数学分析习题课讲义》上册 p. 412 对第八章第二组参考题 20 的注解.)  三.注意点 对于多元函数的约束极值和约束最值问题来说,Lagrange 乘子法相当于一元函数中的 Fermat 定理,但更复杂一些.与一元函数情况类似,对于 Lagrange 乘子法的使用提出以下几个注意要点. (1)Lagrange 乘子法只是极值点的必要条件,因此所得的解只是约束极值(或约束最值)的嫌疑点. (2)除了用 Lagrange 乘子法求出的嫌疑点之外,满足以下条件的点也是约束极值(或约束最值)的嫌疑点:(i)约束条件中的函数 $F$ 和目标函数 $f$ 的不连续可微的点;(ii)使得 Jacobi 矩阵 $\left(F_x, F_y\right)$ 降秩的点. (3)实际上需要解决的多数问题是约束最值问题.这时最好能够利用有界闭集上连续函数必有最值等方法事先判定最值的存在性. (4)若事先能肯定最值点存在,则可以将上述(1)与(2)点中所说的极值嫌疑点全部求出,然后计算所有嫌疑点上的目标函数值来确定最值点和最值. (5)对于约束最值问题,如满足约束条件的点集不是有界闭集,则有可能需要采取附加手段将点集转化为有界闭集来研究.这将在后面通过例题来介绍. 例题 0.2 在约束条件 $g(x, y)=y^2+y x^2=0$下,求 $z=f(x, y)=x^2+(y-1)^2$ 的最值. 解 这实际上就是点 $(0,1)$ 到曲线 $g(x, y)=$ 0 的距离最值问题.由于该曲线无界,因此最大值不存在(参见右图).又求出 $g(x, y)$ 的梯度 $\left(2 x y, x^2+y^2\right)$ ,可见在 $(0,0)$ 点为零向量.因此这也是极值嫌疑点.  对于 $(0,0)$ 之外的点试用 Lagrange 乘子法求嫌疑点.作出 $$ L(x, y, \lambda)=x^2+(y-1)^2+\lambda\left(y^2+y x^2\right) $$ 则驻点方程为 $$ \begin{aligned} & L_x=2 x+2 \lambda x y=0 \\ & L_y=2(y-1)+2 \lambda y+\lambda x^2=0, \\ & L_\lambda=y^2+y x^2=0 . \end{aligned} $$ 可以发现该方程组无解. 于是嫌疑点只有点 $(0,0)$ .由于最小值点存在,因此它就是所求的最小值点.从表达式知道最小值为 1 .(从图 11 可直接看出,满足约束的点 $(x, y)$ 都有 $y \leqslant 0$ ,因此 $(0,0)$ 就是最小值点,最小值为 1 .)
上一篇:
约束极值
下一篇:
多个约束条件下的 Lagrange 乘子法
在线学习仅为您提供最基础的数学知识,
开通会员
可以挑战海量
超难试题
, 分享本文到朋友圈,邀请更多朋友一起学习。
本文对您是否有用?
有用
(
0
)
无用
(
0
)
评论
更多
初中数学
高中数学
高中物理
高等数学
线性代数
概率论与数理统计
复变函数
离散数学
实变函数
数学分析
数论
群论
纠错
高考
考研
关于
赞助
留言
科数网是专业专业的数学网站。