科数网
题库
在线学习
高中数学
高等数学
线性代数
概率统计
数学分析
复变函数
离散数学
实变函数
数论
群论
高中物理
词条搜索
科数
试题
高中数学
高数
线代
more
你好
游客,
登录
注册
在线学习
数学分析
第十八章 多元函数微分学及其应用
多个约束条件下的 Lagrange 乘子法
最后
更新:
2025-02-02 09:36
查看:
20
次
高考专区
考研专区
公式专区
刷题专区
词条搜索
多个约束条件下的 Lagrange 乘子法
五.多个约束条件下的 Lagrange 乘子法 设函数 $f\left(x_1, \cdots, x_n\right)$ 与 $$ g_i\left(x_1, \cdots, x_n\right), i=1, \cdots, k, k < n $$ 在 $R ^n$ 中的开集 $D$ 上连续可微,要求在满足约束条件 $$ g_i\left(x_1, \cdots, x_n\right)=0, i=1, \cdots, k, $$ 时目标函数 $z=f\left(x_1, \cdots, x_n\right)$ 的约束极值或约束最值. 定义这时的 Lagrange 函数为 $$ L\left(x_1, \cdots, x_n, \lambda_1, \cdots, \lambda_k\right)=f\left(x_1, \cdots, x_n\right)+\sum_{i=1}^k \lambda_i g_i\left(x_1, \cdots, x_n\right) $$ 其中的 $\lambda_1, \cdots, \lambda_k$ 称为 Lagrange 乘子。 在定理 1 (及其注)中解决了 $k=1$ 的问题,进一步可以推广如下. 定理 0.2 设点 $P_0\left(x_1^0, \cdots, x_n^0\right)$ 是在约束条件 $g_1=\cdots=g_k=0$ 的条件下目标函数 $f$ 的约束极值点,且 Jacobi 矩阵 $\left(\frac{\partial g_i}{\partial x_j}\right)_{1 \leqslant i \leqslant k, 1 \leqslant j \leqslant n}$ 在点 $P_0$ 处满秩,则一定存在 $k$ 个数 $\lambda_1^0, \cdots, \lambda_k^0$ ,它们与 $x_1^0, \cdots, x_n^0$ 一起是 Lagrange 函数 $L$ 的驻点,即满足下列 $n+k$ 个方程: $$ L_{x_1}=0, \cdots, L_{x_n}=0 ; L_{\lambda_1}=0, \cdots, L_{\lambda_k}=0 $$ 注 与定理1相同,这里的结论只是约束极值问题的必要条件,不是充分条件.其中的 Jacobi 矩阵满秩在只有一个约束条件时就是梯度向量非零的条件。 在证明之前先举例. 例题 0.3 在约束条件 $x+y+z=0, x^2+y^2+z^2=1$ 下求 $W=x y z$ 的最值. 解 1 为了用 Lagrange 乘子法时的变量个数,可以先用 $z=-x-y$ 代入第二个约束和目标函数中,然后再做下去.见教科书 p. 91 .这个方法的缺点是破坏了问题原来的对称性.从略. 解 2 (这时 $L$ 为 5 元方程,驻点方程为 5 元的 5 个方程,求解不易.教科书中的方法是事先消去 $z$ ,减少一个未知量,这当然是一个办法.缺点是破坏了问题本身具有的对称性.下面不用此法做.) 首先从紧集上连续函数必有最值知道问题有解,且为极值点.又可看出最大值必大于 0 ,最小值必小于 0 . 这时的 Jacobi 矩阵为 $$ \left(\begin{array}{ccc} 1 & 1 & 1 \\ 2 x & 2 y & 2 z \end{array}\right) $$ 除非 $x=y=z$ ,矩阵一定满秩.由于有约束条件 $x+y+z=0$ 和 $x^2+y^2+z^2=1$ , $x=y=z$ 不可能成立.于是定理 2 的条件满足. 作出 Lagrange 函数 $L=x y z+\lambda(x+y+z)+\mu\left(x^2+y^2+z^2-1\right)$ ,就有 $L_x=y z+\lambda+2 \mu x, L_y=z x+\lambda+2 \mu y, L_z=x y+\lambda+2 \mu z$. 从这三个方程组合出 $x L_x+y L_y+z L_z=3 x y z+2 \mu$ .又写出 $x L_x=0, y L_y=0$ , $z L_z=0$ ,并将其中的第一项 $x y z$ 用 $-2 \mu / 3$ 代入,这样就得到新的方程组 $$ \left\{\begin{aligned} 2 \mu x^2+\lambda x & =-\frac{2 \mu}{3} \\ 2 \mu y^2+\lambda y & =-\frac{2 \mu}{3} \\ 2 \mu z^2+\lambda z & =-\frac{2 \mu}{3} \end{aligned}\right. $$ 于是(对于固定的 $\lambda, \mu$ 来说)$x, y, z$ 满足同一个二次方程,因此其中至少有两个相等.如前所说,达到最值的点的三个坐标不可能相等.于是只能是恰好两个坐标相等。 再从问题的对称性知,这种极值点或最值点的个数一定是 3 的倍数,且达到相同的最值。因此不妨设 $x=y \neq z$ 直接求解。(以下不再需要关于 $L$ 的驻点方程组,也没有必要去求出 Lagrange 乘子 $\lambda, \mu$ .) 问题已经转化为在约束条件 $2 x+z=0,2 x^2+z^2=1$ 下求 $W=x^2 z$ 的最值.从前两个约束已经可以解出 $x= \pm \frac{1}{\sqrt{6}}, z=\mp \sqrt{\frac{2}{3}}$ ,从而得到 $W=\mp \frac{1}{3 \sqrt{6}}$ .利用在有界闭集 $x+y+z=0, x^2+y^2+z^2=1$ 上 $W$ 一定有最值,可见上述结果已经提供了所要求的最大值和最小值. 解 3 可以从两个约束条件消去 $x, y$ ,从而成为 $z$ 的一元函数的最值问题,则可操作如下. 具体来说,即从 $x^2+y^2=1-z^2$ 和 $(x+y)^2=z^2$ 解出 $x y=z^2-\frac{1}{2}$ ,于是得到 $W(z)=z^3-\frac{1}{2} z$ ,问题在于这个一元函数的定义域.这相当于再解一个约束最值问题:即在 $x+y+z=0, x^2+y^2+z^2=1$ 的条件下求 $z$ 的最大值和最小值.可以求出这个区间为 $$ \left[-\frac{2}{\sqrt{6}}, \frac{2}{\sqrt{6}}\right] . $$ 然后可以求出 $W(z)$ 在点 $-\frac{1}{\sqrt{6}}$ 和上述区间的右端点处同时达到最大值 $\frac{1}{3 \sqrt{6}}$ ,而在点 $\frac{1}{\sqrt{6}}$ 和上述区间的左端点处同时达到最小值 $-\frac{1}{3 \sqrt{6}}$ . 例题 0.4 有三个点 $A\left(x_1, y_1\right), B\left(x_2, y_2\right), C\left(x_3, y_3\right)$ 分别位于三条不相交的 ${ }^{(1)}$光滑曲线 $g_1\left(x_1, y_1\right)=0, g_2\left(x_2, y_2\right)=0, g_3\left(x_3, y_3\right)=0$ 上,证明:当 $\triangle A B C$ 的面积取最小值时,该三角形的高与对应的法线重合. 证 这里有 6 个自变量,有三个约束条件.三角形 $\triangle A B C$ 的面积为 $$ S=\frac{1}{2}\left|\begin{array}{lll} x_1 & y_1 & 1 \\ x_2 & y_2 & 1 \\ x_3 & y_3 & 1 \end{array}\right| $$ 且由题意假设 $S$ 已经存在最小值.由于三条曲线彼此不交,因此这个最小三角形不会退化成  由于条件中假设三条曲线光滑,因此在顶点 $A, B, C$ 处相应曲线的梯度向量都不是零向量,即一定存在法线.这同时保证了 $g_1, g_2, g_3$ 关于 $x_1, y_1, x_2, y_2, x_3, y_3$ 的 Jacobi 矩阵 $$ \left(\begin{array}{cccccc} \frac{\partial g_1}{\partial x_1} & \frac{\partial g_1}{\partial y_1} & 0 & 0 & 0 & 0 \\ 0 & 0 & \frac{\partial g_2}{\partial x_2} & \frac{\partial g_2}{\partial y_2} & 0 & 0 \\ 0 & 0 & 0 & 0 & \frac{\partial g_3}{\partial x_3} & \frac{\partial g_3}{\partial y_3} \end{array}\right) $$ 满秩,即秩为 3 . 作 $L=S+\lambda_1 g_1+\lambda_2 g_2+\lambda_3 g_3$ ,就得到 $$ \begin{aligned} & \frac{\partial L}{\partial x_1}=\frac{1}{2}\left(y_2-y_3\right)+\lambda_1 \frac{\partial g_1}{\partial x_1}=0 \\ & \frac{\partial L}{\partial y_1}=-\frac{1}{2}\left(x_2-x_3\right)+\lambda_1 \frac{\partial g_1}{\partial y_1}=0 \end{aligned} $$ 以及类似的其他 4 个方程,此外还有三个约束条件.下面只证明顶点 $A$ 处曲线 $g\left(x_1, y_1\right)$ 的法线与三角形对边 $B C$ 上的高重合,对于其他两个顶点的证明是完全类似的。 由于最小三角形不退化,顶点 $B\left(x_2, y_2\right)$ 与 $C\left(x_3, y_3\right)$ 不重合,因此从方程可见 $\lambda_1 \neq 0$ .这时过顶点 $A$ 的曲线 $g_1=0$ 在点 $A$ 的法线方向就是梯度向量 $\left(\frac{\partial g_1}{\partial x_1}, \frac{\partial g_1}{\partial y_1}\right)$ .另一方面,三角形对边 $B C$ 的方向向量是 $\left(x_3-x_2, y_3-y_2\right)$ .利用驻点方程可见它们正交,因此过顶点 $A$ 的三角形的高与曲线 $g_1\left(x_1, y_1\right)$ 在点 $A$ 的法线重合. 例题 0.1 求二次型 $\sum_{i, j=1}^n a_{i j} x_i x_j\left(a_{i j}=a_{j i}\right)$ 在约束条件 $| x |^2=x_1^2+\cdots+x_n^2=$ 1 下的最大值和最小值. 解(在 Hesse 矩阵定号情况讨论中已经讨论过这个问题,不同的是现在可以最值与高等代数中的知识联系起来.) 首先用有界闭集上连续函数必有最小值和最大值,又从约束条件知道梯度向量非零的条件一定满足。 作 Lagrange 函数 $$ L\left(x_1, \cdots, x_n, \lambda\right)=\sum_{i, j=1}^n a_{i j} x_i x_j-\lambda\left(x_1^2+\cdots+x_n^2-1\right), $$ 则驻点方程为以下方程组 $$ \begin{aligned} & L_{x_1}=2\left[\left(a_{11}-\lambda\right) x_1+a_{12} x_2+\cdots+a_{1 n} x_n\right]=0, \\ & L_{x_2}=2\left[a_{21} x_1+\left(a_{22}-\lambda\right) x_2+\cdots+a_{2 n} x_n\right]=0, \\ & \ldots \ldots \cdots \\ & L_{x_n}=2\left[a_{n 1} x_1+a_{n 2} x_2+\cdots+\left(a_{n n}-\lambda\right) x_n\right]=0 \end{aligned} $$ 和约束条件. 将二次型的矩阵记为 $A=\left(a_{i j}\right)_{i, j=1, \cdots, n}$ ,则上述方程组有非零解的充分必要条件是 $\lambda$ 为 $A$ 的特征值.由于 $A$ 是实对称阵,因此存在 $n$ 个实特征值. 对于特征值 $\lambda$ 和对应的单位特征向量,可以从上述方程组组合得到 $$ \sum_{i=1}^n x_i L_{x_i}=2\left[\sum_{i, j=1}^n a_{i j} x_i x_j-\lambda\left(x_1^2+\cdots+x_n^2\right)\right]=0 $$ 这就是 $$ x ^T A x =\lambda x ^T x =\lambda $$ 从而可见这时二次型的值就等于特征值 $\lambda$ ,也就是相应的 Lagrange 乘子.因此本题的最大值和最小值就是矩阵 $A$ 的最大特征值和最小特征值.
上一篇:
Lagrange 乘子法
下一篇:
约束条件为不等式的例子
在线学习仅为您提供最基础的数学知识,
开通会员
可以挑战海量
超难试题
, 分享本文到朋友圈,邀请更多朋友一起学习。
本文对您是否有用?
有用
(
0
)
无用
(
0
)
评论
更多
初中数学
高中数学
高中物理
高等数学
线性代数
概率论与数理统计
复变函数
离散数学
实变函数
数学分析
数论
群论
纠错
高考
考研
关于
赞助
留言
科数网是专业专业的数学网站。