在线学习
重点科目
初中数学
高中数学
高等数学
线性代数
概率统计
高中物理
数学公式
主要科目
复变函数
离散数学
数学分析
实变函数
群论
数论
未整理科目
近世代数
数值分析
常微分方程
偏微分方程
大学物理
射影几何
微分几何
泛函分析
拓扑学
数学物理
趣味数学
科数网
题库
教材
高考区
考研区
VIP
科数网
题库
在线学习
高中数学
高等数学
线性代数
概率统计
高中物理
复变函数
离散数学
实变函数
数论
群论
你好
游客,
登录
注册
在线学习
数学分析
第十三篇 多元函数微分学及其应用
关于 Lagrange 乘子法的进一步讨论
最后
更新:
2025-02-02 09:40
查看:
14
次
反馈
刷题
关于 Lagrange 乘子法的进一步讨论
十.关于 Lagrange 乘子法的进一步讨论 本小节是对教科书增加的材料,其中主要是:(1)定理 2 ,即一般情况的 Lagrange 乘子法的证明;(2)关于约束极值的充分条件问题(未讲). 首先我们来证明定理 2.为方便起见,将前面的定理 2 重新叙述如下. 设函数 $f\left(x_1, \cdots, x_n\right)$ 与 $$ g_i\left(x_1, \cdots, x_n\right), i=1, \cdots, k, k < n $$ 在 $R ^n$ 中的开集 $D$ 上连续可微,要求在满足约束条件 $$ g_i\left(x_1, \cdots, x_n\right)=0, i=1, \cdots, k $$ 时目标函数 $z=f\left(x_1, \cdots, x_n\right)$ 的约束极值或约束最值. 这时作 Lagrange 函数如下(其中和式前写为负号): $$ L\left(x_1, \cdots, x_n, \lambda_1, \cdots, \lambda_k\right)=f\left(x_1, \cdots, x_n\right)-\sum_{i=1}^k \lambda_i g_i\left(x_1, \cdots, x_n\right) \text {, } $$ 其中的 $\lambda_1, \cdots, \lambda_k$ 称为 Lagrange 乘子 ${ }^{(1)}$ . 定理 0.2 设点 $P_0\left(x_1^0, \cdots, x_n^0\right)$ 是在约束条件 $g_1=\cdots=g_k=0$ 的条件下目标函数 $f$ 的约束极值点(或约束最值点),且 Jacobi 矩阵 $\left(\frac{\partial g_i}{\partial x_j}\right)_{1 \leqslant i \leqslant k, 1 \leqslant j \leqslant n}$ 在点 $P_0$ 处满秩,则一定存在 $k$ 个数 $\lambda_1^0, \cdots, \lambda_k^0$ ,它们与 $x_1^0, \cdots, x_n^0$ 一起是 Lagrange 函数 $L$的驻点,即满足下列 $n+k$ 个方程: $$ L_{x_1}=0, \cdots, L_{x_n}=0 ; \quad L_{\lambda_1}=0, \cdots, L_{\lambda_k}=0 $$ 分析 其中后 $k$ 个方程就是约束条件,又不含有乘子,对点 $P_0$ 总是满足的.因此只要考虑前 $n$ 个方程。 利用梯度向量的概念,可以将前 $n$ 个等式写成一个向量等式,即成立 $$ \operatorname{grad} f\left(P_0\right)=\sum_{i=1}^k \lambda_i^0 \operatorname{grad} g_i\left(P_0\right) $$ 这样就知道(1)有明显的几何意义,即在点 $P_0\left(x_1^0, \cdots, x_n^0\right)$ 处目标函数 $f$ 的梯度向量可以用约束条件中的函数 $g_1, \cdots, g_k$ 在该点的梯度向量线性表出,其组合系数就是 $\lambda_i^0(i=1, \cdots k)$ 。 证 写出在点 $P_0$ 处由约束条件中的 $k$ 个函数的偏导数组成的 Jacobi 矩阵 $\left(\frac{\partial g_i}{\partial x_j}\right)_{1 \leqslant i \leqslant k, 1 \leqslant j \leqslant n}$ ,即一个 $k \times n$ 矩阵: $$ \left(\begin{array}{ccc} \frac{\partial g_1}{\partial x_1} & \cdots & \frac{\partial g_1}{\partial x_n} \\ \vdots & \ddots & \vdots \\ \frac{\partial g_k}{\partial x_1} & \cdots & \frac{\partial g_k}{\partial x_n} \end{array}\right)_{P_0} $$ 从定理的条件知这个矩阵满秩(注意 $1 \leqslant k<n$ ),因此可以用隐函数存在定理 ${ }^{(1)}$于 $g_1=\cdots=g_k=0$ ,由此推知在点 $P_0$ 的一个邻域中存在惟一的隐函数,即使得 $x_1, \cdots, x_n$ 中的 $k$ 个变量成为另外 $n-k$ 个变量的函数。该隐函数是从 $R ^{n-k}$ 中的一个邻域到 $R ^k$ 的映射,满足 $k$ 个约束条件。 将上述隐函数组代入约束条件中得到关于 $n-k$ 个变量的 $k$ 个恒等式.利用一阶全微分的形式不变性就有以下 $k$ 个等式(当然在点 $P_0$ 处也成立): $$ \left.\begin{array}{l} d g_1=\frac{\partial g_1}{\partial x_1} d x_1+\cdots+\frac{\partial g_1}{\partial x_n} d x_n=0 \\ \ldots \ldots \cdots \\ d g_k=\frac{\partial g_k}{\partial x_1} d x_1+\cdots+\frac{\partial g_1}{\partial x_n} d x_n=0 \end{array}\right\} $$ 另一方面,由于 $P_0$ 为极值点,将上述隐函数组代入目标函数 $f$ 中,就使得 $f$ 从 $n$ 个自变量的函数变成为 $n-k$ 个自变量的函数,同时问题从约束极值成为无约束极值.用 Fermat 定理就知道这个函数在极值点处对于这 $n-k$ 个自变量的偏导数 等于 0 ,也就是 $d z=0$ .利用一阶微分的形式不变性,就可以不区分在 $x_1, \cdots, x_n$中的自变量和隐函数的因变量,从而得到 ${ }^{(1)}$ $$ d f=\frac{\partial f}{\partial x_1} d x_1+\cdots+\frac{\partial f}{\partial x_n} d x_n=0 $$ 现在考察向量 $d x =\left( d x_1, \cdots, d x_n\right)$ 。从条件(2)可见 $d x$ 与 $k$ 个线性无关向量 $\operatorname{grad} g_1\left(P_0\right), \cdots, \operatorname{grad} g_k\left(P_0\right)$ 正交.将这 $k$ 个向量张成的 $k$ 维子空间记为 $$ M=\operatorname{Span}\left\{\operatorname{grad} g_1\left(P_0\right), \cdots, \operatorname{grad} g_k\left(P_0\right)\right\} $$ 则 $d x \perp M$ ,也就是 $d x \in M^{\perp}$ ,这里的记号 $M^{\perp}$ 是 $M$ 的正交补子空间. 条件(3)表明向量 $\operatorname{grad} f\left(P_0\right)$ 与所有这样的 $d x$ 正交,由于 $d x$ 的全体组成 $M^{\perp}$ ,而 $\left(M^{\perp}\right)^{\perp}=M$ ,因此 $\operatorname{grad} f\left(P_0\right) \in M$ ,这表明它是 $\operatorname{grad} g_1\left(P_0\right), \cdots, \operatorname{grad} g_k\left(P_0\right)$的线性组合,即成立 $(1)$ ,其组合系数就是定理所要求的 Lagrange 乘子. 本小节的第二个问题是考虑能否将前面用 Hesse 矩阵给出的无约束极值充分条件推广到约束极值的情况。 由于在约束极值问题中,$f$ 在点 $P_0$ 的一阶偏导数并不都等于 0 ,因此不能将 $\Delta f$ 写成为自变量增量的二次型加上高阶项,并从二次型的定号与不定号来判定是否是极值以及极值的类型。 这里可以介绍用 Lagrange 函数的 Hesse 矩阵来判定极值的方法.记 $x^0=$ $\left(x_1^0, \cdots, x_n^0\right), \lambda=\left(\lambda_1, \cdots, \lambda_k\right), \lambda^0=\left(\lambda_1^0, \cdots, \lambda_k^0\right)$ ,并设 $f, g_1, \cdots, g_k$ 均在点 $P_0$ 邻近二阶连续可微.利用 Lagrange 函数 $L( x , \lambda)$ 以 $\left( x ^0, \lambda^0\right)$ 为驻点,就有 $$ \begin{aligned} &\begin{aligned} \Delta f & =f( x )-f\left( x ^0\right) \\ & =L\left( x , \lambda^0\right)-L\left( x ^0, \lambda^0\right) \\ & =\frac{1}{2!} \sum_{i, j=1}^n \frac{\partial^2 L}{\partial x_i \partial x_j}\left( x ^0, \lambda^0\right) \Delta x_i \Delta x_j+o\left(r^2\right)(r \rightarrow 0), \end{aligned}\\ &\text { 其中 } r=|\Delta x| \text { 与过去相同.} \end{aligned} $$
刷题
做题,是检验是否掌握数学的唯一真理
上一篇:
约束条件为不等式的例子
下一篇:
向量值函数的全导数
本文对您是否有用?
有用
(
0
)
无用
(
0
)
纠错
高考
考研
关于
赞助
公式
科数网是专业专业的数学网站。