科数网
题库
在线学习
高中数学
高等数学
线性代数
概率统计
数学分析
复变函数
离散数学
实变函数
数论
群论
高中物理
词条搜索
科数
试题
高中数学
高数
线代
more
你好
游客,
登录
注册
在线学习
高等数学
高数答疑QA
拉格朗日乘子法,为什么可以求极值?
最后
更新:
2025-03-23 21:40
查看:
5
次
高考专区
考研专区
公式专区
刷题专区
词条搜索
拉格朗日乘子法,为什么可以求极值?
拉格朗日乘子法;多元极值;限制函数
## 引言-直线束 作者:微信公众号[数学之水](#) , 知乎[德基先生](#) **定理** 一条直线通过两条相交直线 $a_1 x+b_1 y+c_1=0, a_2 x+b_2 y+c_2=0$ 的交点的充要条件是存在两个不全为零的常数 $\lambda_1 、 \lambda_2$ 使这条直线方程为 $$ \lambda_1\left(a_1 x+b_1 y+c_1\right)+\lambda_2\left(a_2 x+b_2 y+c_2\right)=0 ...(5.26) $$ 关于他的证明可以参考 [直线束](https://kb.kmath.cn/kbase/detail.aspx?id=1341) 如果我们假设$\lambda_1 \ne 0$, (5.26) 两侧同除以$\lambda_1$,并零 $\lambda=\frac{\lambda_1}{\lambda_2}$, 则通过定点的直线束,的直线方程可以定义为 $$ \left(a_1 x+b_1 y+c_1\right)+\lambda\left(a_2 x+b_2 y+c_2\right)=0 ...(5.27) $$ {width=300px} 如果令$f_1=a_1 x+b_1 y+c_1$ 而 $a_2 x+b_2 y+c_2=0$ 要求$f_1$的极值,我们可以构造一个函数 $$ f=f_1+\lambda f_2 $$ 上面是平面的情况,现在对上面的思维进行扩展到多维空间。 ## 拉格朗日乘法子 从北京到上海,如果没有约束条件。那么肯定是选择两点直线最短,能坐飞机坐飞机。但如果要求控制预算则需要在约束条件前提下进行选择,此时就会变的复杂,同样一个函数在约束线求极值也是相对复杂,幸运的是拉格朗日乘法子让限制函数求极值变的简单。具体方法如下 首先,给出一个拉格朗日函数 $L(x, y, \lambda)=f(x, y)+ \lambda g(x, y)$ ,求出拉格朗日函数的极值,就可以得到 $f(x, y)$ 的极值。 具体步骤 - 定义目标函数 $f(x, y)$ 和约束条件 $g(x, y)=0$ 。 - 构造拉格朗日函数 $L(x, y, \lambda)=f(x, y)+ \lambda g(x, y)$。 - 求出拉格朗日函数 $L(x, y, \lambda)$ 的梯度向量:$\partial L / \partial x, \partial L / \partial y, \partial L / \partial \lambda$ )。 - 令其等于零:$\partial L / \partial x=0, \partial L / \partial y=0, \partial L / \partial \lambda=0$ 。 - 解出上述方程组,得到满足约束条件的极值点。 ## 拉格朗日乘子法,为什么可以求极值 读者可能不禁疑问:凭什么引入一个$\lambda$ , 定义一个拉格朗日函数, 求得拉格朗日函数的极值,就可以求得 $f(x, y)$ 的极值了呢? 其背后的原理是什么? 假设空间有一个蓝色曲面 $f(x, y)$(目标函数),还有一个红色曲面$g(x, y)$(限制函数),他们在空间相交,此时交线则是一条曲线,(参考下图红色界痕) 根据上面引子,我们可以设**过界痕的曲面方程束**为 $L=f+\lambda g(x,y)$  ### 平面投影 如果从上往下看曲面,如下图,假设我们的目标函数 $f(x, y)$ 与限制函数 $g(x, y)$ 都在区域 $G$ 上有定义。自然,拉格朗日函数是目标函数与限制函数的线性组合,其必也是在区域 $G$ 上有定义的。这里黄红色的曲线代表满足 $g(x, y)=0$ 的点的集合。点 $M\left(x_0, y_0\right)$ 是拉格朗日函数在区域 $G$ 上的极值点。现在我们来阐明其中的原理,参加下图  为什么拉格朗日函数的极值点会落在限制曲线 $g(x, y)=0$ 上呢? 其就不会落在区域 $G$ 别的地方上吗?那是因为,我们在对拉格朗日函数参数 $\lambda$ 求导时, $\partial L / \partial \lambda $ 得到的函数恰好是 $g(x, y)=0$, 正是因为有了这个条件, 求得的极值点 $M\left(x_0, y_0\right)$ 一定满足 $g\left(x_0, y_0\right)=0$, 所以,它一定会落在曲线 $g(x, y)=0$ 上。 其次, 为什么拉格朗日函数的极值点一定也是 $f(x, y)$ 的极值点呢? 首先, 要注意到, 拉格朗日函数 $L=f+ \lambda g$ 在 $g=0$ 的时候, $L=f$ ,也就是拉格朗日函数与目标函数在曲线 $g(x, y)=0$ 的那条线上是相等的。既如此,拉格朗日函数在 $M\left(x_0, y_0\right)$ 点取到极值,也就是在 $M\left(x_0, y_0\right)$ 的局部邻域内取得极值,曲线的一小段包含在这局部邻域中,也就是说拉格朗日函数在曲线 $g(x, y)=0$ 上取得极值, 而在曲线 $g(x, y)=0$ 上拉格朗日函数与目标函数相等, 那么, 也就是目标函数在曲线 $g(x, y)=0$ 上取得极值。 这, 就是隐藏在拉格朗日乘子法背后的本质。 拉格朗日乘子法这样的巧妙的发明,它的巧妙来源于哪里?该方法巧妙在拉格朗日函数的构造上,它引入参数 $\lambda$ ,并把限制函数包含进去,**把问题升维一次**,然后在升维的基础上求得问题的解,然后**再进行降维**,抛弃参数的值,仅关注 $\left(x_0, y_0\right)$ 的值,这个降维刚刚就降在限制函数所约束的范围内,这一升一降,恰巧就解决了条件极值点的找寻。 ## 从梯度角度考虑 首先要有一个维度的概念 比如: $y=x$ 他的图像是平面里的直线,图形是2维的,但是定义域是一维的 再如$z=x+y$ 他是空间的曲面,图像是3维的,但是定义域是二维的 因此, 我们有一个结论:**函数增加一个未知数,就是增加了一个维度**,拉格朗日函数 $L=f(x,y)+ \lambda G(x,y)$ 增加了一个参数,所以,他的图像在四维里,而他的定义域是$x,y,\lambda$ 是三维的,这时,我们就要用梯度的一个等值线结论。所以也可以从梯度的角度考虑,在[梯度](https://kb.kmath.cn/kbase/detail.aspx?id=391) 介绍过等值线,这些等值线投影到水平面上,会形成一个个曲线。可**以证明速度方向的水平投影正是水平面上该点曲线的法向量**。 拉格朗日乘数法的例子几何意义参考下图,可以发现,只有在切点、$f(x,y)$、$g(x,y)$ 方向向量在一条直线上有极值。 
上一篇:
什么是梯度?为什么梯度下降最快?
下一篇:
没有了
在线学习仅为您提供最基础的数学知识,
开通会员
可以挑战海量
超难试题
, 分享本文到朋友圈,邀请更多朋友一起学习。
本文对您是否有用?
有用
(
0
)
无用
(
0
)
评论
更多
初中数学
高中数学
高中物理
高等数学
线性代数
概率论与数理统计
复变函数
离散数学
实变函数
数学分析
数论
群论
纠错
高考
考研
关于
赞助
留言
科数网是专业专业的数学网站。