最优化理论期末复习
复习课大纲
- 线性优化 LP 建模
- 二维的图解法 LP
- 单纯形表 LP(大M法)闭合、位势 $(u,v)$
- 运输问题(建模,初始值,检验数,负的检验数用闭回路调整)
- 指派问题(匈牙利算法)
- 相关概念、定理(凸集、凸函数、性质、定理)
- 无约束(最速下降法、牛顿法)
- 最优性定理(有、无约束,一阶、二阶、KKT条件)
- 罚函数法、障碍函数的构造
- 遗传算法
22~23最优化理论真题
一、用图解法求解线性规划问题

题目: 用图解法求解线性规划问题($10$ 分)

第一步:将约束条件转化为等式直线方程
将各不等式约束取等号,得到三条约束直线:
- ,该直线过点 $(0, 3)$ 和 $(3, 0)$,可行域位于直线下方;
- ,该直线为过原点的 直线,可行域位于直线上方(即 );
- ,该直线为垂直于 轴的直线,可行域位于直线右侧(即 )。
第二步:求各约束直线的交点(可行域顶点)
联立各约束直线方程,求可行域的顶点坐标:
- 与 联立:,代入得 ,得交点 $A(1, 1)$;
- 与 联立:,解得 ,得交点 $B(1, 2)$;
- 与 联立:,解得 ,,得交点 。
三条直线围成的三角形区域 $ABC$ 即为可行域。
第三步:绘制图形并分析目标函数
第四步:分析目标函数等值线
目标函数 的等值线方程为 ($c$ 为常数),即 。这是一族斜率为 $-1$ 的平行直线。最小化 $f$ 等价于使等值线沿目标函数梯度方向 $(1, 1)$ 的反方向移动,即让常数 $c$ 不断减小。
第五步:确定最优解与最优值
将可行域的三个顶点分别代入目标函数计算:
- 在点 $A(1, 1)$ 处:$f = 1 + 1 = 2$;
- 在点 $B(1, 2)$ 处:$f = 1 + 2 = 3$;
- 在点 处:。
当等值线 移动到点 $A(1, 1)$ 时,$c$ 取到最小值 $2$。若继续沿反方向移动,等值线将完全离开可行域。因此,最优解在顶点 $A$ 处取得。
结论:
最优解为 ,最优值为 。
评分标准对应:
- 正确画出 $3$ 条约束直线各 $1$ 分;
- 正确画出可行域 $2$ 分;
- 正确求出约束直线的交点 $2$ 分;
- 正确求出最优值和最优解 $3$ 分。
叙述并证明无约束最优化问题的一阶必要条件

无约束最优化问题的一般形式为:
其中 为连续可微的目标函数。所谓”无约束”,是指决策变量 $x$ 在整个 $n$ 维欧氏空间 中自由取值,不受到任何等式或不等式约束的限制。
一阶必要条件(定理3)
设 $f(x)$ 在 的某个邻域内有连续的偏导数(即 $f$ 在 附近连续可微),若 是 $f(x)$ 的局部最优解,则
也就是说:若 是局部最优解,则它在该点处的梯度必须为零向量。
满足 的点称为驻点(Stationary Point)或临界点(Critical Point)。驻点可能为局部极小点、局部极大点或鞍点,因此梯度为零只是极值点的必要条件,而非充分条件。
预备知识
在正式证明之前,先回顾几个关键概念和运算规则:
(1)梯度(Gradient)的定义
对于多元函数 ,它在点 $x$ 处的梯度是一个列向量,由所有一阶偏导数组成:
例如 ,则 ,,于是:
(2)可微的定义
函数 $f$ 在点 处可微(Differentiable),是指存在向量 ,使得对任意方向 ,有:
其中 表示高阶无穷小,即满足 。直观理解就是:当 $d$ 很小时, 比 衰减得更快,可以忽略不计。
可以证明这个向量 $g$ 就是梯度 ,因此上式也常写为:
(3)向量内积的运算规则
对于两个 $n$ 维列向量 和 ,它们的内积(点积)为:
特别地,一个向量与自身的内积等于它的模长平方:
(4)方向导数
函数 $f$ 在点 沿方向 $d$ 的方向导数,衡量了 $f$ 在该方向上的瞬时变化率。当 $f$ 可微时:
若 ,说明沿方向 $d$ 移动时,函数值会下降。
证明:
采用反证法。设 为 $f(x)$ 的局部最优解,假设 。
由于 $f(x)$ 在 的某个邻域内有连续的偏导数,根据一阶泰勒展开公式,对 附近的任意点 $x$,有:
移项得到函数值的增量:
其中 表示从 指向 $x$ 的位移向量, 为该位移的模长(距离), 为比 更高阶的无穷小。
为什么要取负梯度方向?
我们的目标是找到一个方向 ,使得沿该方向移动时,函数值 $f(x)$ 能够下降(这样才能与” 是局部最优解”产生矛盾)。
由于 $f$ 可微,函数值的一阶近似增量为 。我们希望这个一阶项是负的(即函数值下降)。
为什么 能直接等于 ?
首先明确各量的维度:
- $x$ 和 都是 $n$ 维欧氏空间 中的点(也就是 $n$ 维向量);
- 是 $f$ 在 处的梯度,也是 中的一个 $n$ 维向量。
因此:
- 是两个 $n$ 维向量的差,结果仍然是 中的 $n$ 维向量(表示从 指向 $x$ 的位移向量);
- 也是 中的 $n$ 维向量(表示负梯度方向向量)。
既然两者都是同维度的向量,就可以直接令它们相等。这相当于在说:我主动构造一个新的点 $x$,使得从 到 $x$ 的位移恰好是负梯度方向,即:
由于这是无约束优化问题,$x$ 的取值范围是整个 ,所以上面的 $x$ 当然是一个合法的点。
验证:代入后一阶项的符号
现在把 代入一阶项 :
这里一步步来:
- 第一步:将 代入括号内;
- 第二步:利用内积对负号的分配律:,提出负号;
- 第三步:利用自身内积等于模长平方的性质:,得到 。
由于反证法假设了 ,所以 ,于是:
这说明沿负梯度方向移动时,一阶项严格小于零,函数值有下降的趋势。
从几何上看:梯度 指向函数值增长最快的方向,那么负梯度方向 自然就是函数值下降最快的方向。
为什么需要引入步长参数 $t$?
上面的分析只说明了”方向正确”,但还有一个关键问题:如果我们直接令 ,一步跨过去的距离 可能太大,导致 已经跳出了 的局部最优邻域(局部最优只保证邻域内最优,远处可能更大也可能更小)。
因此,我们需要引入一个很小的正数 $t$ 作为步长,控制移动距离:
也就是:
这样,位移的大小为 。只要取 $t > 0$ 充分小,就能保证 $x$ 仍然落在 的局部最优邻域内(因为局部最优要求在 的某个邻域内 最小)。
验证:把负梯度方向代入增量公式
在正式展开之前,先做一个快速验证——将 (即 $t = 1$ 的特殊情况)直接代入一阶泰勒展开的增量公式:
其中 是一个固定的负数(因为 ),而 在步长固定时只是某个有限值。这直观地说明:沿负梯度方向移动,一阶项的贡献是使函数值下降的。
为了使论证更加严谨(确保 $x$ 落在局部邻域内,且高阶无穷小项不至于抵消负项),我们回到带步长 $t$ 的一般形式。
将 代入增量公式:
这里详细说明每一步的运算规则:
- 第一步:将 整体代入 ,同时 ;
- 第二步:利用内积对常数因子的齐次性:,将 $-t$ 提至内积外面;
- 第三步:利用自身内积等于模长平方:。同时,由于 是一个固定的正数,高阶无穷小满足 ($c$ 为非零常数),因此 。
由于假设了 ,所以 ,于是 是一个严格小于零、且与 $t$ 同阶的量。而 $o(t)$ 是比 $t$ 更高阶的无穷小,即满足 。
因此,当 $t > 0$ 充分小时(即 $x$ 充分接近 时):
这是因为负项 与 $t$ 同阶,而 $o(t)$ 在 时趋于零的速度更快,所以负项占主导,总和为负。
于是:
这意味着在 的任意小邻域内,总存在点 使得 ,这与” 是局部最优解”矛盾。
故假设错误,必有 。
几何解释:
梯度 指向函数值增长最快的方向。若在某点梯度不为零,则沿负梯度方向移动可以使函数值下降,因此该点不可能为极小点。只有在梯度为零的点,函数在各个方向上的一阶变化均为零,才有可能成为极值点。
二阶必要条件(定理4)
设 在 处有二阶连续偏导数,若 是 $f$ 的局部极小点,则
其中 为 $f$ 在 处的Hesse矩阵(二阶偏导数矩阵)。该条件说明:局部极小点不仅梯度为零,而且函数在该点的二阶曲率必须”向上开口”(半正定)。
二阶充分条件(定理5)
设 在 的某邻域内有连续的二阶偏导数,若
则 是 $f$ 在该邻域内的严格局部极小点。
三者关系总结如下:
| 条件类型 | 前提 | 结论 |
|---|---|---|
| 一阶必要 | $f$ 在 可微 | 为局部极小点 |
| 二阶必要 | $f$ 在 二阶连续可微 | 为局部极小点 |
| 二阶充分 | $f$ 在 邻域二阶连续可微 | 为严格局部极小点 |









