References
- Lecture: https://www.stat.cmu.edu/~ryantibs/convexopt-F18/
- Reading: 最优化: 建模、算法与理论, 刘浩洋等, 5.4 小节.
1. Duality and Lagrangian
考虑如下一般的含约束的优化问题 (不要求是凸的):
其中 都是定义在 上或其子集上的实值函数. 该问题的可行域为: . 记该问题的最优值为 . 若存在 使得 , 则称 为最优解.
Definition (Lagrangian). 对于上述优化问题, 定义 Lagrangian 函数如下:
- 其中 是与不等式约束相关的 Lagrange 乘子, 是与等式约束相关的 Lagrange 乘子.
Note: Lagrangian domain
注意, 此处 的有关全部约束已经被放入了 Lagrangian 函数中. 若 在全空间 上有定义, 则 可视为定义在 上; 若它们只在子集上定义, 则 应理解为定义在这些函数的共同定义域上.
Definition (Lagrange Dual Function). 定义 Lagrange 函数在给定 下关于 的下确界为 Lagrange Dual Function :
- 给定 , 若 关于 是 unbounded below 的, 则 ; 否则 是一个实数.
- 由于 是关于 的一族逐点定义的 affine 函数的下确界, 可以证明不论原问题的凹凸性, Lagrange Dual Function 是一个凹函数.
- 记号上, 为避免与约束函数 混淆, 这里用 表示对偶函数.
Lemma (Weak Duality). 对于上述优化问题, 是原问题的一个下界, 即对于任意 , 恒有:
Proof of weak duality
对于可行解 , 由于 和 , 可得:
因此 .
Definition (Lagrange Dual Problem). 定义 Lagrange Dual Problem 如下:
- 由于 是一个凹函数, Lagrange Dual Problem 是一个凸优化问题 (即使原问题不是凸的).
下图是一个具体的例子, 其原函数为 是显然非凸的, 但其 Lagrange Dual Function 是凹的 (等价地, 是凸的).
- 当 时, 该下界没有意义. 因此往往我们只考虑那些使 有界的 作为 Lagrange Dual Function 的定义域: . 对于满足条件的 , 称为 dual feasible.
Definition (Strong Duality). 记 Lagrange Dual Problem 的最优值为 , 原问题和 Lagrange Dual Problem 之间的最优值差距为 duality gap: . 当 时, 称原问题满足 strong duality.
Example (Univariate Lagrangian and Dual Function).
如图左图为 Lagrange 函数一元情况的简化例子.
- 黑色实线为原问题的目标函数 , 短横线为不等式约束 , 因此红色框住的区域为原问题的可行域 .
- 此时的 Lagrangian 函数为 , 其中 是与不等式约束相关的 Lagrange 乘子, 在图中为一族点虚线.
- 根据 的取值不同, 该族点虚线的具体形状不同, 但可以看到在可行域内, 该族点虚线都在黑色实线的下方, 即 .
右图为对应的 Lagrange Dual Function 的图像.
- 可以看到 是一个关于 的凹函数, 对应着左图中一族点虚线的下确界.
- 图中水平虚线为原问题的最优值 . 可以看到对于任意 , 都有 , 即满足弱对偶.
- 由于 的最大值 距离水平虚线 有一个 gap, 因此该例子不满足强对偶.
2. Examples of Duality for Classic Canonical Problems
2.1 Duality for Linear Programming
考虑如下的线性规划问题:
- 其中 是目标函数的系数向量, 是约束矩阵, 是约束的常数项.
对于等式约束, 引入 Lagrange 乘子 ; 对于不等式约束, 引入 Lagrange 乘子 . 则该问题的 Lagrangian 函数为:
其 Lagrange Dual Function 为:
因此只考虑使得 的可行解 作为 Lagrange Dual Function 的定义域: . 对于满足条件的 , 称为 dual feasible.
Lagrange Dual Problem 为:
令 , 并消去 (即 ), 则 Lagrange Dual Problem 可以写为更熟悉的标准形式:
若再次将该对偶问题视为原问题, 则该对偶问题的对偶问题与原问题等价. 事实上, LP 问题与其对偶问题互为对偶问题.
2.2 Duality for Quadratic Programming
考虑如下 QP 问题:
其中 是约束矩阵, 是约束的常数项.
其 Lagrangian 函数为:
- 其中 是不等式约束 的乘子, 是等式约束 的乘子.
令 .
当 时, 其 Lagrange Dual Function 为:
对应的对偶问题为:
若 是半正定矩阵 (可能奇异), 则 Lagrange Dual Function 为:
对应的对偶问题仍为:
Example (Quadratic programming dual function).
如图所示是一个二元场景下的 QP 问题的原问题和对偶问题. 可见, 对偶函数 关于 是凹函数, 且在对偶可行点上都提供了原问题的一个 lower bound.