References

1. Duality and Lagrangian

考虑如下一般的含约束的优化问题 (不要求是凸的):

其中 都是定义在 上或其子集上的实值函数. 该问题的可行域为: . 记该问题的最优值为 . 若存在 使得 , 则称 为最优解.

Definition (Lagrangian). 对于上述优化问题, 定义 Lagrangian 函数如下:

  • 其中 是与不等式约束相关的 Lagrange 乘子, 是与等式约束相关的 Lagrange 乘子.

Note: Lagrangian domain

注意, 此处 的有关全部约束已经被放入了 Lagrangian 函数中. 若 在全空间 上有定义, 则 可视为定义在 上; 若它们只在子集上定义, 则 应理解为定义在这些函数的共同定义域上.

Definition (Lagrange Dual Function). 定义 Lagrange 函数在给定 下关于 的下确界为 Lagrange Dual Function :

  • 给定 , 若 关于 是 unbounded below 的, 则 ; 否则 是一个实数.
  • 由于 是关于 的一族逐点定义的 affine 函数的下确界, 可以证明不论原问题的凹凸性, Lagrange Dual Function 是一个凹函数.
  • 记号上, 为避免与约束函数 混淆, 这里用 表示对偶函数.

Lemma (Weak Duality). 对于上述优化问题, 是原问题的一个下界, 即对于任意 , 恒有:

Proof of weak duality

  • 对于可行解 , 由于 , 可得:

  • 因此 .

Definition (Lagrange Dual Problem). 定义 Lagrange Dual Problem 如下:

  • 由于 是一个凹函数, Lagrange Dual Problem 是一个凸优化问题 (即使原问题不是凸的).

下图是一个具体的例子, 其原函数为 是显然非凸的, 但其 Lagrange Dual Function 是凹的 (等价地, 是凸的).

Ref: CMU Lecture Notes
  • 时, 该下界没有意义. 因此往往我们只考虑那些使 有界的 作为 Lagrange Dual Function 的定义域: . 对于满足条件的 , 称为 dual feasible.

Definition (Strong Duality). 记 Lagrange Dual Problem 的最优值为 , 原问题和 Lagrange Dual Problem 之间的最优值差距为 duality gap: . 当 时, 称原问题满足 strong duality.

Example (Univariate Lagrangian and Dual Function).

Ref: Convex Optimization, Boyd. p.231

如图左图为 Lagrange 函数一元情况的简化例子.

  • 黑色实线为原问题的目标函数 , 短横线为不等式约束 , 因此红色框住的区域为原问题的可行域 .
  • 此时的 Lagrangian 函数为 , 其中 是与不等式约束相关的 Lagrange 乘子, 在图中为一族点虚线.
    • 根据 的取值不同, 该族点虚线的具体形状不同, 但可以看到在可行域内, 该族点虚线都在黑色实线的下方, 即 .

右图为对应的 Lagrange Dual Function 的图像.

  • 可以看到 是一个关于 的凹函数, 对应着左图中一族点虚线的下确界.
  • 图中水平虚线为原问题的最优值 . 可以看到对于任意 , 都有 , 即满足弱对偶.
  • 由于 的最大值 距离水平虚线 有一个 gap, 因此该例子不满足强对偶.

2. Examples of Duality for Classic Canonical Problems

2.1 Duality for Linear Programming

考虑如下的线性规划问题:

  • 其中 是目标函数的系数向量, 是约束矩阵, 是约束的常数项.

对于等式约束, 引入 Lagrange 乘子 ; 对于不等式约束, 引入 Lagrange 乘子 . 则该问题的 Lagrangian 函数为:

其 Lagrange Dual Function 为:

因此只考虑使得 的可行解 作为 Lagrange Dual Function 的定义域: . 对于满足条件的 , 称为 dual feasible.

Lagrange Dual Problem 为:

, 并消去 (即 ), 则 Lagrange Dual Problem 可以写为更熟悉的标准形式:

若再次将该对偶问题视为原问题, 则该对偶问题的对偶问题与原问题等价. 事实上, LP 问题与其对偶问题互为对偶问题.

2.2 Duality for Quadratic Programming

考虑如下 QP 问题:

其中 是约束矩阵, 是约束的常数项.

其 Lagrangian 函数为:

  • 其中 是不等式约束 的乘子, 是等式约束 的乘子.

.

时, 其 Lagrange Dual Function 为:

对应的对偶问题为:

是半正定矩阵 (可能奇异), 则 Lagrange Dual Function 为:

对应的对偶问题仍为:

Example (Quadratic programming dual function).

Ref: CMU Lecture Notes

如图所示是一个二元场景下的 QP 问题的原问题和对偶问题. 可见, 对偶函数 关于 是凹函数, 且在对偶可行点上都提供了原问题的一个 lower bound.