References

1. Linear Programs (LPs)

Definition (Linear Program, LP). 目标函数和约束函数都是 affine 时的优化问题称为线性规划 (Linear Program, LP), 其一般形式为:

  • 其中 , , , , , .

1.1 LP 标准形式与一般形式

对于含等式约束的线性规划, 其标准形式为:

对于不含等式约束的线性规划, 其标准形式为:

我们可以通过引入松弛变量和变量替换将一般形式转化为标准形式.

  • 对于不等式约束 , 引入松弛变量 , 使得 .
  • 对于无约束变量 , 可以将其表示为两个非负变量之差: , 其中 .
  • 目标函数中的常数项 可以忽略, 因为它不会影响最优解.

因此通过上述变换, 一般形式转化为标准形式的结果为:

Example (Basis Pursuit). 给定高维稀疏的线性系统 , 其中 , 且 , 希望找到最稀疏的解 . 则原始问题为:

其中 表示 中非零元素的个数. 可以通过将 范数替换为 范数来得到一个线性规划近似:

该问题之所以是线性规划, 是因为 可以通过引入辅助变量 转化为线性目标函数:

  • 前两个不等式确保 , 而目标函数最小化 会推动 接近 .

Example (Dantzig Selector). 对于上述高维稀疏问题, 当允许 时, 可以使用 Dantzig 选择器:

  • 其中 是残差 , 故 表示每个预测变量与残差的相关性, 该约束限制了这种相关性最大值不超过超参数 .

该问题同样可以转化为线性规划:

  • 对于 , 该约束等价于松弛后逐分量 .
  • 对于 , 同样引入辅助变量 并最小化 .

因此, Dantzig 选择器可以表示为线性规划:

2. Quadratic Programs (QPs)

Definition (Convex Quadratic Program, CQP). 凸二次规划(Convex Quadratic Program, CQP)的一般形式为:

  • 其中 是半正定矩阵, 以确保目标函数是凸的.

同样其也可以转化为标准形式:

Example (Portfolio Optimization). 给定 种资产, 其预期收益率为 , 协方差矩阵为 , 投资组合权重为 . 投资组合优化问题可以表示为:

  • 其中 是风险厌恶系数 (risk-aversion coefficient).

Example (Support Vector Machine). 支持向量机 (SVM) 的训练问题也可以表示为凸二次规划. 给定训练数据集 , 其中 是特征向量, 是标签. SVM 的优化问题为:

  • 其中 是权重向量, 是偏置, 是松弛变量, 是惩罚参数.

Example (LASSO). LASSO (Least Absolute Shrinkage and Selection Operator) 回归问题也可以转化为凸二次规划. 给定数据矩阵 和响应向量 , LASSO 的优化问题为:

  • 其中 是一个超参数, 控制稀疏性水平.

3. Semidefinite Programs (SDPs)

3.1 Motivation

回顾在 LP 问题中, 我们考虑一般形式:

  • 其中不等式约束 是逐分量的.

如果我们希望将不等式约束推广, 从元素级别的约束扩展到矩阵级别的约束, 则可以引入半正定锥 (positive semidefinite cone) 的概念.

Recap (Facts about Positive Semidefinite Matrices).

在进行半正定规划之前, 我们先回顾一些关于半正定矩阵的基本事实.

  • 为所有 实对称矩阵的集合(实对称矩阵的特征值均为实数).
  • 为所有 实对称半正定矩阵的集合, 其所有特征值均非负.
  • 为所有 实对称正定矩阵的集合, 其所有特征值均为正.

可以定义在 上的内积. 对于任意 , 定义:

还可以定义矩阵的不等式. 对于 , 记 当且仅当 ; 类似地, 记 当且仅当 .

Definition (Semidefinite Program). 半正定规划 (Semidefinite Program, SDP) 的一般形式为:

  • 其中 , , , .
  • 为对角矩阵时, SDP 退化为线性规划 (LP).

其标准形式为:

  • 其中 , , .

Example (Trace Norm Minimization).

  • 对于未知量 , 可以观测到线性测量 , 其中 是已知的测量矩阵, 此时方程有无穷多解. 额外引入稀疏的先验假设, 故优化目标为 . 该问题是 NP-hard 的, 因此可以使用凸的 范数作为松弛.
  • 进一步扩展到矩阵形式, 对于矩阵未知量 , 观测到线性测量 , 其中 是线性映射, , 其第 个分量为 . 故优化目标为 . 类比 的关系, 可以使用矩阵的迹范数 (trace norm, 矩阵奇异值之和) 作为矩阵秩 (矩阵非零奇异值个数) 的凸松弛, 因此得到的优化问题为:
  • 其中 , 的奇异值. 该问题可通过对偶形式转化为 SDP.

4. Conic Programs

锥规划 (Conic Program) 是一种更一般的凸优化问题形式, 其目标函数为线性函数, 约束条件为变量属于某个凸锥.

Definition (Conic Program). 锥规划的一般形式为:

  • 其中 , , .
  • 是线性映射, 其中 是某个有限维 Euclidean 空间, 例如 () 或 ().
  • 中的一个闭凸锥 (closed convex cone), 其满足:
    • Cone: .
    • Convex: .
    • Closed: 包含其边界点.

在 Boyd 的书中, 考虑 , 此时的 conic program 为:

  • 其中 ,
  • 是一个闭凸锥, 且不等式 定义为: 当且仅当 .