全局最优的充分必要条件
定理
设 f 为二阶可微函数。如果 $\bar{x}$ 为局部最小值,则 $\bigtriangledown f\left ( \bar{x} ight )=0$,Hessian 矩阵 $H\left ( \bar{x} ight )$ 为半正定矩阵。
证明
设 $d \in \mathbb{R}^n$。由于 f 在 $\bar{x}$ 处二阶可微。
因此,
$f\left ( \bar{x} +\lambda d ight )=f\left ( \bar{x} ight )+\lambda \bigtriangledown f\left ( \bar{x} ight )^T d+\lambda^2d^TH\left ( \bar{x} ight )d+\lambda^2d^TH\left ( \bar{x} ight )d+$
$\lambda^2\left \| d ight \|^2\beta \left ( \bar{x}, \lambda d ight )$
但 $\bigtriangledown f\left ( \bar{x} ight )=0$ 且 $\beta\left ( \bar{x}, \lambda d ight ) ightarrow 0$ 等于 $\lambda ightarrow 0$
$\Rightarrow f\left ( \bar{x} +\lambda d ight )-f\left ( \bar{x} ight )=\lambda ^2d^TH\left ( \bar{x} ight )d$
由于 $\bar{x }$ 是局部最小值,因此存在一个 $\delta > 0$ 使得 $f\left ( x ight )\leq f\left ( \bar{x}+\lambda d ight ), \forall \lambda \in \left ( 0,\delta ight )$
定理
设 $f:S ightarrow \mathbb{R}^n$,其中 $S \subset \mathbb{R}^n$ 在 S 上是二阶可微分的。如果 $\bigtriangledown f\left ( x ight )=0$ 且 $H\left ( \bar{x} ight )$ 是半正定的,则对于所有 $x \in S$,$\bar{x}$ 是全局最优解。
证明
由于 $H\left ( \bar{x} ight )$ 是半正定的,因此 f 在 S 上是凸函数。由于 f 是可微分的并且在 $\bar{x}$ 处凸起
$\bigtriangledown f\left ( \bar{x} ight )^T \left ( x-\bar{x} ight ) \leq f\left (x ight )-f\left (\bar{x} ight ),\forall x \in S$
由于 $\bigtriangledown f\left ( \bar{x} ight )=0,f\left ( x ight )\geq f\left ( \bar{x} ight )$
因此,$\bar{x}$ 是全局最优解。
定理
假设 $\bar{x} \in S$ 是问题 $f:S ightarrow \mathbb{R}$ 的局部最优解,其中 S 是$\mathbb{R}^n$ 的非空子集且 S 是凸的。 $min \:f\left ( x ight )$ 其中 $x \in S$。
则:
$\bar{x}$ 是全局最优解。
如果 $\bar{x}$ 是严格局部最小值或 f 是严格凸函数,则 $\bar{x}$ 是唯一的全局最优解,也是强局部最小值。
证明
设 $\bar{x}$ 是该问题的另一个全局最优解,使得 $x eq \bar{x}$ 且 $f\left ( \bar{x} ight )=f\left ( \hat{x} ight )$
由于 $\hat{x},\bar{x} \in S$ 且 S 是凸函数,则$\frac{\hat{x}+\bar{x}}{2} \in S$且 f 严格凸。
$\Rightarrow f\left ( \frac{\hat{x}+\bar{x}}{2} ight )< \frac{1}{2} f\left (\bar{x} ight )+\frac{1}{2} f\left (\hat{x} ight )=f\left (\hat{x} ight )$
这是矛盾的。
因此,$\hat{x}$是唯一的全局最优解。
推论
设 $f:S \subset \mathbb{R}^n ightarrow \mathbb{R}$ 为可微凸函数,其中 $\phi eq S\subset \mathbb{R}^n$ 为凸集。考虑问题 $min f\left (x ight ),x \in S$,如果 $\bigtriangledown f\left (\bar{x} ight )^T\left (x-\bar{x} ight ) \geq 0,\forall x \in S.$,则 $\bar{x}$ 为最优解
证明
设 $\bar{x}$ 为最优解,即 $f\left (\bar{x} ight )\leq f\left (x ight ),\forall x \in S$
$\Rightarrow f\left (x ight )=f\left (\bar{x} ight )\geq 0$
$f\left (x ight )=f\left (\bar{x} ight )+\bigtriangledown f\left (\bar{x} ight )^T\left (x-\bar{x} ight )+\left \| x-\bar{x} ight \|\alpha \left ( \bar{x},x-\bar{x} ight )$
其中 $\alpha \left ( \bar{x},x-\bar{x} ight ) ightarrow 0$ 为 $x ightarrow \bar{x}$
$\Rightarrow f\left (x ight )-f\left (\bar{x} ight )=\bigtriangledown f\left (\bar{x} ight )^T\left (x-\bar{x} ight )\geq 0$
推论
设 f 为 $\bar{x}$ 处可微凸函数,则当且仅当 $\bigtriangledown f\left 时,$\bar{x}$ 为全局最小值(\bar{x} ight )=0$
示例
$f\left (x ight )=\left (x^2-1 ight )^{3}, x \in \mathbb{R}$.
$\bigtriangledown f\left (x ight )=0 \Rightarrow x= -1,0,1$.
$\bigtriangledown^2f\left (\pm 1 ight )=0, \bigtriangledown^2 f\left (0 ight )=6>0$.
$f\left (\pm 1 ight )=0,f\left (0 ight )=-1$
因此,$f\left (x ight ) \geq -1=f\left (0 ight )\Rightarrow f\left (0 ight ) \leq f \left (x ight)\forall x \in \mathbb{R}$
$f\left (x ight )=x\log x$ 定义在 $S=\left \{ x \in \mathbb{R}, x> 0 ight \}$ 上。
${f}'x=1+\log x$
${f}''x=\frac{1}{x}>0$
因此,此函数是严格凸的。
$f \left (x ight )=e^{x},x \in \mathbb{R}$ 是严格凸的。