凸函数和凹函数

设 $f:S ightarrow \mathbb{R}$,其中 S 是 $\mathbb{R}^n$ 中的非空凸集,则如果 $f\left ( \lambda x_1+\left ( 1-\lambda ight )x_2 ight )\leq \lambda f\left ( x_1 ight )+\left ( 1-\lambda ight )f\left ( x_2 ight ), \forall \lambda \in \left ( 0,1 ight )$,则称 $f\left ( x ight )$ 在 S 上是凸的。

另一方面,设 $f:S ightarrow \mathbb{R}$,其中 S 是 $\mathbb{R}^n$ 中的非空凸集,则如果 $f\left ( \lambda x_1+\left ( 1-\lambda ight )x_2 ight )\geq \lambda f\left ( x_1 ight )+\left ( 1-\lambda ight )f\left ( x_2 ight ), \forall \lambda \in \left ( 0, 1 ight )$,则称 $f\left ( x ight )$ 在 S 上为凹集。

设 $f:S ightarrow \mathbb{R}$,其中 S 是 $\mathbb{R}^n$ 中的非空凸集,则称 $f\left ( x ight )$ 在 S 上为严格凸集,如果 $f\left ( \lambda x_1+\left ( 1-\lambda ight )x_2 ight )< \lambda f\left ( x_1 ight )+\left ( 1-\lambda ight )f\left ( x_2 ight ), \forall \lambda \in \left ( 0, 1 ight )$。

设 $f:S ightarrow \mathbb{R}$,其中 S 是 $\mathbb{R}^n$ 中的非空凸集,则如果 $f\left ( \lambda x_1+\left ( 1-\lambda ight )x_2 ight )> \lambda f\left ( x_1 ight )+\left ( 1-\lambda ight )f\left ( x_2 ight ), \forall \lambda \in \left ( 0, 1 ight ),则称 $f\left ( x ight )$ 在 S 上严格凹。 )$。

示例

  • 线性函数既是凸函数又是凹函数。

  • $f\left ( x ight )=\left | x ight |$ 是凸函数。

  • $f\left ( x ight )= \frac{1}{x}$ 是凸函数。

定理

设 $f_1,f_2,...,f_k:\mathbb{R}^n ightarrow \mathbb{R}$ 为凸函数。考虑函数 $f\left ( x ight )=\displaystyle\sum\limits_{j=1}^k \alpha_jf_j\left ( x ight )$,其中 $\alpha_j>0,j=1, 2, ...k,$,则 $f\left ( x ight )$ 为凸函数。

证明

由于 $f_1,f_2,...f_k$ 为凸函数

因此,$f_i\left ( \lambda x_1+\left ( 1-\lambda ight )x_2 ight )\leq \lambda f_i\left ( x_1 ight )+\left ( 1-\lambda ight )f_i\left ( x_2 ight ),\forall \lambda \in \left ( 0, 1 ight )$ 和 $i=1, 2,....,k$

考虑函数 $f\left ( x ight )$。

因此,

$ f\left ( \lambda x_1+\left ( 1-\lambda ight )x_2 ight )$

$=\displaystyle\sum\limits_{j=1}^k \alpha_jf_j\left ( \lambda x_1 +1-\lambda ight )x_2\leq \displaystyle\sum\limits_{j=1}^k\alpha_j\lambda f_j\left ( x_1 ight )+\left ( 1-\lambda ight )f_j\left ( x_2 ight )$

$\Rightarrow f\left ( \lambda x_1+\left ( 1-\lambda ight )x_2 ight )\leq \lambda \left ( \displaystyle\sum\limits_{j=1}^k \alpha _jf_j\left ( x_1 ight ) ight )+\left ( \displaystyle\sum\limits_{j=1}^k \alpha _jf_j\left ( x_2 ight ) ight )$

$\Rightarrow f\left ( \lambda x_1+\left ( 1-\lambda ight )x_2 ight )\leq \lambda f\left ( x_2 ight )\leq \left ( 1-\lambda ight )f\left ( x_2 ight )$

因此,$f\left ( x ight )$ 是凸函数。

定理

设 $f\left ( x ight )$ 是凸集 $S\subset \mathbb{R}^n$ 上的凸函数,则局部$f\left ( x ight )$ 在 S 上的最小值是全局最小值。

证明

设 $\hat{x}$ 是 $f\left ( x ight )$ 的局部最小值,且 $\hat{x}$ 不是全局最小值。

因此,$\exists \hat{x} \in S$ 使得 $f\left ( \bar{x} ight )< f\left ( \hat{x} ight )$

由于 $\hat{x}$ 是局部最小值,因此存在邻域 $N_\varepsilon \left ( \hat{x} ight )$ 使得 $f\left ( \hat{x} ight )\leq f\left ( x ight ),\forall x \in N_\varepsilon \left ( \hat{x} ight )\cap S$

但 $f\left ( x ight )$ 是 S 上的凸函数,因此对于 $\lambda \in \left ( 0, 1 ight )$

我们有 $\lambda \hat{x}+\left ( 1-\lambda ight )\bar{x}\leq \lambda f\left ( \hat{x} ight )+\left ( 1-\lambda ight )f\left ( \bar{x} ight )$

$\Rightarrow \lambda \hat{x}+\left ( 1-\lambda ight )\bar{x>< \lambda f\left ( \hat{x} ight )+\left ( 1-\lambda ight )f\left (\hat{x} ight )$

$\Rightarrow \lambda \hat{x}+\left ( 1-\lambda ight )\bar{x>< f\left (\hat{x} ight ), \forall \lambda \in \left ( 0,1 ight )$

但对于某些 $\lambda<1$ 但接近 1 的,我们有

$\lambda \hat{x}+\left ( 1-\lambda ight )\bar{x} \in N_\varepsilon \left ( \hat{x} ight )\cap S$ 和 $f\left ( \lambda \hat{x}+\left ( 1-\lambda ight )\bar{x} ight )< f\left ( \bar{x} ight )$

这是一个矛盾。

因此,$\bar{x}$ 是全局最小值。

上图

设 S 是 $\mathbb{R}^n$ 中的非空子集,且设 $f:S ightarrow \mathbb{R}$,则 f 的上图表示为 epi(f) 或 $E_f$,是 $\mathbb{R}^n+1$ 的子集,其定义为 $E_f=\left \{ \left ( x,\alpha ight ):x \in \mathbb{R}^n, \alpha \in \mathbb{R}, f\left ( x ight )\leq \alpha ight \}$

下图

设 S 是 $\mathbb{R}^n$ 中的非空子集,且设 $f:S ightarrow \mathbb{R}$,则 f 的下标表示为 hyp(f) 或 $H_f=\left \{ \left ( x, \alpha ight ):x \in \mathbb{R}^n, \alpha \in \mathbb{R}^n, \alpha \in \mathbb{R}, f\left ( x ight )\geq \alpha ight \}$

定理

设 S 为 $\mathbb{R}^n$ 中的非空凸集,且设 $f:S ightarrow \mathbb{R}^n$,则 f 为凸当且仅当其上标 $E_f$ 为凸集。

证明

设 f 为凸函数。

为了证明$E_f$ 是凸集。

设 $\left ( x_1, \alpha_1 ight ),\left ( x_2, \alpha_2 ight ) \in E_f,\lambda \in\left ( 0, 1 ight )$

示 $\lambda \left ( x_1,\alpha_1 ight )+\left ( 1-\lambda ight )\left ( x_2, \alpha_2 ight ) \in E_f$

$\Rightarrow \left [ \lambda x_1+\left ( 1-\lambda ight )x_2, \lambda \alpha_1+\left ( 1-\lambda ight )\alpha_2 ight ]\in E_f$

$f\left ( x_1 ight )\leq \alpha _1, f\left ( x_2 ight )\leq \alpha _2$

因此,$f\left (\lambda x_1+\left ( 1-\lambda ight )x_2 ight )\leq \lambda f\left ( x_1 ight )+\left ( 1-\lambda ight )f \left ( x_2 ight )$

$\Rightarrow f\left ( \lambda x_1+\left ( 1-\lambda ight )x_2 ight )\leq \lambda \alpha_1+\left ( 1-\lambda ight )\alpha_2$

设 $E_f$ 为凸集。

证明 f 是凸的。

即,证明如果 $x_1, x_2 \in S,\lambda \left ( 0, 1 ight )$

$f\left ( \lambda x_1+\left ( 1-\lambda ight )x_2 ight )\leq \lambda f\left ( x_1 ight )+\left ( 1-\lambda ight )f\left ( x_2 ight )$

设 $x_1,x_2 \in S, \lambda \in \left ( 0, 1 ight ),f\left ( x_1 ight ), f\left ( x_2 ight ) \in \mathbb{R}$

由于 $E_f$ 是凸集,$\left ( \lambda x_1+\left ( 1-\lambda ight )x_2, \lambda f\left ( x_1 ight )+\left ( 1-\lambda ight ) ight )f\left ( x_2 ight )\in E_f$

因此,$f\left ( \lambda x_1+\left ( 1-\lambda ight )x_2 ight )\leq \lambda f\left ( x_1 ight )+\left ( 1-\lambda ight )f\left ( x_2 ight )$