回忆,定义在区间$I=(a,b)$上的函数$\varphi$称为凸函数, 如果对任意的$a < x < b$, $a < y < b$, 以及任意的$0\leq\lambda\leq1$, 成立如下不等式
\begin{equation}
\varphi\left( (1-\lambda)x+\lambda y \right)\leq (1-\lambda)\varphi(x)+\lambda\varphi(y).
\label{eq:convex}
\end{equation}
从图形上, 假设$a < s < t < u < b$, 令
$t=(1-\lambda)s+\lambda u$, 则$\lambda= \frac{t-s}{u-s}$, $1-\lambda= \frac{u-t}{u-s}$, 从而\eqref{eq:convex}得到
\[
\varphi(t)\leq (1-\lambda)\varphi(s)+\lambda \varphi(u)\iff (1-\lambda)(\varphi(t)-\varphi(s))\leq \lambda \left( \varphi(u)-\varphi(t) \right),
\]
故
\[
\frac{\varphi(t)-\varphi(s)}{t-s}\leq \frac{\varphi(u)-\varphi(t)}{u-t}.
\]
Theorem 1 (Jensen不等式). 假设$\mu$是区域$\Omega$上的Lebesuge测度,$f\in L^1(\Omega;\mu)$是$\Omega$上的实可积函数。如果$a < f(x) < b$, 对任意的$x\in\Omega$都成立;那么对任意在区间$I=(a,b)$上的凸函数$\varphi$, 都有
\[
\varphi\left( \frac{1}{ \lvert \Omega \rvert}\int_\Omega fd\mu \right)\leq \frac{1}{ \lvert \Omega \rvert}\int_\Omega (\varphi\circ f)d\mu.
\]
Proof . 令$t= \frac{1}{ \lvert \Omega \rvert}\int_\Omega fd\mu$, 则$a< t< b$. 定义
\[
\beta:=\sup_{a< s< t} \frac{\varphi(t)-\varphi(s)}{t-s},
\]
则对任意的$u$, 满足$t< u< b$, 我们有
\[
\beta\leq \frac{\varphi(u)-\varphi(t)}{u-t}\implies
\varphi(u)\geq \varphi(t)+\beta(u-t).
\]
另一方面,按照$\beta$的定义,我们知道, 对任意的$a< s< t$, 有
\[
\frac{\varphi(t)-\varphi(s)}{t-s}\leq \beta\implies
\varphi(s)\geq \varphi(t)+\beta(s-t).
\]
故我们得到对任意的$a< s< b$, 成立
\[
\varphi(s)\geq \varphi(t)+\beta(s-t).
\]
特别地,令$s=f(x)$, 我们得到
\[
\varphi(f(x))\geq\varphi\left( \frac{1}{ \lvert \Omega \rvert}\int_\Omega fd\mu \right)+\beta\left( f(x)- \frac{1}{ \lvert \Omega \rvert}\int_\Omega fd\mu \right).
\]
两边同时在$\Omega$上积分得到
\[
\int_{\Omega}\varphi(f(x))d\mu\geq \lvert \Omega \rvert \cdot \varphi\left( \frac{1}{ \lvert \Omega \rvert}\int_\Omega fd\mu \right),
\]
变形记得到欲证之不等式。
这段材料来源于[1].
References
- Real and complex analysis, Third, McGraw-Hill Book Co., New York, 1987. xiv+416. MR924157 ,