第五章 随机变量的数字特征

第五章 随机变量的数字特征

5.1 数学期望

5.1.1 离散型随机变量 \(X\) 的数学期望

定义

\(X\) 的分布律为:\(P\{X=x_k\}=p_k,\quad k = 1, 2, \dots\)

若级数 \(\sum\limits_{k=1}^{\infty}x_kp_k\) 绝对收敛(即\(\sum\limits_{k=1}^{\infty}|x_k|p_k\) 收敛)

则称级数 \(\sum\limits_{k=1}^\infty x_kp_k\)\(X\) 的数学期望,记为 \[ E(X)=EX=\sum\limits_{k=1}^{\infty}x_kp_k \]

5.1.2 离散型随机变量 \(X\) 的函数的数学期望

定理

\(Y=g(X)\)\(g(x)\) 是连续函数,随机变量 \(X\) 是离散型随机变量,\(P\{X=x_k\}=p_k,\quad k=1,2,\dots\)

若级数 \(\sum\limits_{k=1}^\infty g(x_k)p_k\) 绝对收敛,则有 \[ EY=Eg(X)=\sum\limits_{k=1}^{\infty}g(x_k)p_k \]

5.1.3 连续型随机变量 \(X\) 的数学期望

定义

\(X\) 的概率密度为 \(f(x)\),若积分 \(\int_{-\infty}^{+\infty}x\cdot f(x)\ \mathrm{d}x\) 绝对收敛(即\(\int^{+\infty}_{-\infty}|x|f(x)\ \mathrm{d}x\) 收敛),则称积分 \(\int_{-\infty}^{+\infty}x\cdot f(x)\ \mathrm{d}x\)\(X\) 的数学期望,记为

\[ EX=\int_{-\infty}^{+\infty}x\cdot f(x)\ \mathrm{d}x \]

5.1.4 连续型随机变量 \(X\) 的函数的数学期望

定理

\(Y=g(X)\)\(g(x)\) 是连续函数,随机变量 \(X\) 的概率密度为 \(f(x)\),若积分 \(\int^{+\infty}_{-\infty}g(x)\cdot f(x)\ \mathrm{d}x\) 绝对收敛,则随机变量 \(Y=g(X)\) 的数学期望 \[ EY=Eg(X)=\int^{+\infty}_{-\infty}g(x)\cdot f(x)\ \mathrm{d}x \]

5.1.5 随机向量的函数的数学期望

\((X,Y)\) 为随机向量,\(g(x,y)\) 为连续函数,那么 \(Z=g(X,Y)\) 是一个随机变量。

  • \((X,Y)\) 为离散型随机变量,其分布律为

\[ P\{X=x_i,Y=y_j\}=p_{ij},\quad i,j=1,2,... \]

则有 \[ E(Z)=Eg(X,Y)=\sum\limits_{i=1}^{\infty}\sum\limits_{j=1}^{\infty}g(x_i,y_j)p_{ij} \] 其中 \(E(Z)=Eg(X,Y)=\sum\limits_{i=1}^{\infty}\sum\limits_{j=1}^{\infty}g(x_i,y_j)p_{ij}\) 绝对收敛。

  • \((X,Y)\) 为连续型,其概率密度为 \(f(x,y)\),则有

\[ E(Z)=Eg(X,Y)=\int^{+\infty}_{-\infty}\int^{+\infty}_{-\infty}g(x,y)\cdot f(x,y) \ \mathrm{d}x\mathrm{d}y \]

其中上式绝对收敛。

5.1.6 数学期望的性质

  1. \(C\) 为常数,则有 \(E(C)=C\)
  2. \(C\) 为常数,\(X\) 为随机变量,则有 \(E(CX)=C\cdot EX\)

  3. \(X,Y\) 为任意随机变量,则 \(E(X+Y)=EX+EY\)

  4. \(X,Y\)相互独立的随机变量,则有 \(E(XY)=EX\cdot EY\)

5.2 方差

5.2.1 定义

\(E[X-E(X)]^2\) 存在,则称其为随机变量 \(X\) 的方差,记为 \(D(X)\)\(Var(x)\),即: \[ D(X)=E[X-E(X)]^2\geq 0 \]\(\sqrt{D(X)}\)\(X\)均方差标准差

5.2.2 方差的计算公式

方差 \(DX=E(X-EX)^2\) ,是 \(X\) 的函数 \((X-EX)^2\) 的数学期望。

  1. \(X\) 是离散型随机变量,分布律为:

\[ P\{X=x_i\}=p_i,\quad i=1,2,... \]

则: \[ DX=E(X-EX)^2=\sum\limits^\infty_{i=1}(x_i-EX)^2p_i\geq 0 \]

  1. \(X\) 是连续型随机变量,概率密度为 \(f(x)\),则

\[ DX=E(X-EX)^2=\int^{+\infty}_{-\infty}(x-EX)^2f(x)\ \mathrm{d}x>0 \]

  1. 简便计算公式

\[ DX=EX^2-(EX)^2 \]

\[ EX^2=DX+(EX)^2 \]

5.2.3 方差的性质

  1. \(C\) 为常数,则有 \(D(C)=0\)
  2. \(k\) 为常数,\(X\) 为随机变量,则有:

\[ D(kX)=k^2DX \]

  1. \(X,Y\)相互独立的随机变量,则有

\[ D(X+Y)=DX+DY \]

\(X_1,X_2,...,X_n\) 为相互独立的随机变量,则有 \[ D(\sum\limits_{i=1}^nk_iX_i)=\sum\limits_{i=1}^nk_i^2DX_i \]

  1. \(DX=0\iff P\{X=EX\}=1\)

5.3 常用随机变量的数学期望和方差

5.3.1 (0-1)分布,\(X\sim B(1,p)\)

\[ \textcolor{red}{EX}=p \] \[ \textcolor{red}{DX}=p(1-p) \]

5.3.2 二项分布,\(X\sim B(n,p)\)

\[ P\{X=k\}=C^k_np^k(1-p)^{n-k}\quad k=0,1,...,n \]

\[ \textcolor{red}{EX}=np \] \[ \textcolor{red}{DX}=np(1-p) \]

5.3.3 泊松分布,\(X\sim \Pi(\lambda)\)

\[ P\{X=k\}=\dfrac{e^{-\lambda}\lambda^k}{k!}\quad k=0,1,2,... \]

\[ \textcolor{red}{EX}=\lambda \] \[ \textcolor{red}{DX}=\lambda \]

5.3.4 均匀分布,\(X\sim U[a,b]\)

\[ f(x)=\left\{\begin{aligned} &\dfrac{1}{b-a},&&a\leq x\leq b\\ &0,&&其它 \end{aligned}\right. \]

\[ \textcolor{red}{EX}=\dfrac{a+b}{2} \] \[ \textcolor{red}{DX}=\dfrac{(b-a)^2}{12} \]

5.3.5 指数分布,\(X\sim e(\lambda)\)

\[ f(x)=\left\{\begin{aligned} &\lambda e^{-\lambda x},&&x>0\\ &0,&&x\leq0 \end{aligned}\right. \]

\[ \textcolor{red}{EX}=\dfrac{1}{\lambda} \] \[ \textcolor{red}{DX}=\dfrac{1}{\lambda^2} \]

5.3.6 正态分布 \(X\sim (\mu,\sigma^2)\)

\[ f(x)=\dfrac{1}{\sigma\sqrt{2\pi}}\exp\left\{-\dfrac{(x-\mu)^2}{2\sigma^2}\right\}\quad ,-\infty<x<+\infty \]

\[ \textcolor{red}{EX}=\mu \] \[ \textcolor{red}{DX}=\sigma^2 \]

定理1:正态分布的性质

  1. \((X_1,X_2)\sim N(\mu_1,\sigma_1^2;\mu_2,\sigma^2_2;\rho)\),则

\[ X_i\sim N(\mu_i,\sigma_i^2) \] \[ EX_i=\mu_i,\quad DX_i=\sigma_i^2 \]

  1. \(X_1,X_2\) 相互独立 \(\iff \rho=0\)

\[ \begin{aligned} Z=k_1X_1+k_2X_2+b&\sim N(EZ,DZ)\\ &\sim N(k_1\mu_1+k_2\mu_2+b,k_1^2\sigma_1^2+k_2^2\sigma^2_2) \end{aligned} \]

定理2:

设随机变量 \(\textcolor{blue}{X_1,X_2,...,X_n},\textcolor{red}{X_{n+1},X_{n+2},...,X_{n+m}}\) 相互独立,\(g(x_1,x_2,...,x_n),h(y_1,y_2,...,y_m)\) 是连续函数,设

\[ Y_1=g(\textcolor{blue}{X_1,X_2,...,X_n}) \] \[ Y_2=h(\textcolor{red}{X_{n+1},X_{n+2},...,X_{n+m}}) \]

\(Y_1,Y_2\) 相互独立

5.4 协方差和相关系数

5.4.1 协方差

定义

称数值 \(E[(X-EX)(Y-EY)]\) 为随机变量 \(X\)\(Y\) 的协方差,记作 \(Cov(X,Y)\) ,即: \[ Cov(X,Y)=E[(X-EX)(Y-EY)] \]

  • 协方差为正,正相关
  • 协方差为负,负相关
  • 协方差为0,零相关
  • 协方差绝对值越大,两个变量同或反向程度也越大

常用计算公式

\[ Cov(X,Y)=E(XY)-EX\cdot EY \]

协方差的性质

  1. \(Cov(X,Y)=Cov(Y,X)\)

  2. \(Cov(aX,bY)=abCov(X,Y)\)

  3. \(Cov(X_1+X_2,Y)=Cov(X_1,Y)+Cov(X_2,Y)\)

  4. \(X,Y\) 相互独立,\(Cov(X,Y)=0\)逆命题不成立

  5. \(D(X+Y)=DX+DY+2Cov(X,Y)\)

    \(D(X-Y)=DX+DY-2Cov(X,Y)\)

5.4.2 相关系数

定义

称数值 \(\dfrac{Cov(X,Y)}{\sqrt{DX}\cdot \sqrt{DY}}\quad DX,DY\ne 0\) 为随机变量 \(X\)\(Y\)相关系数标准协方差,记作 \(\rho_{XY}\) 或简记作 \(\rho\),即: \[ \rho_{XY}=\dfrac{Cov(X,Y)}{\sqrt{DX}\cdot \sqrt{DY}}=Cov(X^*,Y^*) \]\(X,Y\) 的相关系数 \(\rho =0\),则称 \(X,Y\) 不相关

定理

\(X,Y\) 相互独立,则 \[ Cov(X,Y)=0 \] \[ \rho_{XY}=0 \] 即:

  • \(X,Y\) 相互独立\(\iff X,Y\) 不相关
  • \(X,Y\) 不相关 不一定 \(X,Y\) 相互独立

性质

  1. \(|\rho|\leq 1\)
  2. \(|\rho|=1\iff P\{Y=aX+b\}=1\)\(X,Y\) 之间以概率 \(1\) 存在线性关系

相关系数 \(\rho\) 刻画了随机变量 \(X,Y\) 之间的线性关系的近似程度。

\(|\rho|\) 越接近1,\(X,Y\) 越接近线性关系。

柯西不等式

\(X,Y\) 为任意随机变量,则

  1. \([E(XY)^2]\leq E(X^2)\cdot E(Y^2)\)
  2. 等式成立 \(\Leftrightarrow\) 存在常数 \(t_0\),使得 \(P\{Y=t_0X\}=1\)

定理

\((X,Y)\sim N(\mu_1,\sigma_1;\mu_2,\sigma_2;\rho)\) \[ Cov(X,Y)=\rho \sigma_1\sigma_2 \] \[ \rho_{XY}=\rho \]

  • \(\rho_{XY}=\rho=0\iff X,Y\) 不相关
  • \(\rho=0\iff X,Y\) 相互独立

5.5 矩、协方差矩阵

5.5.1 矩

是一些数字特征的泛称或总称。

定义

\(X,Y\) 是随机变量,

  • \(E(X^k),k=1,2,\dots\) 存在,则称它为 \(X\)\(k\)原点矩
  • \(E(X-EX)^k,k=1,2,\dots\) 存在,则称它为 \(X\)\(k\)中心矩

数学期望 \(EX=EX^1\) 是一阶原点矩

方差 \(DX=E(X-EX)^2\) 是二阶中心矩

此外,定义:

  • \(E(X^kY^l)\quad (k+l)\) 阶原点混合矩
  • \(E[(X-EX)^k(Y-EY)^l]\quad (k+l)\) 阶中心混合矩
  • \(E|X|^k\quad k\) 阶原点绝对矩
  • \(E|X-EX|^k\quad k\) 阶中心绝对矩

5.5.2 协方差矩阵

定义

对于 \(n\) 维随机向量 \((X_1,X_2,...,X_n)\)

\(C_{ij}=Cov(X_i,X_j)=E[(X_i-EX_i)(X_j-EX_j)]\quad i,j=1,2,...,n\) 存在

则矩阵 \(C=(C_{ij})_{n\times n}\) 称为 \((X_1,X_2,...,X_n)\) 的协方差矩阵

协方差矩阵 \(C=(C_{ij})_{n\times n}\) 是一个对称矩阵。

二维正态随机变量 \((X_1,X_2)\)

若令: \[ X= \begin{pmatrix}x_1\\x_2\end{pmatrix} \quad U=\begin{pmatrix}\mu_1\\\mu_2\end{pmatrix} \] \((X_1,X_2)\) 的协方差矩阵为 \[ \begin{aligned} &C=\begin{pmatrix} C_{11}&C_{12}\\ C_{21}&C_{22} \end{pmatrix}= \begin{pmatrix} \sigma_1^2&\rho\sigma_1\sigma_2\\ \rho\sigma_1\sigma_2&\sigma_2^2 \end{pmatrix}\\ &C^{-1}=\dfrac{1}{\det C}\begin{pmatrix} \sigma_2^2 &-\rho\sigma_1\sigma_2\\ -\rho\sigma_1\sigma_2&\sigma_1^2 \end{pmatrix}\\ &\det C=\sigma^2_1\sigma^2_2(1-\rho^2) \end{aligned} \] 则有 \[ \begin{aligned} &(X-U)'C^{-1}(X-U)\\=&\dfrac{1}{\det C}(x_1-\mu_1,x_2-\mu_2) \left(\begin{array}&\sigma_2^2&-\rho\sigma_1\sigma_2\\-\rho\sigma_1\sigma_2&\sigma_1^2\end{array}\right)\left(\begin{array}&x_1-\mu_1\\x_2\mu_2\end{array}\right)\\ =&-\dfrac{1}{1-\rho^2}\left[\Big(\dfrac{x_1-\mu_1}{\sigma_1}\Big)^2-2\rho\dfrac{(x_1-\mu_1)}{\sigma_1}\dfrac{(x_2-\mu_2)}{\sigma_2}+\Big(\dfrac{x_2-\mu_2}{\sigma_2}\Big)^2\right] \end{aligned} \] 于是 \((X_1,X_2)\) 的概率密度可写成 \[ f(x_1,x_2)=\dfrac{1}{2\pi\sqrt{\det C}}\exp\left\{-\dfrac{1}{2}(X-U)'C^{-1}(X-U) \right\} \]

\(n\) 维正态随机变量 \((X_1,X_2,...,X_n)\)

\[ f(x_1,x_2,...,x_n)=\dfrac{1}{(2\pi)^\frac{n}{2}\sqrt{\det C}}\exp\left\{-\dfrac{1}{2}(X-U)'C^{-1}(X-U)\right\} \]

其中 \[ X=\left(\begin{array}&x_1\\x_2\\\vdots\\x_n\end{array}\right) ,\quad U=\left(\begin{array}&\mu_1\\\mu_2\\\vdots\\\mu_n\end{array}\right)=\left(\begin{array}&EX_1\\EX_2\\\vdots\\EX_n\end{array}\right),\quad C=(C_{ij})_{n\times n} \]


第五章 随机变量的数字特征
https://onlyar.site/2022/01/09/BUAA-PandS-Chap05/
作者
Only(AR)
发布于
2022年1月9日
许可协议