第三章:二维随机变量
第三章:二维随机变量
3.1 二维随机变量
二维随机变量的定义
设试验 \(E\) 的样本空间为 \(S=\{e\}\),而 \(X=X(e),Y=Y(e)\) 是定义在 \(S\) 上的两个随机变量。称由这两个随机变量组成的向量 \((X,Y)\) 为二维随机变量或二维随机向量。
二维随机变量的分布函数定义
设 \((X,Y)\) 为二维随机变量,对任意实数 \(x,y\),二元函数 \(F(x,y)=P\{X\leq x,Y\leq y\}\) 称为二维随机变量的分布函数,或称为随机变量 \(X\) 与 \(Y\) 的联合分布函数。
分布函数的性质
- 定义域:\(-\infty<x<+\infty,-\infty<y<+\infty\)
取值范围:\(0\leq F(x,y)\leq 1\)
特殊值: \[ \begin{aligned} &F(-\infty,-\infty)={\lim\limits_{x, y\to -\infty}}F(x,y)={\lim\limits_{x, y\to -\infty}}P\{X\leq x,Y\leq y\}=0\\ &F(+\infty,+\infty)={\lim\limits_{x, y\to +\infty}}F(x,y)={\lim\limits_{x, y\to +\infty}}P\{X\leq x,Y\leq y\}=1\\ &F(x,-\infty)=\lim\limits_{y\to-\infty}F(x,y)=\lim\limits_{y\to-\infty}P\{X\leq x,Y\leq y\}=0\\ &F(-\infty,y)=\lim\limits_{x\to -\infty}F(x,y)=\lim\limits_{x\to -\infty}P\{X\leq x,Y\leq y\}=0 \end{aligned} \]
\(F(x,y)\) 对 \(x\) 或 \(y\) 单调不减
\(F(x,y)\) 对 \(x\) 或 \(y\) 右连续
对任意实数 \(x_1<x_2,y_1<y_2\) 有
\[ P\{x_1<X\leq x_2,y_1< Y \leq y_2\} =F(x_2,y_2)+F(x_1,y_1)-F(x_1,y_2)-F(x_2,y_1) \geq 0 \]
反之:凡是满足性质 (1)~(4) 的二元函数 \(F(x,y)\) 必定是某个二维随机变量的分布函数。
n 维随机变量的定义
设试验 \(E\) 的样本空间为 \(S=\{e\}\),而 \(X_i=X_i(e)\) 是定义在 \(S\) 上的随机变量,\(i=1,2,\dots ,n\) 由这 \(n\) 个随机变量构成的有序随机变量组 \((X_1,X_2,\dots ,X_n)\) 称为 \(n\) 维随机变量或随机向量。
设 \((X_1,X_2,\dots ,X_n)\) 为 \(n\) 维随机变量,对任意实数 \(x_1,x_2,\dots ,x_n\),\(n\) 元函数 \(F(x_1,x_2,\dots ,x_n)=P\{X_1\leq x_1,X_2\leq x_2,\dots ,X_n\leq x_n\}\) 称为 \(n\) 维随机变量 \((X_1,X_2,\dots ,X_n)\) 的分布函数或 \(n\) 个随机变量 \(X_1,X_2,\dots ,X_n\) 的联合分布函数。
3.2 二维离散型随机变量
二维离散型随机变量的定义
若二维随机变量 \((X,Y)\) 的取值为有限对或可列对 $(x_i,y_j),i,j=1,2,$,则称 \((X,Y)\) 是离散型随机变量。
二维离散型随机变量的分布律
记:
\[ P\{X=x_i,Y=y_j\}=p_{ij},\quad i,j=1,2,\dots \]
称为二维离散型随机变量 \((X,Y)\) 的(概率)分布律,或称为 \(X\) 和 \(Y\) 的联合(概率)分布律。
分布律的表示法:(1)公式法;(2)列表法
二维离散型随机变量的性质
- \[ p_{ij} = P \{ X = x_i,Y = y_j \} \geq 0,i,j=1,2,\dots \]
- \[ \sum\limits_{i,j}p_{ij}=1 \]
相关定理
设 \((X,Y)\) 的分布律为
\[ P\{X=x_i,Y=y_j\}=p_{ij},\quad i,j=1,2,\dots \]
则随机点 \((X,Y)\) 落在平面上任一区域 \(D\) 的概率
\[ P\{(X,Y)\in D\}=\sum\limits_{(x_i,y_i)\in D}p_{ij} \]
其中和式是对所有使 \((x_i,y_i)\in D\) 的 \(i,j\) 求和。
3.3 二维连续型随机变量
3.2.1 基础部分
二维连续型随机变量的定义
设二维随机变量 \((X,Y)\) 的分布函数为 \(F(x,y)\),若有非负可积函数 \(f(x,y)\),使得对任意实数 \(x,y\), 恒有:
\[ F(x,y)=\int_{-\infty}^{y}\int_{-\infty}^xf(u,v)\ \mathrm{d}u\mathrm{d}v \]
则称 \((X,Y)\) 是二维连续型随机变量,函数 \(f(x,y)\) 称为二维连续型随机变量 \((X,Y)\) 的概率密度,或称为随机变量 \(X\) 和 \(Y\) 的联合概率密度。
二维连续型随机变量的性质
\(X,Y\) 的概率密度 \(f(x,y)\) 具有下列基本性质:
\[ f(x,y)\geq 0, \quad -\infty<x,y<+\infty \]
\[\int^{+\infty}_{-\infty}\int^{+\infty}_{-\infty}f(x,y)\ \mathrm{d}x\mathrm{d}y=F(+\infty,+\infty)=1 \]
反之, 若二元函数\(f(x,y)\)满足上面两条基本性质,则它一定是某个二维随机变量\((X,Y)\)的概率密度
- 如果概率密度\(f(x,y)\)在点\((x,y)\)处连续, 则有: \[ \dfrac{\partial^2F}{\partial x\partial y}(x,y)=f(x,y) \]
3.2.2 用概率密度计算概率
定理
设 \((X,Y)\) 的概率密度为 \(f(x,y)\) 则有:
- 设 \(D\) 为平面上的任一区域,则:
\[ P\{(X,Y)\in D\}=\iint\limits_{D}f(x,y)\ \mathrm{d}x\mathrm{d}y \]
\[ F(x,y)={\iint\limits_{u\leq x}}\limits_{v\leq y}f(u,v)\ \mathrm{d}u\mathrm{d}v \]
- 有:
\[ P\{a<X\leq b,c<Y\leq d\}=\int^b_a\int^d_cf(x,y)\ \mathrm{d}y\mathrm{d}x \]
3.2.3 常用的二维连续型随机变量
均匀分布
若二维连续型随机变量 \((X,Y)\) 概率密度为:
\[ f(x,y)= \begin{cases} \dfrac{1}{A},&(x,y)\in D\\ 0,&其它 \end{cases} \]
其中 \(A\) 为有界区域 \(D\) 的面积。则称 \((X,Y)\) 在区域 \(D\) 上服从均匀分布,记为 \((X,Y)\sim U(D)\)
二维正态分布
若随机变量 \((X,Y)\) 概率密度为:
\[ f(x,y)=\dfrac{1}{2\pi \sigma_1\sigma_2\sqrt{1-\rho^2}}\cdot\exp\left\{-\dfrac{1}{2(1-\rho^2)}\left[\left(\dfrac{x-\mu_1}{\sigma_1}\right)^2-2\rho\dfrac{x-\mu_1}{\sigma_1}\dfrac{y-\mu_2}{\sigma_2}+\left(\dfrac{y-\mu_2}{\sigma_2}\right)^2\right]\right\} \]
其中 \(\mu_1,\mu_2,\sigma_1,\sigma_2,\rho\) 的二维正态分布,记作 \((X,Y)\sim N(\mu_1,\sigma_1^2;\mu_2,\sigma^2_2;\rho)\)
3.3 边沿分布函数(或边缘分布函数)
边沿分布函数的定义
设二维随机变量 \((X,Y)\) 的分布函数 \(F(x,y)=P\{X\leq x,Y\leq y\}\)(分量 \(X\) 与 \(Y\) 的联合分布函数)
分量 \(X\) 的分布函数: \[ \begin{aligned} p\{X\leq x\}&=P\{X\leq x,Y<+\infty\}\\ &=\lim\limits_{y\rightarrow+\infty}P\{X\leq x,Y\leq y\}\\ &=\lim\limits_{y\rightarrow+\infty}F(x,y)\\ &=F(x,+\infty)\\ &\triangleq F_X(x) \end{aligned} \] 称 \(F_X(x)\) 为 \((X,Y)\) 关于 \(X\) 的边沿分布函数。
分量 \(Y\) 的分布函数: \[ P\{Y\leq y\}=F(+\infty,y)=F_Y(y) \] 称 \(F_Y(y)\) 为 \((X,Y)\) 的边沿分布函数。
注意:
已知联合分布函数 \(F(x,y)\),可以计算出边沿分布函数 \(F_X(x),F_Y(y)\)
但由 \(X,Y\) 各自的分布函数 \(F_X(x),F_Y(y)\),一般无法确定联合分布函数 \(F(x,y)\)
3.3.1 边沿分布律
边沿分布律的定义
二维离散型随机变量 \((X,Y)\),分量 \(X\) 和分量 \(Y\) 都是离散型随机变量, \(X\) 的分布律称为 \((X,Y)\) 关于 \(X\) 的边沿分布律;\(Y\) 的分布律称为 \((X,Y)\) 关于 \(Y\) 的边沿分布律
边沿分布律的计算
\[ P\{X=x_i\}=\sum\limits_j p_{ij}=p_i \]
\((X,Y)\) 关于 \(X\) 的边沿分布律:联合分布律表中各行概率相加。
\[ P\{Y=y_j\}=\sum\limits_ip_{ij}=p_j \]
\((X,Y)\) 关于 \(Y\) 的边沿分布律:联合分布律表中各列概率相加.
3.3.2 条件分布律
在已知一个分量取某一定值的条件下,另一个分量的分布律称为条件分布律。
条件分布律的定义
设二维离散型随机变量 \((X,Y)\) 的分布律为:
\[ P\{X=x_i,Y=y_j\}=p_{ij}\quad i,j=1,2,\dots \]
- 若 \(P\{X=x\}>0\)
\[ P\{Y=y_j|X=x\}=\dfrac{P\{X=x,Y=y_j\}}{P\{X=x\}}\quad j=1,2,\dots \]
称为在 \(X=x\) 的条件下,\(Y\) 的条件分布律。
- 若 \(P\{Y=y\} > 0\)
\[ P\{X=x_i|Y=y\}=\dfrac{P\{X=x_i,Y=y\}}{P\{Y=y\}}\quad i=1,2,\dots \]
称为在 \(Y=y\) 的条件下,\(X\) 的条件分布律。
3.4 边沿概率密度和条件概率密度
3.4.1 边沿概率密度
二维连续型随机变量 \((X,Y)\) 的概率密度为 \(f(x,y)\) 则
\((X,Y)\) 关于 \(X\) 的边沿概率密度为: \[ f_X(x)=\int^{+\infty}_{-\infty}f(x,y)\ \mathrm{d}y \]
\((X,Y)\) 关于 \(Y\) 的边沿概率密度为: \[ f_Y(y)=\int^{+\infty}_{-\infty}f(x,y)\ \mathrm{d}x \]
3.4.2 条件概率密度
\[ f_{X|Y}(x|y)=\dfrac{f(x,y)}{f_Y(y)}\quad ,f_Y(y)\ne 0,x\in (-\infty,+\infty) \] \[ f_{Y|X}(y|x)=\dfrac{f(x,y)}{f_X(x)}\quad ,f_X(x)\ne 0,y\in (-\infty,+\infty) \]
3.5 相互独立的随机变量
设 \(X,Y\) 为两个随机变量,若对任意实数 \(x,y\),有:
\[ P\{X\leq x,Y\leq y\}=P\{X\leq x\}\cdot P\{Y\leq y\} \]
则称 \(X\) 与 \(Y\) 相互独立,简称独立。
3.5.1 离散型随机变量相互独立的判别定理
设二维离散型随机变量 \((X,Y)\) 的分布律为:
\[ P\{X=x_i,Y=y_j\}=p_{i,j} \]
则 \(X\) 与 \(Y\) 相互独立的充要条件:
\[ p_{ij}=p_i\cdot p_j \]
3.5.2 连续型随机变量相互独立的判别定理
设二维连续型随机变量 \((X,Y)\) 的概率密度为 \(f(x,y)\),\(f_X(x),f_Y(y)\)分别是 \((X,Y)\) 关于 \(X\) 和 \(Y\) 的边沿概率密度。
则 \(X\) 与 \(Y\) 相互独立的充要条件为:
\[ f(x,y)=f_X(x)\cdot f_Y(y) \]