第三章 随机向量3.1 随机向量的分布随机向量及其分布函数概念

  • \(X_1,X_2,\cdots,X_n\)\(n\)个随机向量,则\((X_1,X_2,\cdots,X_n)\)是一个\(n\)维随机向量
  • \(n\)元函数\(F(x_1,x_2,\cdots,x_n)=P\{X_1\le x_1,X_2\le x_2,\cdots,X_n\le x_n\}\)为随机向量\((X_1,X_2,\cdots,X_n)\)分布函数。其中\(\{X_1\le x_1,X_2\le x_2,\cdots,X_n\le x_n\}\)表示\(\{X_1\le x_1\},\{X_2\le x_2\},\cdots,\{X_n\le x_n\}\)的交事件。

一般不会讨论高维的向量,教材上大多是二维向量。

概率表示

\[P\{x_1<X\le x_2,y_1<Y\le y_2\}=F(x_2,y_2)-F(x_2,y_1)-F(x_1,y_2)+F(x_1,y_1)\]性质

  • \(0\le F(x,y)\le1\).

  • \(F(x,y)\)关于\(x,y\)单调非降右连续.

  • 极限值:

    • \(F(-\infty,y)=\lim\limits_{x\to-\infty}F(x,y)=0\)
    • \(F(x,-\infty)=\lim\limits_{y\to-\infty}F(x,y)=0\)
    • \(F(-\infty,-\infty)=\lim\limits_{(x,y)\to(-\infty,-\infty)}F(x,y)=0\)
    • \(F(+\infty,+\infty)=\lim\limits_{(x,y)\to(+\infty,+\infty)}F(x,y)=1\)
  • (一维)边缘分布函数

    • \(F_X(x)=P\{X\le x\}=P\{X\le x,Y<+\infty\}=F(x,+\infty)\)

    • \(F_Y(y)=P\{Y\le y\}=F(+\infty,y)\)

    • 一般地,对于\(n\)维随机向量的分布函数的边缘分布函数为:

      \[F_i(x_i)=F(+\infty,\cdots,+\infty,x_i,+\infty,\cdots,+\infty),\quad i=1,2,\cdots,n\]


离散型随机向量的概率分布定义

如果二维随机向量\((X,Y)\)只取有限个或可列个值,则称\((X,Y)\)二维离散型随机向量

概率分布为:

\[P\{X=x_i,Y=y_j\}=p_{ij},\quad i,j=1,2,\cdots,\]

也叫做\(X\)\(Y\)联合概率分布

性质

  • \(p_{ij}\ge0,\quad i,j=1,2,\cdots;\)
  • \(\sum\limits_i\sum\limits_jp_{ij}=1\).

概念

联合概率分布表:以二维表格形式表示二维离散型随机向量的概率分布。

边缘概率分布:联合概率分布的某一行或某一列的和。


连续型随机向量的概率密度函数定义

二维随机向量\((X,Y)\)的分布函数为\(F(x,y)\),如果存在一个非负可积的二元函数\(f(x,y)\),使得对任意实向量\((x,y)\),有

\[F(x,y)=\int_{-\infty}^x\int_{-\infty}^yf(s,t)\mathrm{d}s\mathrm{d}t,\]

则称\((X,Y)\)二维连续型随机向量,并称\(f(x,y)\)\((X,Y)\)概率密度函数,或\(X\)\(Y\)联合密度函数

性质

  • \(f(x,y)\ge0\)

  • \(\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}f(x,y)\mathrm{d}x\mathrm{d}y=1\)

  • \(D\)是平面上的一个区域,则\(P\{(X,Y)\in D\}=\iint\limits_Df(x,y)\mathrm{d}x\mathrm{d}y\)

  • 边缘分布函数

    \[\begin{align*}F_X(x)&= P\{X\le x\}=P\{X\le x,Y\le+\infty\}\\&= \int_{-\infty}^x\int_{-\infty}^{+\infty}f(s,t)\mathrm{d}s\mathrm{d}t \\&= \int_{-\infty}^x \left[ \int_{-\infty}^{+\infty}f(s,t)\mathrm{d}t \right] \mathrm{d}s.\end{align*}\]

  • 边缘密度函数

    \[f_X(x)=\int_{-\infty}^{+\infty}f(x,y)\mathrm{d}y \\f_Y(y)=\int_{-\infty}^{+\infty}f(x,y)\mathrm{d}x \\\]

均匀分布

如果一个二维随机向量\((X,Y)\)

\[f(x,y)=\left\{\begin{align*}& \frac{1}{S(G)},\quad\quad(x,y)\in G,\\& 0,\quad\quad\quad\quad 其他,\end{align*}\right.\]

为密度函数,则称\((X,Y)\)服从区域\(G\)上的均匀分布

图像

平面区域上的均匀分布实质就是平面区域上的几何概型。


二元正态分布定义

设随机向量\((X,Y)\)的密度函数为

\[\varphi(x,y)=\frac{1}{2\pi\sigma_1\sigma_2\sqrt{1-\rho^2}}e^{-\frac{1}{2(1-\rho^2)}\left[ \frac{(x-\mu_1)^2}{\sigma_1^2}-2\rho\frac{(x-\mu_1)(y-\mu_2)}{\sigma_1\sigma_2}+\frac{(y-\mu_2)^2}{\sigma_2^2}\right]},\]

其中\(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho\)均为参数,且\(\sigma_1>0,\sigma_2>0,|\rho|<1\),则称\((X,Y)\)服从参数为\((\mu_1,\mu_2;\sigma_1^2,\sigma_2^2;\rho)\)二元正态分布,记作\((X,Y)\sim N(\mu_1,\mu_2;\sigma_1^2,\sigma_2^2;\rho)\).

性质

  • 二元正态分布以\((\mu_1,\mu_2)\)为中心,中心附近具有较高密度,离中心越远,密度越小。

  • 边缘密度函数

    • \(\varphi_X(x)=\frac{1}{\sqrt{2\pi}\sigma_1}e^{-\frac{(x-\mu_1)^2}{2\sigma_1^2}}\)
    • \(\varphi_Y(y)=\frac{1}{\sqrt{2\pi}\sigma_2}e^{-\frac{(x-\mu_2)^2}{2\sigma_2^2}}\)
    • \(X\sim N(\mu_1,\sigma_1^2),\ Y\sim N(\mu_2,\sigma_2^2)\)
  • 参数\(\rho\)是随机变量\(X,Y\)的相关系数,\(\rho=0\)表示\(X,Y\)相互独立,此时对于任何\((x,y)\),有

    \[\varphi(x,y)=\varphi_X(x)\varphi_Y(y)\]

  1. 二元正态分布的边缘分布只有前4个参数确定,因此对于只有参数\(\rho\)不同的二元正态分布,它们的边缘分布是一致的。
  2. 只有\(X\)\(Y\)的边缘分布不能唯一确定二元正态分布,还需要明确的参数\(\rho\).
  3. 两个边缘分布为正态分布的二位随机向量不一定服从二元正态分布。

使用教材:
《概率论与数理统计》第四版 中国人民大学 龙永红 主编 高等教育出版社