跳转至

第2章 随机变量的分布

随机变量及其分布是概率论的重点,本章主要讨论一维随机变量及其分布。

1. 随机变量及其分布函数

  • 随机变量:定义在样本空间上的实值函数,常用大写字母表示,取值常用小写字母表示。

  • 分布函数:对于一个随机变量,定义\(F(x)=P(X\leq x)\)为分布函数,称X服从\(F(x)\).满足下列三种基本性质:单调性,有界性,右连续性

2. 随机变量的数学期望

根据分布计算随机变量的特征数(均值,方差,分位数),侧面反映分布的特征。下介绍最重要的特征数:数学期望。

数学期望

  • 起源:分赌本问题
  • 均值:算术平均,加权平均(根据频率)
  • 离散表达式:\(E(x)=\sum x_{i}p(x_{i})\) (当且仅当绝对收敛的时唯一)
  • 连续表达式:\(E(s)=\int xp(x) \, dx\)
  • 物理解释:重心
  • 统计学作用:消除随机性的重要手段

数学期望的性质

  • \(E(c)=c\)
  • \(E(aX)=aE(x)\)
  • \(E(g_{1}+g_{2})=E(g_{1})+E(g_{2})\)

3. 随机变量的方差与标准差

方差

  • 对于随机变量\(X\)的均值a,定义新的随机变量\((x-a)^2\),其均值称作方差。
  • 记作:\(Var(X)=E(x-E(x))^2\)

标准差

  • 定义方差的平方根:\(\sqrt{ Var(x) }=\sigma(X)\)
  • 刻画\(X\)的波动程度(集中与分散程度),越小愈集中。

注:

(1)标准差的量纲与数学期望一致,标准差的使用倾向更大。

(2)期望存在,方差不一定存在。但方差存在,期望一定存在。

性质

  • \(Var(X)=E(X^2)-[E(x)]^2\)
  • 常数的方差为0
  • \(Var(aX+b)=a^2Var(X)\)
  • 切比雪夫不等式(chebyshev): $$ P(\mid X-E(x)|\geq \sigma) \leq \frac{Var(X)}{\sigma^2} $$

注:对于切比雪夫不等式,描述了这样一个现实: 大偏差(\(X-E(x)\))的概率,称作偏差发生概率,其上界与方差成正比,方差愈大,其上界愈大。

4. 常用的几种分布(离散)

伯努利分布 \(X \sim B(p)\)

  • 单次实验的结果(0或1),成功的概率\(p\),也叫0-1分布
  • 公式:\(P(X=k) = p^k (1-p)^{1-k}\)

二项分布 \(X \sim B(n, p)\)

  • 描述在\(n\)次独立重复的伯努利试验中,成功的概率\(p\)
  • 公式: \(P(X=k) = C_n^k p^k (1-p)^{n-k}\)
  • 期望与方差:\(E(X)=np,\quad Var(X)=np(1-p)\)

泊松分布 \(X \sim P(\lambda)\)

  • 描述稀有事件在单位时间内发生次数
  • 公式\(P(X=k)=\frac{\lambda^k e^{-\lambda}}{k!}\)
  • 期望与方差:\(E(X)=\lambda,\quad Var(X)=\lambda\)

几何分布 \(X \sim \text{Ge}(p)\)

  • 在第\(k\)次试验才获得第一次成功的概率
  • 公式: \(P(X=k) = (1-p)^{k-1}p\)

超几何分布

  • 在含有 \(M\) 个成功类别的 \(N\) 个总体中,不放回地抽取 \(n\) 个样本,其中成功类别个数为 \(k\)
  • 公式 : $$ P(X=k) = \frac{\binom{M}{k} \binom{N-M}{n-k}}{\binom{N}{n}} $$

  • 期望与方差:
    $$ E(X)=n\cdot\frac{M}{N} $$ $$ Var(X)=n\cdot\frac{M}{N}\cdot\left(1-\frac{M}{N}\right)\cdot\frac{N-n}{N-1} $$

5. 常用的几种分布(连续)

正态分布 \(X \sim N(\mu, \sigma^2)\)

  • 自然界最常见的分布,描述受众多独立微小因素影响的变量。
  • 由均值 \(\mu\) 和方差 \(\sigma^2\)决定,又称高斯分布
  • 公式:
\[ f(x|\mu, \sigma^2) = \frac{1}{\sqrt{2\pi\sigma^2}} e^{-\frac{(x-\mu)^2}{2\sigma^2}} \]
  • \(\hat{\mu} = \bar{x}\)(样本均值),\(\hat{\sigma}^2 = \frac{1}{n}\sum(x_i - \bar{x})^2\)(样本偏方差)

均匀分布 \(X \sim U(a, b)\)

  • 在区间 \([a, b]\) 内,每个数值出现的可能性相等。
  • 公式 :\(f(x|a, b) = \frac{1}{b-a}, \quad a \le x \le b\)
  • 期望与方差:\(E(X)=\frac{a+b}{2},\quad Var(X)=\frac{(b-a)^2}{12}\)

指数分布 \(X \sim \text{Exp}(\lambda)\)

  • 泊松分布关注单位时间内事件发生了多少次,指数分布则关注两次事件发生的间隔时间。(无记忆性)
  • 概率密度函数:\(f(x)=\lambda e^{-\lambda x},\quad x\ge0\)
  • 累积分布函数:\(F(x|\lambda) = 1 - e^{-\lambda x}, \quad x \ge 0\)
  • 均值/期望:\(E(X) = \frac{1}{\lambda}\)
  • 方差:\(Var(X) = \frac{1}{\lambda^2}\)

伽马分布 \(X \sim \Gamma(\alpha, \beta)\)

  • 指数分布的推广,如果指数分布是“等 1 次随机事件发生的时间”,那么伽马分布就是“等 \(\alpha\) 次事件发生的时间”。
  • 概率密度函数:\(f(x)=\frac{\beta^\alpha}{\Gamma(\alpha)}x^{\alpha-1}e^{-\beta x},\quad x>0\)
  • 期望与方差: \(E(X)=\frac{\alpha}{\beta},\quad Var(X)=\frac{\alpha}{\beta^2}\)
  • 具有加性:如果 \(X_1, X_2\) 独立且服从相同 \(\beta\) 的伽马分布,其和仍服从伽马分布。
  • \(\alpha = 1\) 时,退化为指数分布
  • \(\alpha = \frac{n}{2}, \beta = \frac{1}{2}\) 时,退化为卡方分布

贝塔分布 \(X \sim \text{Be}(\alpha, \beta)\)

  • 定义在区间 \([0, 1]\) 上的连续分布。它最常用于建模概率的概率。在贝叶斯估计中,它是二项分布的共轭先验。
  • 参数:\(\alpha, \beta\) 控制分布的偏斜程度和峰度。
  • \(\alpha = 1, \beta = 1\) 时,它就是 \([0, 1]\) 上的均匀分布
  • 如果 \(\alpha = \beta\),分布是对称的。

卡方分布 \(X \sim \chi^2(n)\)

  • 是 k 个独立标准正态随机变量的平方和所服从的分布,其中k为自由度。
  • 概率密度函数:
\[ f(x)=\frac{1}{2^{k/2}\Gamma(k/2)}x^{k/2-1}e^{-x/2},\quad x>0 \]
  • 期望与方差 :\(E(X)=k,\quad Var(X)=2k\)
  • 分布始终在正轴上
  • 随着自由度 \(n\) 的增大,分布逐渐趋近于正态分布
  • 用于检验方差

6. 分布的其他特征数

\(k\)阶原点矩

  • \(\mu_{k}= E(X^k)\)
  • 一阶原点矩:数学期望

\(k\)阶中心矩

  • \(\nu_{k}= E(X-E(X))^k\)
  • 二阶中心矩:方差

二者存在对应关系

  • 变异系数:标准差比期望(消除量纲的影响)
  • 分位数:分为两块(下侧,上侧)
  • 中位数:均分的分位数
  • 偏度系数:描述分布偏离对称性的程度(三阶中心矩/二阶中心矩的3/2次方)
  • 峰度系数:描述分布尖峭程度或尾部粗细(四阶中心矩/二阶中心矩的2次方 -3)