第2章随机变量的分布

随机变量及其分布是概率论的重点，本章主要讨论一维随机变量及其分布。

1. 随机变量及其分布函数¶

随机变量：定义在样本空间上的实值函数，常用大写字母表示，取值常用小写字母表示。
分布函数：对于一个随机变量，定义$F(x)=P(X\leq x)$为分布函数，称X服从$F(x)$.满足下列三种基本性质：单调性，有界性，右连续性

2. 随机变量的数学期望¶

根据分布计算随机变量的特征数（均值，方差，分位数），侧面反映分布的特征。下介绍最重要的特征数：数学期望。

数学期望

起源：分赌本问题
均值：算术平均，加权平均（根据频率）
离散表达式：$E(x)=\sum x_{i}p(x_{i})$ (当且仅当绝对收敛的时唯一)
连续表达式：$E(s)=\int xp(x) \, dx$
物理解释：重心
统计学作用：消除随机性的重要手段

数学期望的性质

$E(c)=c$
$E(aX)=aE(x)$
$E(g_{1}+g_{2})=E(g_{1})+E(g_{2})$

3. 随机变量的方差与标准差¶

方差

对于随机变量$X$的均值a，定义新的随机变量$(x-a)^2$，其均值称作方差。
记作：$Var(X)=E(x-E(x))^2$

标准差

定义方差的平方根：$\sqrt{ Var(x) }=\sigma(X)$
刻画$X$的波动程度（集中与分散程度），越小愈集中。

注：

（1）标准差的量纲与数学期望一致，标准差的使用倾向更大。

（2）期望存在，方差不一定存在。但方差存在，期望一定存在。

性质

$Var(X)=E(X^2)-[E(x)]^2$
常数的方差为0
$Var(aX+b)=a^2Var(X)$
切比雪夫不等式（chebyshev）： $$ P(\mid X-E(x)|\geq \sigma) \leq \frac{Var(X)}{\sigma^2} $$

注：对于切比雪夫不等式，描述了这样一个现实：大偏差（$X-E(x)$）的概率，称作偏差发生概率，其上界与方差成正比，方差愈大，其上界愈大。

4. 常用的几种分布（离散）¶

伯努利分布 $X \sim B(p)$¶

单次实验的结果（0或1），成功的概率$p$，也叫0-1分布
公式：$P(X=k) = p^k (1-p)^{1-k}$

二项分布 $X \sim B(n, p)$¶

描述在$n$次独立重复的伯努利试验中，成功的概率$p$
公式： $P(X=k) = C_n^k p^k (1-p)^{n-k}$
期望与方差：$E(X)=np,\quad Var(X)=np(1-p)$

泊松分布 $X \sim P(\lambda)$¶

描述稀有事件在单位时间内发生次数
公式$P(X=k)=\frac{\lambda^k e^{-\lambda}}{k!}$
期望与方差：$E(X)=\lambda,\quad Var(X)=\lambda$

几何分布 $X \sim \text{Ge}(p)$¶

在第$k$次试验才获得第一次成功的概率
公式: $P(X=k) = (1-p)^{k-1}p$

超几何分布¶

在含有 $M$ 个成功类别的 $N$ 个总体中，不放回地抽取 $n$ 个样本，其中成功类别个数为 $k$。
公式： $$ P(X=k) = \frac{\binom{M}{k} \binom{N-M}{n-k}}{\binom{N}{n}} $$
期望与方差：
$$ E(X)=n\cdot\frac{M}{N} $$ $$ Var(X)=n\cdot\frac{M}{N}\cdot\left(1-\frac{M}{N}\right)\cdot\frac{N-n}{N-1} $$

5. 常用的几种分布（连续）¶

正态分布 $X \sim N(\mu, \sigma^2)$¶

自然界最常见的分布，描述受众多独立微小因素影响的变量。
由均值 $\mu$ 和方差 $\sigma^2$决定，又称高斯分布
公式：

\[ f(x|\mu, \sigma^2) = \frac{1}{\sqrt{2\pi\sigma^2}} e^{-\frac{(x-\mu)^2}{2\sigma^2}} \]

$\hat{\mu} = \bar{x}$（样本均值），$\hat{\sigma}^2 = \frac{1}{n}\sum(x_i - \bar{x})^2$（样本偏方差）

均匀分布 $X \sim U(a, b)$¶

在区间 $[a, b]$ 内，每个数值出现的可能性相等。
公式：$f(x|a, b) = \frac{1}{b-a}, \quad a \le x \le b$
期望与方差：$E(X)=\frac{a+b}{2},\quad Var(X)=\frac{(b-a)^2}{12}$

指数分布 $X \sim \text{Exp}(\lambda)$¶

泊松分布关注单位时间内事件发生了多少次，指数分布则关注两次事件发生的间隔时间。（无记忆性）
概率密度函数：$f(x)=\lambda e^{-\lambda x},\quad x\ge0$
累积分布函数：$F(x|\lambda) = 1 - e^{-\lambda x}, \quad x \ge 0$
均值/期望：$E(X) = \frac{1}{\lambda}$
方差：$Var(X) = \frac{1}{\lambda^2}$

伽马分布 $X \sim \Gamma(\alpha, \beta)$¶

指数分布的推广，如果指数分布是“等 1 次随机事件发生的时间”，那么伽马分布就是“等 $\alpha$ 次事件发生的时间”。
概率密度函数：$f(x)=\frac{\beta^\alpha}{\Gamma(\alpha)}x^{\alpha-1}e^{-\beta x},\quad x>0$
期望与方差： $E(X)=\frac{\alpha}{\beta},\quad Var(X)=\frac{\alpha}{\beta^2}$
具有加性：如果 $X_1, X_2$ 独立且服从相同 $\beta$ 的伽马分布，其和仍服从伽马分布。
当 $\alpha = 1$ 时，退化为指数分布。
当 $\alpha = \frac{n}{2}, \beta = \frac{1}{2}$ 时，退化为卡方分布。

贝塔分布 $X \sim \text{Be}(\alpha, \beta)$¶

定义在区间 $[0, 1]$ 上的连续分布。它最常用于建模概率的概率。在贝叶斯估计中，它是二项分布的共轭先验。
参数：$\alpha, \beta$ 控制分布的偏斜程度和峰度。
当 $\alpha = 1, \beta = 1$ 时，它就是 $[0, 1]$ 上的均匀分布。
如果 $\alpha = \beta$，分布是对称的。

卡方分布 $X \sim \chi^2(n)$¶

是 k 个独立标准正态随机变量的平方和所服从的分布，其中k为自由度。
概率密度函数：

\[ f(x)=\frac{1}{2^{k/2}\Gamma(k/2)}x^{k/2-1}e^{-x/2},\quad x>0 \]

期望与方差：$E(X)=k,\quad Var(X)=2k$
分布始终在正轴上
随着自由度 $n$ 的增大，分布逐渐趋近于正态分布
用于检验方差

6. 分布的其他特征数¶

$k$阶原点矩¶

$\mu_{k}= E(X^k)$
一阶原点矩：数学期望

$k$阶中心矩¶

$\nu_{k}= E(X-E(X))^k$
二阶中心矩：方差

二者存在对应关系

变异系数：标准差比期望（消除量纲的影响）
分位数：分为两块（下侧，上侧）
中位数：均分的分位数
偏度系数：描述分布偏离对称性的程度（三阶中心矩/二阶中心矩的3/2次方）
峰度系数：描述分布尖峭程度或尾部粗细（四阶中心矩/二阶中心矩的2次方 -3）

第2章随机变量的分布

1. 随机变量及其分布函数¶

2. 随机变量的数学期望¶

3. 随机变量的方差与标准差¶

4. 常用的几种分布（离散）¶

伯努利分布 \(X \sim B(p)\)¶

二项分布 \(X \sim B(n, p)\)¶

泊松分布 \(X \sim P(\lambda)\)¶

几何分布 \(X \sim \text{Ge}(p)\)¶

超几何分布¶

5. 常用的几种分布（连续）¶

正态分布 \(X \sim N(\mu, \sigma^2)\)¶

均匀分布 \(X \sim U(a, b)\)¶

指数分布 \(X \sim \text{Exp}(\lambda)\)¶

伽马分布 \(X \sim \Gamma(\alpha, \beta)\)¶

贝塔分布 \(X \sim \text{Be}(\alpha, \beta)\)¶

卡方分布 \(X \sim \chi^2(n)\)¶

6. 分布的其他特征数¶

\(k\)阶原点矩¶

\(k\)阶中心矩¶

第2章 随机变量的分布

1. 随机变量及其分布函数¶

2. 随机变量的数学期望¶

3. 随机变量的方差与标准差¶

4. 常用的几种分布（离散）¶

伯努利分布 \(X \sim B(p)\)¶

二项分布 \(X \sim B(n, p)\)¶

泊松分布 \(X \sim P(\lambda)\)¶

几何分布 \(X \sim \text{Ge}(p)\)¶

超几何分布¶

5. 常用的几种分布（连续）¶

正态分布 \(X \sim N(\mu, \sigma^2)\)¶

均匀分布 \(X \sim U(a, b)\)¶

指数分布 \(X \sim \text{Exp}(\lambda)\)¶

伽马分布 \(X \sim \Gamma(\alpha, \beta)\)¶

贝塔分布 \(X \sim \text{Be}(\alpha, \beta)\)¶

卡方分布 \(X \sim \chi^2(n)\)¶

6. 分布的其他特征数¶

\(k\)阶原点矩¶

\(k\)阶中心矩¶

第2章随机变量的分布