跳转至

概率论

量子力学……确实有很多结论,但并没有让我们更接近老家伙的秘密。无论如何,我确信他不掷骰子。

– 阿尔伯特·爱因斯坦

爱因斯坦先生卓越的成就使其成为智慧的代名词,但在这点上他却错了。不确定性原理告诉我们,微观粒子的位置与动量不可同时被确定。事实上,在宏观的现实世界当中也几乎没有完全确定的事情。用数学语言去刻画这些随机事件,构成了我们今天的概率论。

由于本文涉及到了部分专有名词,在进入正文之前,让我们先看一个例子以对这些专有名词产生一个直觉。

掷骰子

对于六面普通骰子,我们将其投掷之后正面向上的点数称为随机变量\(X\);它的取值范围称为样本空间\(\Omega\)\(\{1, 2, 3, 4, 5, 6\}\)。若该骰子质地均一,则一次投掷后\(X\)取任意值的概率均为\(1/6\);其期望为\(\sum_{n=1}^{6} n / 6 = 3.5\);其方差为\(\sum_{n=1}^{6} (n-3.5)^2 / 6=35/12\);其标准差为\(\sqrt{35/12} = \sqrt{105}/6\)

概率

一个随机事件的概率是一个介于0与1之间的实数,是对随机事件发生之可能性的度量。

对于某个随机事件,若其概率为0意味着这个事件不可能发生(不可能事件),若其概率为1意味着这个事件必然发生(必然事件)。

随机变量

对于概率空间\((\Omega, \mathcal{F}, P)\),对于任意实数\(x\)与基本事件\(w\),都有\({x \in \Omega: X(\omega) \leq x} \in \mathcal{F}\),则我们将\(X(w)\)称之为随机变量。

随机变量是一个函数,它用数字来表示一个可能出现的事件。

\(X\)为可测集\(S\subseteq E\)上的某个值的概率为

\({\mathrm{P}(X \in S) = \mathrm{P}(\{\omega \in \Omega \mid X(\omega) \in S\})}{\mathrm{P}(X \in S) = \mathrm{P}(\{\omega \in \Omega \mid X(\omega )\in S\})}\)

离散随机变量

对于随机变量\(X\),若存在非负函数\(f(x)\)\(F(X)\),使得\(P(X = x) = f(x)\)\(P(X < x) = F(x)\),则称\(X\)是一个离散随机变量。

离散随机变量的取值范围是有限或者可列的。

在本文一开始的掷骰子例子中的随机变量即是一个离散随机变量。

连续随机变量

对于随机变量\(X\),若存在非负函数\(f(x)\)\(F(X)\),使得\(P(a \leq X \leq b) = \int_{a}^{b} f(x) dx\)\(P(X<x) = F(x)\),则称\(X\)是一个连续随机变量。

连续随机变量的取值范围是无限或者不可列的。

举例来说,肯德基出品的吮指原味鸡的重量即是不可列的,因此其是一个连续随机变量。

期望

概率(或密度)为权重的加权平均值

\(\mathrm{E}[X] = \sum_{x \in X} x \cdot P(x)\)

一个随机变量的期望刻画的是这个随机变量的概率分布的“中心”。

简而言之,当有无穷多来自同一个概率分布的独立样本时,它们的平均值就是期望。

方差

方差是一个随机变量与它的期望之间的差的平方的加权平均值

\(\mathrm{Var}(X) = \mathrm{E}[(X-\mathrm{E}[X])^2]\)

一个随机变量的方差刻画的是这个随机变量的概率分布的“离散度”,也即该变量与其期望值的距离。

标准差

标准差是方差的算数平方根

\(\sigma = \sqrt{\mathrm{Var}(X)}\)