概率密度函数(Probability Density Function, PDF)¶
概率密度函数(PDF)是连续随机变量的一种重要概念,用于描述随机变量取值在某一区间内的可能性。
概率密度函数不能直接表示单个点的概率,而是通过积分计算出随机变量在某个范围内的概率。
定义¶
若随机变量 𝑋 是连续的,则其概率密度函数 \(𝑓_𝑋(𝑥)\) 满足以下条件:
\[\begin{split}\begin{array}{l}
1. f_{X}(x) \geq 0 , 对所有 x \\
2. 随机变量 X 在某区间 [a, b] 内的概率为: \\
P(a \leq X \leq b)=\int_{a}^{b} f_{X}(x) d x \\
3. 概率密度函数在整个定义域上的积分为 1 : \\
\int_{-\infty}^{\infty} f_{X}(x) d x=1
\end{array}\end{split}\]
直观理解¶
\(f_{X}(x)\) 表示随机变量在某一点的”密度”, 不是概率。
\(f_{X}(x)\) 越大, 随机变量在该点附近取值的可能性越高。
- 真正的概率需要通过积分计算,例如:
\(P(a \leq X \leq b)\) 是 \(f_{X}(x)\) 在区间 [a, b] 的积分。
概率密度函数的特性¶
非负性:
\[f_{X}(x) \geq 0, \quad \forall x\]
归一性:
\[\int_{-\infty}^{\infty} f_{X}(x) d x=1\]
区间概率:随机变量在区间 [a, b] 内取值的概率为:
\[P(a \leq X \leq b)=\int_{a}^{b} f_{X}(x) d x\]
- 概率与微分的关系:
\(P(X=c)=0\) 对任何具体值 c 都成 \(\stackrel{\downarrow}{ }\) ,因为积分的区间长度为零。
常见概率密度函数¶
均匀分布
\[ \begin{align}\begin{aligned}\begin{split}f_{X}(x)=\left\{\begin{array}{ll}
\frac{1}{b-a}, & \text { if } a \leq x \leq b \\
0, & \text { otherwise }
\end{array}\right.\end{split}\\随机变量在区间 [a, b] 上均匀分布, 所有值的密度相等。\end{aligned}\end{align} \]
正态分布
\[ \begin{align}\begin{aligned}f_{X}(x)=\frac{1}{\sqrt{2 \pi} \sigma} e^{-\frac{(x-\mu)^{2}}{2 \sigma^{2}}}\\\begin{split} \mu 是均值, \sigma 是标准差 \\
正态分布的图形为对称的钟形曲线\end{split}\end{aligned}\end{align} \]
指数分布
\[ \begin{align}\begin{aligned}\begin{split}f_{X}(x)=\left\{\begin{array}{ll}
\lambda e^{-\lambda x}, & x \geq 0 \\
0, & x<0
\end{array}\right.\end{split}\\用于描述事件发生的时间间隔。\end{aligned}\end{align} \]
伽马分布
\[ \begin{align}\begin{aligned}f_{X}(x)=\frac{\lambda^{k} x^{k-1} e^{-\lambda x}}{\Gamma(k)}, \quad x \geq 0\\\Gamma(k) 是伽马函数。\end{aligned}\end{align} \]
统计量计算¶
期望值
\[\mathbb{E}[X]=\int_{-\infty}^{\infty} x f_{X}(x) d x\]
方差
\[ \begin{align}\begin{aligned}\operatorname{Var}(X)=\mathbb{E}\left[X^{2}\right]-(\mathbb{E}[X])^{2}\\\begin{split}其中: \\
\mathbb{E}\left[X^{2}\right]=\int_{-\infty}^{\infty} x^{2} f_{X}(x) d x\end{split}\end{aligned}\end{align} \]