分布-泊松分布(Poisson Distribution)¶
泊松分布(Poisson Distribution)是概率论和统计学中一种常见的离散概率分布,用于描述在固定时间或空间区间内某个事件发生的次数。
它特别适用于那些事件发生率低、但观察区间足够长以至于可以预期至少发生几次的情况。
例如,它可以用来模拟单位时间内到达某服务窗口的顾客数量、一定体积水中的细菌数、或者给定时间段内的交通事故数量等。
特点¶
离散性:泊松分布是一个离散分布,意味着它只能取非负整数值。
参数 λ(lambda):泊松分布由一个参数 λ>0 决定,λ 表示在指定的时间或空间间隔内事件的平均发生次数。它是泊松分布的期望值(均值)和方差。
独立性:假设事件的发生是相互独立的,即一个事件的发生不影响其他事件发生的概率。
稀有性:通常用于描述稀有事件,即在较长的时间或较大的空间范围内相对较少发生的事件。
概率质量函数¶
\[ \begin{align}\begin{aligned}P(X=k)=\frac{\lambda^{k} e^{-\lambda}}{k!}, \quad k \in\{0,1,2, \ldots\}\\说明:
k 是我们感兴趣的事件发生的次数
λ 是单位时间(或空间)内事件的平均发生次数
e 是自然对数的底数,约等于 2.71828\end{aligned}\end{align} \]
期望值与方差¶
对于泊松分布
X∼Poisson(λ)
其期望值 E[X] 和方差 Var(X) 都等于 λ:
E[X]=λ Var(X)=λ
这意味着,泊松分布的形状完全由参数 λ 决定,且该参数同时决定了分布的集中趋势和离散程度。
应用场景¶
排队理论:预测服务系统(如电话交换台、银行柜机)的客户到达率。
生物学:分析基因突变的数量或细胞分裂的频率。
保险业:估计特定时间段内的理赔次数。
电信:评估网络流量或故障报告的数量。
质量管理:监控生产过程中缺陷产品的数目。
与其他分布的关系¶
二项分布的极限情况:当二项分布的试验次数 n 很大而每次试验成功的概率 p 很小,使得 np=λ 保持常数时,二项分布可以近似为泊松分布。这是因为在这样的条件下,二项分布的行为类似于稀有事件模型。
正态分布近似:如果 λ 足够大,泊松分布可以用正态分布来近似,因为随着 λ 的增大,泊松分布趋于对称并接近正态分布的形状。