# **ポワソン分布とは?**
by GPT-4o
ポワソン分布(Poisson distribution)は、**単位時間(または単位空間)あたりに発生する独立した離散的な事象の回数を表す確率分布**です。特に、「一定の平均発生率で、まれに発生する事象」のモデリングによく使われます。
---
## **1. ポワソン分布の確率質量関数**
ポワソン分布に従う確率変数 $X$ の確率質量関数(PMF)は次の式で表されます:
$
P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!}, \quad k = 0, 1, 2, \dots
$
### **記号の説明**
- $k$:発生回数(0回, 1回, 2回, ...)
- $\lambda$ :単位時間(または単位空間)あたりの平均発生回数
- $e$ :自然対数の底(約 2.718)
**ポイント**
- $\lambda$ が大きくなるほど、事象の発生回数のばらつきが増える
- **平均値と分散はともに $\lambda$ になる**
---
## **2. ポワソン分布の具体例**
### **(1) コールセンターの電話着信**
あるコールセンターにおける1時間あたりの平均着信数が $\lambda = 10$ だとすると、1時間にちょうど 5 回電話がかかってくる確率は:
$
P(X = 5) = \frac{10^5 e^{-10}}{5!}
$
### **(2) Web サーバーへのアクセス**
Web サーバーが1秒あたりに受けるリクエスト数が平均 $\lambda = 3$ の場合、1秒間に 0 回のリクエストが発生する確率は:
$
P(X = 0) = \frac{3^0 e^{-3}}{0!} = e^{-3} \approx 0.0498
$
---
## **3. ポワソン分布の応用例**
ポワソン分布は、以下のような分野で広く使われます:
- **通信**:一定時間内のパケット到着数
- **マーケティング**:広告を見てクリックする回数
- **医療**:ある病気の発生件数(一定期間内)
- **品質管理**:製造ラインでの不良品の発生数
---
## **4. ポワソン分布と他の確率分布との関係**
### **(1) 二項分布との関係**
- 二項分布 \( B(n, p) \) において \( n \to \infty, p \to 0 \) かつ \( np = \lambda \) を満たすとき、ポワソン分布 \( P(\lambda) \) に近似できる。
- **例**:10,000個の部品に不良率 0.001 の不良品が含まれる場合、不良品の総数はポワソン分布で近似可能。
### **(2) 指数分布との関係**
- あるイベントの発生間隔(時間や距離)は**指数分布**に従う。
- **例**:ポワソン分布が「1時間あたりの電話の回数」をモデル化するなら、指数分布は「次の電話がかかってくるまでの時間」をモデル化する。
---
## **5. Python を使ったポワソン分布の可視化**
以下のコードを使って、ポワソン分布の確率質量関数(PMF)をプロットできます。
```python
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import poisson
# 平均発生回数 λ を 3 と設定
lambda_value = 3
x = np.arange(0, 15) # 0 から 14 までの範囲
# ポワソン分布の確率質量関数 (PMF)
pmf_values = poisson.pmf(x, lambda_value)
# プロット
plt.figure(figsize=(8, 5))
plt.bar(x, pmf_values, alpha=0.6, label=f'Poisson(λ={lambda_value})', edgecolor='black')
plt.xlabel('発生回数 (k)')
plt.ylabel('確率 P(X=k)')
plt.title('ポワソン分布 (λ=3)')
plt.legend()
plt.grid(axis='y', linestyle='--', alpha=0.7)
plt.show()
```
![[Poisson_pmf.svg|ポワソン分布]]
(画像は例としてWikipediaのものを使用)
## **まとめ**
- **ポワソン分布は、一定時間内に発生する事象の回数をモデル化する。**
- 平均発生回数 λ\lambdaλ が大きくなると、ばらつきが増える。
- **応用例**:通信、マーケティング、医療、品質管理など多岐にわたる。
- **二項分布や指数分布と関連が深い**。
ポワソン分布を使うことで、リアルなデータのモデリングや意思決定に役立てることができます!