# **ポワソン分布とは?** by GPT-4o ポワソン分布(Poisson distribution)は、**単位時間(または単位空間)あたりに発生する独立した離散的な事象の回数を表す確率分布**です。特に、「一定の平均発生率で、まれに発生する事象」のモデリングによく使われます。 --- ## **1. ポワソン分布の確率質量関数** ポワソン分布に従う確率変数 $X$ の確率質量関数(PMF)は次の式で表されます: $ P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!}, \quad k = 0, 1, 2, \dots $ ### **記号の説明** - $k$:発生回数(0回, 1回, 2回, ...) - $\lambda$ :単位時間(または単位空間)あたりの平均発生回数 - $e$ :自然対数の底(約 2.718) **ポイント** - $\lambda$ が大きくなるほど、事象の発生回数のばらつきが増える - **平均値と分散はともに $\lambda$ になる** --- ## **2. ポワソン分布の具体例** ### **(1) コールセンターの電話着信** あるコールセンターにおける1時間あたりの平均着信数が $\lambda = 10$ だとすると、1時間にちょうど 5 回電話がかかってくる確率は: $ P(X = 5) = \frac{10^5 e^{-10}}{5!} $ ### **(2) Web サーバーへのアクセス** Web サーバーが1秒あたりに受けるリクエスト数が平均 $\lambda = 3$ の場合、1秒間に 0 回のリクエストが発生する確率は: $ P(X = 0) = \frac{3^0 e^{-3}}{0!} = e^{-3} \approx 0.0498 $ --- ## **3. ポワソン分布の応用例** ポワソン分布は、以下のような分野で広く使われます: - **通信**:一定時間内のパケット到着数 - **マーケティング**:広告を見てクリックする回数 - **医療**:ある病気の発生件数(一定期間内) - **品質管理**:製造ラインでの不良品の発生数 --- ## **4. ポワソン分布と他の確率分布との関係** ### **(1) 二項分布との関係** - 二項分布 \( B(n, p) \) において \( n \to \infty, p \to 0 \) かつ \( np = \lambda \) を満たすとき、ポワソン分布 \( P(\lambda) \) に近似できる。 - **例**:10,000個の部品に不良率 0.001 の不良品が含まれる場合、不良品の総数はポワソン分布で近似可能。 ### **(2) 指数分布との関係** - あるイベントの発生間隔(時間や距離)は**指数分布**に従う。 - **例**:ポワソン分布が「1時間あたりの電話の回数」をモデル化するなら、指数分布は「次の電話がかかってくるまでの時間」をモデル化する。 --- ## **5. Python を使ったポワソン分布の可視化** 以下のコードを使って、ポワソン分布の確率質量関数(PMF)をプロットできます。 ```python import numpy as np import matplotlib.pyplot as plt from scipy.stats import poisson # 平均発生回数 λ を 3 と設定 lambda_value = 3 x = np.arange(0, 15) # 0 から 14 までの範囲 # ポワソン分布の確率質量関数 (PMF) pmf_values = poisson.pmf(x, lambda_value) # プロット plt.figure(figsize=(8, 5)) plt.bar(x, pmf_values, alpha=0.6, label=f'Poisson(λ={lambda_value})', edgecolor='black') plt.xlabel('発生回数 (k)') plt.ylabel('確率 P(X=k)') plt.title('ポワソン分布 (λ=3)') plt.legend() plt.grid(axis='y', linestyle='--', alpha=0.7) plt.show() ``` ![[Poisson_pmf.svg|ポワソン分布]] (画像は例としてWikipediaのものを使用) ## **まとめ** - **ポワソン分布は、一定時間内に発生する事象の回数をモデル化する。** - 平均発生回数 λ\lambdaλ が大きくなると、ばらつきが増える。 - **応用例**:通信、マーケティング、医療、品質管理など多岐にわたる。 - **二項分布や指数分布と関連が深い**。 ポワソン分布を使うことで、リアルなデータのモデリングや意思決定に役立てることができます!