ディリクレ分布

ディリクレ分布
確率密度関数

ディリクレ分布(K=3)の、様々なパラメータベクトルαにおける確率密度関数。左上から時計回りにα=(6, 2, 2), (3, 7, 5), (6, 2, 6), (2, 3, 4)。
累積分布関数
なし
母数 K 2 {\displaystyle K\geq 2} 変量の個数 (整数)
α 1 , , α K {\displaystyle \alpha _{1},\ldots ,\alpha _{K}} 集中度母数(英語版), ここで α i > 0 {\displaystyle \alpha _{i}>0}
x 1 , , x K {\displaystyle x_{1},\ldots ,x_{K}} 、ここで、 x i [ 0 , 1 ] {\displaystyle x_{i}\in [0,1]} かつ x i = 1 {\displaystyle \sum x_{i}=1}
確率密度関数 1 B ( α ) i = 1 K x i α i 1 {\displaystyle {\frac {1}{\mathrm {B} ({\boldsymbol {\alpha }})}}\prod _{i=1}^{K}x_{i}^{\alpha _{i}-1}}
ここで、 B ( α ) = i = 1 K Γ ( α i ) Γ ( i = 1 K α i ) {\displaystyle \mathrm {B} ({\boldsymbol {\alpha }})={\frac {\prod _{i=1}^{K}\Gamma (\alpha _{i})}{\Gamma {\bigl (}\sum _{i=1}^{K}\alpha _{i}{\bigr )}}}}
α = ( α 1 , , α K ) {\displaystyle {\boldsymbol {\alpha }}=(\alpha _{1},\ldots ,\alpha _{K})}
期待値 E [ X i ] = α i k α k {\displaystyle \operatorname {E} [X_{i}]={\frac {\alpha _{i}}{\sum _{k}\alpha _{k}}}}
E [ ln X i ] = ψ ( α i ) ψ ( k α k ) {\displaystyle \operatorname {E} [\ln X_{i}]=\psi (\alpha _{i})-\psi (\textstyle \sum _{k}\alpha _{k})}
(ここで、ψ(・)はディガンマ関数)
最頻値 x i = α i 1 i = 1 K α i K , α i > 1. {\displaystyle x_{i}={\frac {\alpha _{i}-1}{\sum _{i=1}^{K}\alpha _{i}-K}},\quad \alpha _{i}>1.}
分散 V a r [ X i ] = α i ( α 0 α i ) α 0 2 ( α 0 + 1 ) , {\displaystyle \mathrm {Var} [X_{i}]={\frac {\alpha _{i}(\alpha _{0}-\alpha _{i})}{\alpha _{0}^{2}(\alpha _{0}+1)}},}
where α 0 = i = 1 k α i {\displaystyle \alpha _{0}=\sum _{i=1}^{k}\alpha _{i}}
C o v [ X i , X j ] = α i α j α 0 2 ( α 0 + 1 )     ( i j ) {\displaystyle \mathrm {Cov} [X_{i},X_{j}]={\frac {-\alpha _{i}\alpha _{j}}{\alpha _{0}^{2}(\alpha _{0}+1)}}~~(i\neq j)}
エントロピー (see en:Dirichlet distribution#Entropy)
テンプレートを表示

ディリクレ分布(ディリクレぶんぷ、: Dirichlet distribution)は、連続型確率分布である。ベータ分布を多変量に拡張して一般化した形をしており、そのため多変量ベータ分布とも呼ばれる。ディリクレ分布の確率密度関数は、同時に発生することのない K {\displaystyle K} 個の事象がそれぞれ α i 1 {\displaystyle \alpha _{i}-1} 回発生したときに、各事象の起こる確率が x i {\displaystyle x_{i}} である確率を与える(ただし、 α i {\displaystyle \alpha _{i}} は整数である必要はない)。つまり、試行の回数が無限大なら各事象の発生の相対頻度は x i {\displaystyle x_{i}} になるが、試行回数が有限だと、そこにずれが生じる。そのずれを表すモデルである。

定義と性質

α = ( α 1 , , α K ) {\displaystyle {\boldsymbol {\alpha }}=(\alpha _{1},\ldots ,\alpha _{K})} をパラメータ、実数ベクトル x = ( x 1 , , x K ) {\displaystyle {\boldsymbol {x}}=(x_{1},\ldots ,x_{K})} を確率変数 とするときの K 1 {\displaystyle K-1} 次ディリクレ分布の確率密度関数は以下の式で定義される。

P ( x ; α ) = 1 B ( α ) i = 1 K x i α i 1 {\displaystyle P({\boldsymbol {x}};{\boldsymbol {\alpha }})={\frac {1}{B({\boldsymbol {\alpha }})}}\prod _{i=1}^{K}x_{i}^{\alpha _{i}-1}}

ここで x {\displaystyle {\boldsymbol {x}}} K-1次元単体上の点であり、 x i 0 {\displaystyle x_{i}\geq 0} x i = 1 {\displaystyle \sum x_{i}=1} を満たす。また、 α i > 0 {\displaystyle \alpha _{i}>0} であり、 B ( α ) {\displaystyle B({\boldsymbol {\alpha }})} は多変量に拡張したベータ関数で、以下の式で定義される。

B ( α ) = i = 1 K Γ ( α i ) Γ ( i = 1 K α i ) {\displaystyle B({\boldsymbol {\alpha }})={\frac {\prod _{i=1}^{K}\Gamma (\alpha _{i})}{\Gamma (\sum _{i=1}^{K}\alpha _{i})}}}

このとき、 x i {\displaystyle x_{i}} の期待値は α i i = 1 K α i {\displaystyle {\frac {\alpha _{i}}{\sum _{i=1}^{K}\alpha _{i}}}} 、同じく分散は α i j i α j ( i = 1 K α i ) 2 ( 1 + i = 1 K α i ) {\displaystyle {\frac {\alpha _{i}\sum _{j\neq i}\alpha _{j}}{(\sum _{i=1}^{K}\alpha _{i})^{2}(1+\sum _{i=1}^{K}\alpha _{i})}}} である。

確率密度関数の台

ディリクレ分布の確率密度関数のはK次元ベクトルxの集合であって、xの各要素が(0, 1)の開区間に含まれ、かつその要素の合計が1になるようなもの集合である。これは、[0,1]の区間を互いに交わらず大きさが0でないK個の集合に分割していると見ることができる。この他の見方として、ディリクレ分布の定義域それ自体が確率密度関数であるというものがある。すなわち、K個の分割それ自体が離散分布であるとする考え方である。このような台を専門的にはK-1次元単体((K-1)-simplex)と呼ぶ。

特殊な場合

最も単純な特殊例として対称ディリクレ分布が挙げられる。対称ディリクレ分布においては、パラメータベクトル α {\displaystyle {\boldsymbol {\alpha }}} の要素が全て同じ値である。ここで、パラメータベクトルの要素が全てαであるとすれば、対称ディリクレ分布は次の形で書き表される。

P ( x ; α ) = Γ ( α K ) Γ ( α ) K i = 1 K x i α 1 {\displaystyle P({\boldsymbol {x}};\alpha )={\frac {\Gamma (\alpha K)}{\Gamma (\alpha )^{K}}}\prod _{i=1}^{K}x_{i}^{\alpha -1}}

仮にα=1であるとすると、ディリクレ分布は(K-1)次元単体上の一様分布になる。

参考文献

  • 蓑谷千凰彦, 統計分布ハンドブック, 朝倉書店 (2003).
  • B. S. Everitt (清水良一訳), 統計科学辞典, 朝倉書店 (2002).

関連項目

外部リンク

  • Generalized Dirichlet distribution
  • 朱鷺の杜Wiki
  • GSL reference manual Japanese version
離散単変量で
有限台
離散単変量で
無限台
  • ベータ負二項(英語版)
  • ボレル(英語版)
  • コンウェイ–マクスウェル–ポワソン(英語版)
  • 離散位相型(英語版)
  • ドラポルト(英語版)
  • 拡張負二項(英語版)
  • ガウス–クズミン
  • 幾何
  • 対数(英語版)
  • 負の二項
  • 放物フラクタル(英語版)
  • ポワソン
  • スケラム(英語版)
  • ユール–サイモン(英語版)
  • ゼータ(英語版)
連続単変量で
有界区間に台を持つ
  • 逆正弦(英語版)
  • ARGUS(英語版)
  • バルディング–ニコルス(英語版)
  • ベイツ(英語版)
  • ベータ
  • beta rectangular(英語版)
  • アーウィン–ホール(英語版)
  • クマラスワミー(英語版)
  • ロジット-正規(英語版)
  • 非中心ベータ(英語版)
  • raised cosine(英語版)
  • reciprocal(英語版)
  • 三角
  • U-quadratic(英語版)
  • 一様
  • ウィグナー半円
連続単変量で
半無限区間に台を持つ
  • ベニーニ(英語版)
  • ベンクタンダー第一種(英語版)
  • ベンクタンダー第二種(英語版)
  • 第2種ベータ
  • Burr(英語版)
  • カイ二乗
  • カイ(英語版)
  • Dagum(英語版)
  • デービス(英語版)
  • 指数-対数(英語版)
  • アーラン
  • 指数
  • F
  • folded normal(英語版)
  • Flory–Schulz(英語版)
  • フレシェ
  • ガンマ
  • gamma/Gompertz(英語版)
  • 一般逆ガウス(英語版)
  • Gompertz(英語版)
  • half-logistic(英語版)
  • half-normal(英語版)
  • Hotelling's T-squared(英語版)
  • 超アーラン(英語版)
  • 超指数(英語版)
  • hypoexponential(英語版)
  • 逆カイ二乗(英語版)
    • scaled inverse chi-squared(英語版)
  • 逆ガウス
  • 逆ガンマ
  • コルモゴロフ
  • レヴィ
  • 対数コーシー
  • 対数ラプラス(英語版)
  • 対数ロジスティック(英語版)
  • 対数正規
  • ロマックス(英語版)
  • 行列指数(英語版)
  • マクスウェル–ボルツマン
  • マクスウェル–ユットナー(英語版)
  • ミッタク-レフラー(英語版)
  • 仲上(英語版)
  • 非心カイ二乗
  • パレート
  • 位相型(英語版)
  • poly-Weibull(英語版)
  • レイリー
  • relativistic Breit–Wigner(英語版)
  • ライス(英語版)
  • shifted Gompertz(英語版)
  • 切断正規
  • タイプ2ガンベル(英語版)
  • ワイブル
    • 離散ワイブル(英語版)
  • ウィルクスのラムダ(英語版)
連続単変量で
実数直線全体に台を持つ
連続単変量で
タイプの変わる台を持つ
  • 一般極値
  • 一般パレート(英語版)
  • マルチェンコ–パストゥール(英語版)
  • q-指数(英語版)
  • q-ガウス
  • q-ワイブル(英語版)
  • shifted log-logistic(英語版)
  • トゥーキーのラムダ(英語版)
混連続-離散単変量
  • rectified Gaussian(英語版)
多変量 (結合)
【離散】
エウェンズ(英語版)
多項
ディリクレ多項(英語版)
負多項(英語版)
【連続】
ディリクレ
一般ディリクレ(英語版)
多変量正規
多変量安定(英語版)
多変量 t(英語版)
正規逆ガンマ(英語版)
正規ガンマ(英語版)
行列値
逆行列ガンマ(英語版)
逆ウィッシャート(英語版)
行列正規(英語版)
行列 t(英語版)
行列ガンマ(英語版)
正規逆ウィッシャート(英語版)
正規ウィッシャート(英語版)
ウィッシャート
方向
【単変量 (円周) 方向
円周一様(英語版)
単変数フォン・ミーゼス
wrapped 正規(英語版)
wrapped コーシー(英語版)
wrapped 指数(英語版)
wrapped 非対称ラプラス(英語版)
wrapped レヴィ(英語版)
【二変量 (球面)】
ケント(英語版)
【二変量 (トロイダル)】
二変数フォン・ミーゼス(英語版)
【多変量】
フォン・ミーゼス–フィッシャー(英語版)
ビンガム(英語版)
退化特異
  • 円周(英語版)
  • 混合ポワソン(英語版)
  • 楕円(英語版)
  • 指数
  • 自然指数(英語版)
  • 位置尺度(英語版)
  • 最大エントロピー(英語版)
  • 混合(英語版)
  • ピアソン(英語版)
  • トウィーディ(英語版)
  • wrapped(英語版)
サンプリング法(英語版)
  • 一覧記事 一覧(英語版)
  • カテゴリ カテゴリ