確率論 における対数コーシー分布 (たいすうコーシーぶんぷ、英 : log-Cauchy distribution )とは、対数 をとったものがコーシー分布 に従うような確率変数 が従う確率分布 である。X がコーシー分布
に従うならば Y = exp(X ) は対数コーシー分布に従い、同様に Y が対数コーシー分布に従うなら X = log(Y ) はコーシー分布に従う[ 1] 。
定義
対数コーシー分布は台
(
0
,
∞
)
{\displaystyle (0,\infty )}
を持ち、確率密度関数 は
f
(
x
;
μ
,
σ
)
=
1
π
σ
x
1
1
+
(
ln
x
−
μ
σ
)
2
=
1
π
x
σ
(
ln
x
−
μ
)
2
+
σ
2
{\displaystyle {\begin{aligned}f(x;\mu ,\sigma )&={\frac {1}{\pi \sigma x}}{\frac {1}{1+\left({\dfrac {\ln x-\mu }{\sigma }}\right)^{2}}}\\&={\frac {1}{\pi x}}{\frac {\sigma }{(\ln x-\mu )^{2}+\sigma ^{2}}}\end{aligned}}}
である。ここで
μ
{\displaystyle \mu }
は実数 、
σ
>
0
{\displaystyle \sigma >0}
[ 1] [ 2] 。
σ
{\displaystyle \sigma }
が既知のとき、尺度母数 (英語版 ) は
e
μ
{\displaystyle e^{\mu }}
である[ 1] :
f
(
x
;
μ
,
σ
)
=
1
e
μ
f
(
x
/
e
μ
;
0
,
σ
)
{\displaystyle f(x;\mu ,\sigma )={\frac {1}{e^{\mu }}}f(x/e^{\mu };0,\sigma )}
μ
{\displaystyle \mu }
と
σ
{\displaystyle \sigma }
は対応するコーシー分布の位置母数 (英語版 ) と尺度母数である[ 1] [ 3] 。著者によっては
μ
{\displaystyle \mu }
と
σ
{\displaystyle \sigma }
をそれぞれ対数コーシー分布の位置・尺度母数と定義することもある[ 3] 。
μ
=
0
{\displaystyle \mu =0}
かつ
σ
=
1
{\displaystyle \sigma =1}
のときは標準コーシー分布と対応して、確率密度関数は次のように簡略化される[ 4] 。
f
(
x
;
0
,
1
)
=
1
π
x
(
1
+
(
ln
x
)
2
)
{\displaystyle f(x;0,1)={\frac {1}{\pi x(1+(\ln x)^{2})}}}
また、累積分布関数 は
F
(
x
;
μ
,
σ
)
=
1
2
+
1
π
arctan
(
ln
x
−
μ
σ
)
{\displaystyle F(x;\mu ,\sigma )={\frac {1}{2}}+{\frac {1}{\pi }}\arctan \left({\frac {\ln x-\mu }{\sigma }}\right)}
である。
性質
μ
=
0
{\displaystyle \mu =0}
,
σ
=
1
{\displaystyle \sigma =1}
のとき、生存関数 は[ 4]
S
(
x
;
0
,
1
)
=
1
2
−
1
π
arctan
(
ln
x
)
{\displaystyle S(x;0,1)={\frac {1}{2}}-{\frac {1}{\pi }}\arctan(\ln x)}
ハザード率 は[ 4]
λ
(
x
;
0
,
1
)
=
(
x
π
(
1
+
(
ln
x
)
2
)
(
1
2
−
1
π
arctan
(
ln
x
)
)
)
−
1
{\displaystyle \lambda (x;0,1)=\left(x\pi \left(1+\left(\ln x\right)^{2}\right)\left({\frac {1}{2}}-{\frac {1}{\pi }}\arctan(\ln x)\right)\right)^{-1}}
である。ハザード率は分布の始端と終端とで減少するが、途中に増加する区間が存在する場合もある[ 4] 。
対数コーシー分布は裾の重い分布 の一例である[ 5] 。これを「非常に裾の重い分布(super-heavy tailed distribution)」とする著者もいる。なぜなら、パレート型 ヘヴィーテイルよりも裾が重い(つまり対数関数的にしか減衰しない)ためである[ 5] 。コーシー分布と同じく、対数コーシー分布では一切の(非自明)モーメント が無限大になる[ 4] 。平均 はモーメントの一種なので対数コーシー分布は有限の平均、および標準偏差 を持たない[ 6] [ 7] 。
対数コーシー分布はいくつかのパラメータに関してのみ無限分解可能分布 (英語版 ) となる[ 8] 。対数正規分布 、対数t分布 (英語版 ) 、ワイブル分布 と同様に、対数コーシー分布は一般化ベータ分布 (英語版 ) の特別な場合である[ 9] [ 10] 。実は対数コーシー分布は対数t分布の特別な場合であり、これはコーシー分布が自由度1のt分布 のことであるのと同様である[ 11] [ 12] 。
コーシー分布が安定分布 なので対数コーシー分布は対数安定的であり[ 13] 、対数安定分布は x=0 を極 とする[ 12] 。
パラメータの推定
標本 の自然対数をとったものの中央値 は、
μ
{\displaystyle \mu }
のロバストな推定量 (英語版 ) (robust estimator)になる[ 1] 。標本の自然対数をとったものの中央絶対偏差 (英語版 ) (median absolute deviation, MAD)は
σ
{\displaystyle \sigma }
のロバストな推定量になる[ 1] 。
利用
ベイズ統計学 において、対数コーシー分布は非正則 (英語版 ) な Jeffreys-Haldane事前密度 (推定したい正のパラメータについて、k である密度を 1/k で与える)の近似に用いることができる[ 14] [ 15] 。対数コーシー分布は、有意な外れ値 または極値が発生するようなある種の生存過程のモデル化に用いることができる[ 2] [ 3] [ 16] 。適切なモデルになり得る例の一つにヒト免疫不全ウイルス の感染から発症までの時間が挙げられる。この期間は患者によっては非常に長いものとなる[ 3] 。対数コーシー分布は生物種の豊富度パターン(species abundance patterns)のモデルとしても提案されている[ 17] 。
脚注
^ a b c d e f Olive, D.J. (2008年6月23日). “Applied Robust Statistics ”. Southern Illinois University. p. 86. 2011年9月28日時点のオリジナル よりアーカイブ。2011年10月18日閲覧。
^ a b Lindsey, J.K. (2004). Statistical analysis of stochastic processes in time . Cambridge University Press. pp. 33, 50, 56, 62, 145. ISBN 978-0-521-83741-5
^ a b c d Mode, C.J. & Sleeman, C.K. (2000). Stochastic processes in epidemiology: HIV/AIDS, other infectious diseases . World Scientific. pp. 29–37. ISBN 978-981-02-4097-4
^ a b c d e Marshall, A.W. & Olkin, I. (2007). Life distributions: structure of nonparametric, semiparametric, and parametric families . Springer. pp. 443–444. ISBN 978-0-387-20333-1
^ a b Falk, M.; Hüsler, J.; Reiss, R. (2010). Laws of Small Numbers: Extremes and Rare Events . Springer. p. 80. ISBN 978-3-0348-0008-2
^ “Moment ”. Mathworld . 2011年10月19日閲覧。
^ Wang, Y.. Trade, Human Capital and Technology Spillovers: An Industry Level Analysis . Carleton University. p. 14.
^ Bondesson, L. (2003). “On the Lévy Measure of the Lognormal and LogCauchy Distributions” . Methodology and Computing in Applied Probability : 243–256. オリジナル の2012-04-25時点におけるアーカイブ。. https://web.archive.org/web/20120425064706/http://resources.metapress.com/pdf-preview.axd?code=gn16hw202rxh4q1g&size=largest 2011年10月18日閲覧。 .
^ Knight, J. & Satchell, S. (2001). Return distributions in finance . Butterworth-Heinemann. p. 153. ISBN 978-0-7506-4751-9
^ Kemp, M. (2009). Market consistency: model calibration in imperfect markets . Wiley. ISBN 978-0-470-77088-7
^ MacDonald, J.B. (1981). “Measuring Income Inequality”. In Taillie, C.; Patil, G.P.; Baldessari, B.. Statistical distributions in scientific work: proceedings of the NATO Advanced Study Institute . Springer. p. 169. ISBN 978-90-277-1334-6
^ a b Kleiber, C. & Kotz, S. (2003). Statistical Size Distributions in Economics and Actuarial Science . Wiley. pp. 101–102, 110. ISBN 978-0-471-15064-0
^ Panton, D.B. (May 1993). “Distribution function values for logstable distributions” . Computers & Mathematics with Applications 25 (9): 17–24. doi :10.1016/0898-1221(93)90128-I . http://www.sciencedirect.com/science/article/pii/089812219390128I 2011年10月18日閲覧。 .
^ Good, I.J. (1983). Good thinking: the foundations of probability and its applications . University of Minnesota Press. p. 102. ISBN 978-0-8166-1142-3
^ Chen, M. (2010). Frontiers of Statistical Decision Making and Bayesian Analysis . Springer. p. 12. ISBN 978-1-4419-6943-9
^ Lindsey, J.K.; Jones, B.; Jarvis, P. (September 2001). “Some statistical issues in modelling pharmacokinetic data”. Statistics in Medicine 20 (17–18): 2775–278. doi :10.1002/sim.742 . PMID 11523082 .
^ Zuo-Yun, Y. (June 2005). “LogCauchy, log-sech and lognormal distributions of species abundances in forest communities” . Ecological Modelling 184 (2–4): 329–340. doi :10.1016/j.ecolmodel.2004.10.011 . http://www.sciencedirect.com/science/article/pii/S0304380004005587 2011年10月18日閲覧。 .
離散単変量で 有限台 離散単変量で 無限台 連続単変量で 有界区間に台を持つ 連続単変量で 半無限区間に台を持つ 連続単変量で 実数直線全体に台を持つ 連続単変量で タイプの変わる台を持つ 混連続-離散単変量 多変量 (結合) 方向 退化 と特異 族 サンプリング法 (英語版 )