この項目では、マルコフ連鎖 の遷移行列について説明しています。一般的な確率変数を要素とする行列については「ランダム行列 」をご覧ください。
数学 における確率行列 (かくりつぎょうれつ、英 : stochastic matrix )とは、マルコフ連鎖 の遷移確率を表す正方行列 である。全ての成分が、確率を表す非負実数となっている[ 1] [ 2] :9-11 。文脈によって遷移行列 (英: transition matrix )、置換行列 (英: substitution matrix )、マルコフ行列 (英: Markov matrix )と呼ばれることもある。また 英: probabilistic matrix と呼ばれることもある[ 2] :9-11 。
確率行列は20世紀 初頭にアンドレイ・マルコフ によって初めて導入され、確率論 、統計学 、数理ファイナンス 、線形代数学 、計算機科学 、集団遺伝学 といった様々な分野で活用されてきた[ 2] :1-8 。
確率行列には、いくつかの異なる定義・形式がある[ 2] :9-11 :
右確率行列 (英: right stochastic matrix )とは、任意の行の和が1となる非負実数成分の正方行列である。
左確率行列 (英: left stochastic matrix )とは、任意の列の和が1となる非負実数成分の正方行列である。
二重確率行列 (英: doubly stochastic matrix )とは、任意の行、任意の列の和が1となる非負実数成分の正方行列である。
同様にして、確率ベクトル (英語版 ) (英: stochastic vector, probability vector ) を、全ての成分が非負の実数で和が1となるベクトル と定義できる。右確率行列の全ての行(左確率行列の全ての列)は確率ベクトルである[ 2] :9-11 。
数学の文献での慣習に従い、本項では行ベクトルが確率ベクトルとなる右確率行列について述べる[ 2] :1-8 。
歴史
アンドレイ・マルコフ(1886年)
確率行列は、ロシア人 数学者 でサンクトペテルブルク大学 教授であったアンドレイ・マルコフによってマルコフ連鎖とともに考案された。出版物への初めての記載は1906年である[ 2] :1-8 [ 3] 。マルコフは当初、これらを言語分析やカードシャッフル 等の数学的題材に用いるつもりだったが、たちまち他の分野でも有用であることが分かってきた[ 2] :1-8 [ 3] [ 4] 。
確率行列はアンドレイ・コルモゴロフ 等の学者によってさらなる研究がなされ、連続時間マルコフ過程にも適用できるよう拡張が行われた[ 5] 。1950年代までに、計量経済学 [ 6] や回路網解析 [ 7] といった分野にも確率行列を用いた論文が現れた。1960年代には行動科学 [ 8] から地質学 [ 9] [ 10] 、居住地 計画[ 11] まで、さらに広範な科学領域で確率行列が用いられるようになった。同時に、この期間には確率行列やマルコフ過程 の応用範囲や有用性を押し広げるような数学的研究もより一般的に行われた。
1970年代から現在にかけて、確率行列は建築構造設計 [ 12] から医療診断 [ 13] 、人事労務管理 [ 14] まで、形式的な分析を必要とするほとんどあらゆる分野で用いられるようになってきた。土地利用変化モデリング (英語版 ) (land change modeling、この分野では「マルコフ行列」と呼ばれることが多い)においても広範に応用されている[ 15] 。
定義と性質
確率行列は、要素が有限 個の状態空間 S (濃度
S
{\displaystyle S}
)上のマルコフ連鎖
X
t
{\displaystyle {\boldsymbol {X}}_{t}}
を記述する。
1ステップで状態
i
{\displaystyle i}
から状態
j
{\displaystyle j}
へ遷移する確率が
P
r
(
j
∣
i
)
=
P
i
,
j
{\displaystyle Pr(j\mid i)=P_{i,j}}
であるとき、確率行列
P
{\displaystyle P}
は
i
{\displaystyle i}
行・
j
{\displaystyle j}
列成分を
P
i
,
j
{\displaystyle P_{i,j}}
とする行列で与えられる。例えば、
P
=
[
P
1
,
1
P
1
,
2
…
P
1
,
j
…
P
1
,
S
P
2
,
1
P
2
,
2
…
P
2
,
j
…
P
2
,
S
⋮
⋮
⋱
⋮
⋱
⋮
P
i
,
1
P
i
,
2
…
P
i
,
j
…
P
i
,
S
⋮
⋮
⋱
⋮
⋱
⋮
P
S
,
1
P
S
,
2
…
P
S
,
j
…
P
S
,
S
]
{\displaystyle P=\left[{\begin{matrix}P_{1,1}&P_{1,2}&\dots &P_{1,j}&\dots &P_{1,S}\\P_{2,1}&P_{2,2}&\dots &P_{2,j}&\dots &P_{2,S}\\\vdots &\vdots &\ddots &\vdots &\ddots &\vdots \\P_{i,1}&P_{i,2}&\dots &P_{i,j}&\dots &P_{i,S}\\\vdots &\vdots &\ddots &\vdots &\ddots &\vdots \\P_{S,1}&P_{S,2}&\dots &P_{S,j}&\dots &P_{S,S}\\\end{matrix}}\right]}
状態
i
{\displaystyle i}
から次の状態へ遷移する確率の総和は1なので、
∑
j
=
1
S
P
i
,
j
=
1
{\displaystyle \sum _{j=1}^{S}P_{i,j}=1}
となり右確率行列であるための条件を満たす[ 2] :1-8 。この性質を
P
1
=
1
{\displaystyle P\mathbf {1} =\mathbf {1} }
とも表せる[ 16] 。ここで
1
{\displaystyle \mathbf {1} }
は全ての成分が
1
{\displaystyle 1}
の
S
{\displaystyle S}
次元列ベクトルである。
これを使うと、2つの確率行列
P
′
{\displaystyle P^{\prime }}
,
P
′
′
{\displaystyle P^{\prime \prime }}
の積 もまた右確率的であることがわかる:
P
′
P
′
′
1
=
P
′
(
P
′
′
1
)
=
P
′
1
=
1
{\displaystyle P^{\prime }P^{\prime \prime }\mathbf {1} =P^{\prime }(P^{\prime \prime }\mathbf {1} )=P^{\prime }\mathbf {1} =\mathbf {1} }
一般に、確率行列
P
{\displaystyle P}
の
k
{\displaystyle k}
乗
P
k
{\displaystyle P^{k}}
もまた確率行列である。状態
i
{\displaystyle i}
から状態
j
{\displaystyle j}
へ2ステップで遷移する確率は
P
2
{\displaystyle P^{2}}
の第
(
i
,
j
)
{\displaystyle (i,j)}
成分
(
P
2
)
i
,
j
{\displaystyle \left(P^{2}\right)_{i,j}}
に等しく、さらに一般に、ある状態から次の状態へ
k
{\displaystyle k}
ステップで遷移する確率は
P
k
{\displaystyle P^{k}}
で与えられる。
初期状態の確率分布(系がどのような状態をどのような確率でとっているか)は行ベクトルとして与えられる。
定常 (英: stationary )確率ベクトル
π
{\displaystyle {\boldsymbol {\pi }}}
とは、右確率行列が右から作用しても不変な行確率ベクトルのことである。つまり、集合
{
1
,
.
.
.
,
n
}
{\displaystyle \{1,...,n\}}
上の確率分布であって、左固有値 1に対する左固有ベクトル となるもののことである:
π
P
=
π
{\displaystyle {\boldsymbol {\pi }}P={\boldsymbol {\pi }}}
任意の右確率行列のスペクトル半径 の最大値は1であることがゲルシュゴリンの定理 によりわかる。また右固有値1に対する右固有ベクトル
1
{\displaystyle {\boldsymbol {1}}}
が存在することは明らかである。正方行列に対する右固有値と左固有値は一致するから、右確率行列に対して左固有値1が存在し、全ての左固有値の絶対値が1以下であることも同時に分かる。
行確率ベクトルに右確率行列を右から作用させて得られる行ベクトルもやはり確率ベクトルであるから、(各成分が非負で和が1に等しい
n
{\displaystyle n}
次元実ベクトル全体がコンパクト 凸集合 をなすことに注意すると)ブラウワーの不動点定理 より定常な確率ベクトルが少なくとも一つは存在することが分かる。
一方でペロン=フロベニウスの定理 によっても、任意の既約な確率行列(任意の
(
i
,
j
)
{\displaystyle (i,j)}
に対し
P
N
{\displaystyle P^{N}}
の第
(
i
,
j
)
{\displaystyle (i,j)}
成分が正になる自然数
N
{\displaystyle N}
が存在するような行列。行列の既約性 を参照)が定常な確率ベクトルを持ち、固有値の絶対値の最大値が1となることが分かる。しかし、この定理は既約であるとは限らない確率行列には直接的に適用できない。
一般に定常な確率ベクトルは複数存在するかもしれないが、確率行列の全ての成分が正であれば(より一般的には、確率行列が既約かつ非周期的(エルゴード的 (英語版 ) (英: ergodic ))であれば)、このようなベクトルは一意的であり、任意の状態
i
{\displaystyle i}
に対し次の極限をとることで計算できる。
lim
k
→
∞
(
P
k
)
i
,
j
=
π
j
{\displaystyle \lim _{k\rightarrow \infty }\left(P^{k}\right)_{i,j}={\boldsymbol {\pi }}_{j}}
ここで
π
j
{\displaystyle {\boldsymbol {\pi }}_{j}}
は行ベクトル
π
{\displaystyle {\boldsymbol {\pi }}}
の第
j
{\displaystyle j}
成分。これより、長期的に見たとき状態
j
{\displaystyle j}
に到る確率は初期状態
i
{\displaystyle i}
に依らないことが分かる。どのような初期分布から計算しても極限では同一の定常分布に到るという事実はエルゴード定理 の一形態であり、多様な散逸構造 (系が時間発展し、安定的な状態に達する)において一般的に成り立っている。
直観的には確率行列はマルコフ連鎖を表し、(行ベクトルとしての)確率分布に右確率行列を右から作用させることは、元の分布の確率質量 を(総和1を保ちつつ)次の確率分布へ再分配することに相当する。この作用を反復していくとマルコフ連鎖の定常状態に収束する[ 2] :55–59 。
例:ネコとネズミ
5つの一列に並んだ箱と単位時間ずつ進むタイマーがあり、時刻0で、1番目の箱にはネコが、5番目の箱にはネズミが入っているとする。タイマーが進むたびに、ネコとネズミは隣の箱に全くのランダムに飛び移る。
例えば、ネコが2番目の箱・ネズミが4番目の箱に入っていれば、次の時刻にネコが1番目の箱・ネズミが5番目の箱にいる確率は 1/4、ネコが1番目の箱・ネズミが5番目の箱に入っていれば、ネコが2番目の箱・ネズミが2番目の箱に移る確率は 1 である。ネコとネズミが同じ箱に飛び移った時点でネコはネズミを食べてしまうものとし、これを「ゲーム終了」の時刻とする。確率変数 K でゲーム終了までの時間を表すことにする。
このゲームを表すマルコフ連鎖は以下のような(ネコ,ネズミ)の5通りの状態で表せる。状態の組み合わせは単純に数えると25通りだが、「ネズミの箱の番号はネコの箱の番号より小さくはならず」、「2つの箱の番号の和は偶数でなければいけない」ことから、多くの組み合わせは排除される。また、ネズミがネコに食べられる3つの場合は1つの状態としてまとめるものとする:
状態 1: (1,3)
状態 2: (1,5)
状態 3: (2,4)
状態 4: (3,5)
状態 5: ゲーム終了 (2,2), (3,3), (4,4)
以下の行列
P
{\displaystyle P}
で、このゲームの遷移確率を表す(行と列の番号は上記の状態の番号と対応する:行番号が遷移前の状態で、列番号が遷移後の状態[ 2] :1-8 )。例えば状態 1 から始めたとすると、この状態に留まったり、状態 2、状態 4 に遷移することはできない(
P
11
=
0
,
P
12
=
0
,
P
14
=
0
{\displaystyle P_{11}=0,P_{12}=0,P_{14}=0}
)が、状態 3 または 5 への遷移は可能である(
P
13
,
P
15
≠
0
{\displaystyle P_{13},P_{15}\neq 0}
)。
P
=
[
0
0
1
/
2
0
1
/
2
0
0
1
0
0
1
/
4
1
/
4
0
1
/
4
1
/
4
0
0
1
/
2
0
1
/
2
0
0
0
0
1
]
{\displaystyle P={\begin{bmatrix}0&0&1/2&0&1/2\\0&0&1&0&0\\1/4&1/4&0&1/4&1/4\\0&0&1/2&0&1/2\\0&0&0&0&1\end{bmatrix}}}
長時間平均
初期状態がいずれであっても、ネコは最終的にはネズミを捕えて、定常状態
π
=
(
0
,
0
,
0
,
0
,
1
)
{\displaystyle {\boldsymbol {\pi }}=(0,0,0,0,1)}
に到達する[ 2] :55–59 。生存時間の平均(期待値)を計算するには、すべての状態
S
j
{\displaystyle S_{j}}
と時間
t
k
{\displaystyle t_{k}}
についての寄与
Y
j
,
k
P
(
S
=
S
j
,
t
=
t
k
)
{\displaystyle Y_{j,k}P(S=S_{j},t=t_{k})}
を足しあげればよい。ここで
Y
{\displaystyle Y}
は生存状態に対しては
Y
j
,
k
=
1
{\displaystyle Y_{j,k}=1}
、死亡状態に対しては
Y
j
,
k
=
0
{\displaystyle Y_{j,k}=0}
の2値をとる変数である(Y=0は和に寄与しない)。
相型分布としての表現
ネズミの生存確率関数。少なくとも最初の1ステップでは生き残っている。
状態 5 は吸収状態であり、吸収までの時間は離散的相型分布 (英語版 ) に従う。系が状態 2 から始まったとする(ベクトルで表すと
[
0
,
1
,
0
,
0
,
0
]
{\displaystyle [0,1,0,0,0]}
)。ネズミが死んでしまう状態は平均生存時間に寄与しないから、状態 5 は考えなくてよい。すると初期状態と遷移確率を表す行列は次のように縮小化できる。
τ
=
[
0
,
1
,
0
,
0
]
,
T
=
[
0
0
1
2
0
0
0
1
0
1
4
1
4
0
1
4
0
0
1
2
0
]
{\displaystyle {\boldsymbol {\tau }}=[0,1,0,0],\qquad T={\begin{bmatrix}0&0&{\frac {1}{2}}&0\\0&0&1&0\\{\frac {1}{4}}&{\frac {1}{4}}&0&{\frac {1}{4}}\\0&0&{\frac {1}{2}}&0\end{bmatrix}}}
また、
(
I
−
T
)
−
1
1
=
[
2.75
4.5
3.5
2.75
]
{\displaystyle (I-T)^{-1}{\boldsymbol {1}}={\begin{bmatrix}2.75\\4.5\\3.5\\2.75\end{bmatrix}}}
ここで
I
{\displaystyle I}
は単位行列 、
1
{\displaystyle \mathbf {1} }
は全ての成分が1の列ベクトルであり、各状態に対してその状態への遷移確率を合計するはたらきをする。
各ステップで系はどれかの状態をとるから、ネズミの平均生存時間は、系がいずれかの生存状態にある確率を全ての時間にわたって合計したものに等しく(和は行列項級数 として考える)、
E
[
K
]
=
τ
(
I
+
T
+
T
2
+
⋯
)
1
=
τ
(
I
−
T
)
−
1
1
=
4.5
{\displaystyle E[K]={\boldsymbol {\tau }}\left(I+T+T^{2}+\cdots \right){\boldsymbol {1}}={\boldsymbol {\tau }}(I-T)^{-1}{\boldsymbol {1}}=4.5}
となる。高次のモーメントは
E
[
K
(
K
−
1
)
…
(
K
−
n
+
1
)
]
=
n
!
τ
(
I
−
T
)
−
n
T
n
−
1
1
{\displaystyle E[K(K-1)\dots (K-n+1)]=n!{\boldsymbol {\tau }}(I-{T})^{-n}{T}^{n-1}\mathbf {1} }
で与えられる。
関連項目
脚注
^ Asmussen, S. R. (2003). “Markov Chains”. Applied Probability and Queues . Stochastic Modelling and Applied Probability. 51 . pp. 3–8. doi :10.1007/0-387-21525-5_1 . ISBN 978-0-387-00211-8
^ a b c d e f g h i j k l Gagniuc, Paul A. (2017). Markov Chains: From Theory to Implementation and Experimentation . USA, NJ: John Wiley & Sons. pp. 9–11. ISBN 978-1-119-38755-8
^ a b Hayes, Brian (2013). “First links in the Markov chain”. American Scientist 101 (2): 92–96.
^ Charles Miller Grinstead; James Laurie Snell (1997). Introduction to Probability. American Mathematical Soc. pp. 464–466. ISBN 978-0-8218-0749-1 .
^ Kendall, D. G.; Batchelor, G. K.; Bingham, N. H.; Hayman, W. K.; Hyland, J. M. E.; Lorentz, G. G.; Moffatt, H. K.; Parry, W. et al. (1990). “Andrei Nikolaevich Kolmogorov (1903–1987)”. Bulletin of the London Mathematical Society 22 (1): 33. doi :10.1112/blms/22.1.31 .
^ Solow, Robert (1952-01-01). “On the Structure of Linear Models”. Econometrica 20 (1): 29–46. doi :10.2307/1907805 . JSTOR 1907805 .
^ Sittler, R. (1956-12-01). “Systems Analysis of Discrete Markov Processes” . IRE Transactions on Circuit Theory 3 (4): 257–266. doi :10.1109/TCT.1956.1086324 . ISSN 0096-2007 . http://ieeexplore.ieee.org/abstract/document/1086324/ .
^ Evans, Selby (1967-07-01). “Vargus 7: Computed patterns from markov processes” (英語). Behavioral Science 12 (4): 323–328. doi :10.1002/bs.3830120407 . ISSN 1099-1743 . http://onlinelibrary.wiley.com/doi/10.1002/bs.3830120407/abstract .
^ Gingerich, P. D. (1969-01-01). “Markov analysis of cyclic alluvial sediments” (英語). Journal of Sedimentary Research 39 (1): 330–332. doi :10.1306/74d71c4e-2b21-11d7-8648000102c1865d . ISSN 1527-1404 . http://archives.datapages.com/data/doi/10.1306/74D71C4E-2B21-11D7-8648000102C1865D .
^ Krumbein, W. C.; Dacey, Michael F. (1969-03-01). “Markov chains and embedded Markov chains in geology” (英語). Journal of the International Association for Mathematical Geology 1 (1): 79–96. doi :10.1007/BF02047072 . ISSN 0020-5958 . https://link.springer.com/article/10.1007/BF02047072 .
^ Wolfe, Harry B. (1967-05-01). “Models for Conditioning Aging of Residential Structures” . Journal of the American Institute of Planners 33 (3): 192–196. doi :10.1080/01944366708977915 . ISSN 0002-8991 . https://doi.org/10.1080/01944366708977915 .
^ Krenk, S.. “A Markov matrix for fatigue load simulation and rainflow range evaluation” (英語). Structural Safety 6 (2–4): 247–258. doi :10.1016/0167-4730(89)90025-8 . http://www.sciencedirect.com/science/article/pii/0167473089900258 2017年5月5日閲覧。 .
^ Beck, J.Robert; Pauker, Stephen G. (1983-12-01). “The Markov Process in Medical Prognosis” (英語). Medical Decision Making 3 (4): 419–458. doi :10.1177/0272989X8300300403 . ISSN 0272-989X . https://doi.org/10.1177/0272989X8300300403 .
^ Gotz, Glenn A.; McCall, John J. (1983-03-01). “Sequential Analysis of the Stay/Leave Decision: U.S. Air Force Officers” . Management Science 29 (3): 335–351. doi :10.1287/mnsc.29.3.335 . ISSN 0025-1909 . http://pubsonline.informs.org/doi/abs/10.1287/mnsc.29.3.335 .
^ Kamusoko, Courage; Aniya, Masamu; Adi, Bongo; Manjoro, Munyaradzi (2009-07-01). “Rural sustainability under threat in Zimbabwe – Simulation of future land use/cover changes in the Bindura district based on the Markov-cellular automata model” . Applied Geography 29 (3): 435–447. doi :10.1016/j.apgeog.2008.10.002 . http://www.sciencedirect.com/science/article/pii/S0143622808000702 .
^
P
1
=
1
{\displaystyle P\mathbf {1} =\mathbf {1} }
であることにより、確率行列
P
{\displaystyle P}
は固有値を
1
{\displaystyle 1}
,固有ベクトルを
1
{\displaystyle \mathbf {1} }
とする固有空間を持つことが分かる。