統計学 や計量経済学 、特に時系列分析 において、自己回帰和分移動平均 (じこかいきわぶんいどうへいきん、英 : Autoregressive integrated moving average 、略称: ARIMA)モデルは、自己回帰移動平均 (ARMA)モデルの一般化である。これらのモデルは、データの理解を深めるため、または将来のポイントを予測するために、時系列 データに適用される。
ARIMAモデルは、データが(分散 /自己共分散 ではなく)平均 に関して非定常性を示す場合に適用され、初期の差分ステップ(モデルの「Integrated 和分」部分に対応)を 1回以上適用して平均関数(すなわち、トレンド)の非定常性を排除することができる[ 1] 。時系列に季節性が見られる場合は、季節成分を除去するために季節的差分を適用することができる[ 2] 。ウォルドの分解定理によれば、ARMA モデルは規則的な (つまり純粋に非決定論的な)広義の定常時系列を記述するのに理論的には十分であるので、ARMA モデルを使用する前に、例えば差分を使用して非定常時系列を定常化することが主な動機となる[ 3] [ 4] [ 5] [ 6] 。時系列に予測可能 なサブプロセス(純粋な正弦波や複素数指数プロセス)が含まれている場合、予測可能な成分はARIMAのフレームワークでは平均非ゼロで周期的な(つまり季節的な)成分として扱われるので、季節的な差分処理によって除去されることに注意が必要である。
ARIMAのAR(autoregressive、自己回帰)の部分は、関心のある展開する変数がそれ自体の遅延した値(すなわち、以前の値)に回帰されることを示している。MA(moving average、移動平均)の部分は、回帰誤差 が実際には、同時期および過去の様々な時点で発生した誤差項の線型結合 であることを示している[ 7] 。I (integrated 和分)の部分は、データの値が過去の値との差分に置き換えられていることを示している(この差分処理は複数回行われる場合もある)。これらの特徴の目的は、モデルがデータにできるだけ適合するようにすることである。
非季節ARIMAモデルは、一般に
A
R
I
M
A
(
p
,
d
,
q
)
{\displaystyle \mathrm {ARIMA} (p,d,q)}
と表記される。パラメータp 、d 、q は非負の整数で、pは自己回帰モデル の次数(タイムラグの数)、d は差分の階数(データの過去の値を差し引いた回数)、q は移動平均モデル の次数を表す。
季節ARIMAモデルは、通常
A
R
I
M
A
(
p
,
d
,
q
)
(
P
,
D
,
Q
)
m
{\displaystyle \mathrm {ARIMA} (p,d,q)(P,D,Q)_{m}}
と表記される。ここで、m は各季節の期間の数を意味し、大文字のP 、D 、Q はARIMAモデルの季節部分の自己回帰項、差分項、移動平均項を意味する[ 2] [ 8] 。
3つの項のうち2つがゼロの場合、モデルを表す頭字語のうちゼロではないパラメータを用いてモデルを記載することができる。例えば、
A
R
I
M
A
(
1
,
0
,
0
)
{\displaystyle \mathrm {ARIMA} (1,0,0)}
は
A
R
(
1
)
{\displaystyle \mathrm {AR} (1)}
、
A
R
I
M
A
(
0
,
1
,
0
)
{\displaystyle \mathrm {ARIMA} (0,1,0)}
は
I
(
1
)
{\displaystyle \mathrm {I} (1)}
、
A
R
I
M
A
(
0
,
0
,
1
)
{\displaystyle \mathrm {ARIMA} (0,0,1)}
は
M
A
(
1
)
{\displaystyle \mathrm {MA} (1)}
と記載される。
ARIMAモデルは、ボックス・ジェンキンス法 に従って推定することができる。
定義
時系列データXt (t は整数インデックス、Xt は実数)が与えられたとき、
ARMA
(
p
′
,
q
)
{\displaystyle {\text{ARMA}}(p',q)}
モデルは下記のようになる。
X
t
−
α
1
X
t
−
1
−
⋯
−
α
p
′
X
t
−
p
′
=
ε
t
+
θ
1
ε
t
−
1
+
⋯
+
θ
q
ε
t
−
q
,
{\displaystyle X_{t}-\alpha _{1}X_{t-1}-\dots -\alpha _{p'}X_{t-p'}=\varepsilon _{t}+\theta _{1}\varepsilon _{t-1}+\cdots +\theta _{q}\varepsilon _{t-q},}
または同等に
(
1
−
∑
i
=
1
p
′
α
i
L
i
)
X
t
=
(
1
+
∑
i
=
1
q
θ
i
L
i
)
ε
t
{\displaystyle \left(1-\sum _{i=1}^{p'}\alpha _{i}L^{i}\right)X_{t}=\left(1+\sum _{i=1}^{q}\theta _{i}L^{i}\right)\varepsilon _{t}\,}
ここで、
L
{\displaystyle L}
はラグ演算子、
α
i
{\displaystyle \alpha _{i}}
はモデルの自己回帰部分のパラメーター、
θ
i
{\displaystyle \theta _{i}}
は移動平均部分のパラメータ、
ε
t
{\displaystyle \varepsilon _{t}}
は誤差項である。誤差項
ε
t
{\displaystyle \varepsilon _{t}}
は、一般に、平均ゼロの正規分布 からサンプリングされた独立同分布 の変数であるとみなされる。
ここで、多項式
(
1
−
∑
i
=
1
p
′
α
i
L
i
)
{\displaystyle \textstyle \left(1-\sum _{i=1}^{p'}\alpha _{i}L^{i}\right)}
が多重度d の単位根 (因子1 - L )を持つ場合、次のように書き換えることができる。
(
1
−
∑
i
=
1
p
′
α
i
L
i
)
=
(
1
−
∑
i
=
1
p
′
−
d
φ
i
L
i
)
(
1
−
L
)
d
.
{\displaystyle \left(1-\sum _{i=1}^{p'}\alpha _{i}L^{i}\right)=\left(1-\sum _{i=1}^{p'-d}\varphi _{i}L^{i}\right)\left(1-L\right)^{d}.}
A
R
I
M
A
(
p
,
d
,
q
)
{\displaystyle \mathrm {ARIMA} (p,d,q)}
プロセスでは、p = p'-d で用いて、次のように表す。
(
1
−
∑
i
=
1
p
φ
i
L
i
)
(
1
−
L
)
d
X
t
=
(
1
+
∑
i
=
1
q
θ
i
L
i
)
ε
t
{\displaystyle \left(1-\sum _{i=1}^{p}\varphi _{i}L^{i}\right)(1-L)^{d}X_{t}=\left(1+\sum _{i=1}^{q}\theta _{i}L^{i}\right)\varepsilon _{t}\,}
したがって、d 個の単位根を持つ自己回帰多項式を持つ
A
R
M
A
(
p
+
d
,
q
)
{\displaystyle \mathrm {ARMA} (p+d,q)}
プロセスの特殊なケースと考えることができる。 このため、d > 0 のARIMAモデルで正確に記述されるプロセスは広義の定常ではない。
上記は次のように一般化できる。
(
1
−
∑
i
=
1
p
φ
i
L
i
)
(
1
−
L
)
d
X
t
=
δ
+
(
1
+
∑
i
=
1
q
θ
i
L
i
)
ε
t
.
{\displaystyle \left(1-\sum _{i=1}^{p}\varphi _{i}L^{i}\right)(1-L)^{d}X_{t}=\delta +\left(1+\sum _{i=1}^{q}\theta _{i}L^{i}\right)\varepsilon _{t}.\,}
これは、ドリフト
δ
1
−
∑
φ
i
{\displaystyle {\frac {\delta }{1-\sum \varphi _{i}}}}
を伴う
A
R
I
M
A
(
p
,
d
,
q
)
{\displaystyle \mathrm {ARIMA} (p,d,q)}
プロセスを定義する。
差分
定常時系列の性質は、観測された時刻に依存しない。具体的には、広義の定常 時系列では、平均と分散 /自己共分散 は時間の経過とともに一定になる。統計における差分 とは、非定常時系列を平均的な意味で 定常化するために(つまり、非定常トレンドを除去するために)適用される変換であり、分散/自己共分散の非定常性とは関係がない。同様に、季節性時系列に季節差分 を適用して季節成分を除去する。信号処理、特にフーリエ・スペクトル解析理論の観点からは、トレンドは非定常時系列のスペクトルにおける低周波数部分であり、季節はそのスペクトルにおける周期的な周波数部分である。したがって、差分はハイパス (つまり、ローストップ)フィルタとして、季節差分はコムフィルタ として機能し、それぞれ低周波のトレンドと周期的な周波数の季節を(時間領域で直接ではなく)スペクトル領域で抑制することができる[ 6] 。この観点から、差分と季節差分の哲学、数学、力、欠点を説明することができる。
データの差分を取るために、連続した観測値の差を計算する。数学的には次のようになる。
y
t
′
=
y
t
−
y
t
−
1
{\displaystyle y_{t}'=y_{t}-y_{t-1}\,}
差分は時系列のレベルの変化を取り除き、トレンドと季節性を排除し、結果的に時系列の平均値を安定させる[ 6] 。
定常時系列を得るために、2回に渡ってデータの差分を取る必要がある場合もあり、これは 2次差分 と呼ばれる。
y
t
∗
=
y
t
′
−
y
t
−
1
′
=
(
y
t
−
y
t
−
1
)
−
(
y
t
−
1
−
y
t
−
2
)
=
y
t
−
2
y
t
−
1
+
y
t
−
2
{\displaystyle {\begin{aligned}y_{t}^{*}&=y_{t}'-y_{t-1}'\\&=(y_{t}-y_{t-1})-(y_{t-1}-y_{t-2})\\&=y_{t}-2y_{t-1}+y_{t-2}\end{aligned}}}
データの差分を取るもう一つの方法として、季節差分がある。これは、観測値と前の季節(例えば1年)の対応する観測値との差を計算するものである。これは次のように示される。
y
t
′
=
y
t
−
y
t
−
m
where
m
=
duration of season
.
{\displaystyle y_{t}'=y_{t}-y_{t-m}\quad {\text{where }}m={\text{duration of season}}.}
そして、この差分を取ったデータを用いて、ARMA モデルを推定する。
例
いくつかのよく知られていた特殊なケースは、自然に生じたり、他の一般的な予測モデルと数学的に同等であったりする。例えば:
A
R
I
M
A
(
0
,
1
,
0
)
{\displaystyle \mathrm {ARIMA} (0,1,0)}
モデル(または
I
(
1
)
{\displaystyle \mathrm {I} (1)}
モデル)は次の式で与えられ、ランダムウォーク を示す。
X
t
=
X
t
−
1
+
ε
t
{\displaystyle X_{t}=X_{t-1}+\varepsilon _{t}}
定数項を伴う
A
R
I
M
A
(
0
,
1
,
0
)
{\displaystyle \mathrm {ARIMA} (0,1,0)}
モデルは次の式で与えられ、ドリフトを伴うランダムウォークを示す。
X
t
=
c
+
X
t
−
1
+
ε
t
{\displaystyle X_{t}=c+X_{t-1}+\varepsilon _{t}}
A
R
I
M
A
(
0
,
0
,
0
)
{\displaystyle \mathrm {ARIMA} (0,0,0)}
モデルはホワイトノイズ モデルである。
A
R
I
M
A
(
0
,
1
,
2
)
{\displaystyle \mathrm {ARIMA} (0,1,2)}
モデルは、減衰を伴う Holt のモデルである。
定数項のない
A
R
I
M
A
(
0
,
1
,
1
)
{\displaystyle \mathrm {ARIMA} (0,1,1)}
モデルは、基本的な指数平滑化モデルである。 [ 9]
A
R
I
M
A
(
0
,
2
,
2
)
{\displaystyle \mathrm {ARIMA} (0,2,2)}
モデルは次の式で与えられ、加法誤差または二重指数平滑化を使用したHoltの線型法と同等である[ 9] 。
X
t
=
2
X
t
−
1
−
X
t
−
2
+
(
α
+
β
−
2
)
ε
t
−
1
+
(
1
−
α
)
ε
t
−
2
+
ε
t
{\displaystyle X_{t}=2X_{t-1}-X_{t-2}+(\alpha +\beta -2)\varepsilon _{t-1}+(1-\alpha )\varepsilon _{t-2}+\varepsilon _{t}}
次数の選択
次数p およびq は、サンプル自己相関関数(ACF)、偏自己相関関数(PACF)、拡張自己相関関数(EACF)法を用いて決定することができる[ 10] 。
その他の代替法として、AIC、BICなどがある[ 10] 。非季節性ARIMAモデルの次数を決定するためには赤池情報量規準 (AIC)が有用である。AICは次のように書かれる。
AIC
=
−
2
log
(
L
)
+
2
(
p
+
q
+
k
)
,
{\displaystyle {\text{AIC}}=-2\log(L)+2(p+q+k),}
ここで、L はデータの尤度、p は自己回帰モデル 部分の次数、q は移動平均モデル 部分の次数であり、k' はARIMAモデルの切片を表す。AICでは k = 1の場合はARIMAモデルに切片があり( c ≠ 0)、 k = 0 の場合はARIMAモデルに切片がない( c = 0)ことになる。
ARIMAモデルの補正AICは、次のように書くことができる。
AICc
=
AIC
+
2
(
p
+
q
+
k
)
(
p
+
q
+
k
+
1
)
T
−
p
−
q
−
k
−
1
.
{\displaystyle {\text{AICc}}={\text{AIC}}+{\frac {2(p+q+k)(p+q+k+1)}{T-p-q-k-1}}.}
ベイズ情報量規準 (BIC)は、次のように書くことができる。
BIC
=
AIC
+
(
(
log
T
)
−
2
)
(
p
+
q
+
k
)
.
{\displaystyle {\text{BIC}}={\text{AIC}}+((\log T)-2)(p+q+k).}
目標は、良いモデルのAIC、AICc、BICの値を最小化することである。調査するモデルの範囲でこれらの基準の一つの値が低ければ低いほど、そのモデルはデータに適している。AICとBICは 2つのまったく異なる目的で使用される。AICがモデルを現実の状況に近づけようとするのに対し、BICは完全な適合性をみつけようとする。BICのアプローチは、現実の複雑なデータに完璧にフィットすることはないと批判されることが多いが、AICに比べてパラメータが多いことでモデルに大きなペナルティを与えるため、選択のための有効な手法であることに変わりはない。
AICcは、差分の次数が等しいARIMAモデルの比較にのみ使用できる。差分の次数が異なるARIMAモデルについては、RMSE をモデルの比較に使用することができる。
係数の推定
ARIMAモデルを使用した予測
ARIMAモデルは、2つのモデルの「カスケード」と見なすことができる。1つ目は非定常である:
Y
t
=
(
1
−
L
)
d
X
t
{\displaystyle Y_{t}=(1-L)^{d}X_{t}}
2番目は広義の定常 である:
(
1
−
∑
i
=
1
p
φ
i
L
i
)
Y
t
=
(
1
+
∑
i
=
1
q
θ
i
L
i
)
ε
t
.
{\displaystyle \left(1-\sum _{i=1}^{p}\varphi _{i}L^{i}\right)Y_{t}=\left(1+\sum _{i=1}^{q}\theta _{i}L^{i}\right)\varepsilon _{t}\,.}
こうして、プロセスYtを自己回帰予測法の一般化を用いて予測することができる。
予測区間
ARIMAモデルの予測区間(予測の信頼区間 )は、残差が無相関で正規分布しているという仮定に基づいている。これらの仮定のいずれかが当てはまらない場合、予測間隔が正しくない可能性がある。このため、研究者は予測区間を作成する前に、過程をチェックするために残差のACFとヒストグラムをプロットする。
95%の予測区間は
y
^
T
+
h
∣
T
±
1.96
v
T
+
h
∣
T
{\displaystyle {\hat {y}}_{T+h\,\mid \,T}\pm 1.96{\sqrt {v_{T+h\,\mid \,T}}}}
ここで、
v
T
+
h
∣
T
{\displaystyle v_{T+h\mid T}}
は
y
T
+
h
∣
y
1
,
…
,
y
T
{\displaystyle y_{T+h}\mid y_{1},\dots ,y_{T}}
の分散である
h
=
1
,
v
T
+
h
∣
T
=
σ
^
2
{\displaystyle h=1,\,v_{T+h\,\mid \,T}={\hat {\sigma }}^{2}}
のとき、パラメータや次数に関係なく、すべてのARIMAモデルに適用される。対して。
A
R
I
M
A
(
0
,
0
,
q
)
{\displaystyle \mathrm {ARIMA} (0,0,q)}
の場合、
y
t
=
e
t
+
∑
i
=
1
q
θ
i
e
t
−
i
.
{\displaystyle y_{t}=e_{t}+\sum _{i=1}^{q}\theta _{i}e_{t-i}.}
v
T
+
h
∣
T
=
σ
^
2
[
1
+
∑
i
=
1
h
−
1
θ
i
e
t
−
i
]
,
for
h
=
2
,
3
,
…
{\displaystyle v_{T+h\,\mid \,T}={\hat {\sigma }}^{2}\left[1+\sum _{i=1}^{h-1}\theta _{i}e_{t-i}\right],{\text{ for }}h=2,3,\ldots }
[要出典 ] [要出典 ]
一般に、ARIMAモデルからの予測区間は、予測期間が長くなるにつれて広がる。
バリエーションと拡張
ARIMAモデルにはいくつかのバリエーションがある。複数の時系列を使用する場合は
X
t
{\displaystyle X_{t}}
をベクトルと考えることができ、VARIMAモデルが適切な場合がある。モデルに季節効果が疑われるときは、モデルのARやMAの次数を増やすよりも、SARIMA(季節ARIMA)モデルを使用する方が一般的には良いと考えられる[ 11] 。時系列が長距離依存性を示すと疑われる場合、フラクショナルARIMA(FARIMAまたはARFIMA)モデルとも呼ばれる自己回帰フラクショナル和分移動平均モデルでは、d パラメーターに非整数値を持たせることができる。
ソフトウェアの実装
ARIMAモデルに適切なパラメータを見つけるため、Box-Jenkinsパラメータ最適化のような方法論を適用する様々なパッケージがある。
関連項目
脚注
出典
^ For further information on Stationarity and Differencing see https://www.otexts.org/fpp/8/1
^ a b Hyndman, Rob J; Athanasopoulos, George. 8.9 Seasonal ARIMA models . oTexts. https://www.otexts.org/fpp/8/9 2015年5月19日閲覧。
^ Triacca (2021年2月19日). “The Wold Decomposition Theorem ”. 2021年8月4日閲覧。
^ Hamilton, James (1994). Time Series Analysis . Princeton University Press. ISBN 9780691042893
^ Papoulis, Athanasios (2002). Probability, Random Variables, and Stochastic processes . Tata McGraw-Hill Education
^ a b c Wang, Shixiong; Li, Chongshou (18 December 2019). "Why Are the ARIMA and SARIMA not Sufficient". arXiv :1904.07632 [stat.AP ]。
^ Box, George E. P. (2015). Time Series Analysis: Forecasting and Control . WILEY. ISBN 978-1-118-67502-1
^ “Notation for ARIMA Models ”. Time Series Forecasting System . SAS Institute. 2015年5月19日閲覧。
^ a b “Introduction to ARIMA models ”. people.duke.edu . 2016年6月5日閲覧。
^ a b Missouri State University. “Model Specification, Time Series Analysis ”. 2021年8月4日閲覧。
^ Swain, S (2018). “Development of an ARIMA Model for Monthly Rainfall Forecasting over Khordha District, Odisha, India”. Recent Findings in Intelligent Computing Techniques . Advances in Intelligent Systems and Computing. 708 . 325–331). doi :10.1007/978-981-10-8636-6_34 . ISBN 978-981-10-8635-9
^ TimeModels.jl www.github.com
^ ARIMA in NCSS ,
^ Automatic ARMA in NCSS ,
^ Autocorrelations and Partial Autocorrelations in NCSS
^ 8.7 ARIMA modelling in R | OTexts . https://www.otexts.org/fpp/8/7 2016年5月12日閲覧。
^ “Box Jenkins model ”. SAP. 2013年3月8日閲覧。
参考文献
外部リンク