広く使える情報量規準

広く使える情報量規準（ひろくつかえるじようほうりょうきじゅん、英: Widely applicable information criterion、略称: WAIC）または渡辺・赤池情報量基準（Watanabe–Akaike information criterion、WAIC）は、特異的統計モデルに対する赤池情報量基準 (AIC) の一般化版である^[1]。2009年に渡辺澄夫が発表した^[2]。また、広く使えるベイズ情報量規準 (WBIC; Widely applicable Bayesian information criterion) は、特異的統計モデルに対するベイズ情報量規準 (BIC) の一般化版^[3]。2013年に渡辺澄夫が発表した。WBIC は、サンプルサイズが $n$ の時に、逆温度が $1/log n$ の事後分布に対する平均対数尤度関数。

WAICもWBICも真の分布に関する情報無しに数値的に計算できる。

記法

以下では、 $q(x)$ を観測データが従う真の確率分布、観測データ（確率変数）を $X={X i}$ 、確率モデルのパラメータを $w$ 、確率モデルを $p(x|w)$ 、事前分布を $φ(w)$ とする。

また、事後分布による平均を $𝔼 w [・]$ 、真のデータ分布による平均を $𝔼 x [・]$ とする。すなわち、任意の関数 $f(w)$ 、 $g(x)$ に対し：

\mathbb {E} _{w}\left[f(w)\right]={\frac {\int f(w)\prod _{i=1}^{n}p(X_{i}|w)\varphi (w)\mathrm {d} w}{\int \prod _{i=1}^{n}p(X_{i}|w)\varphi (w)\mathrm {d} w}}

,

\mathbb {E} _{x}\left[g(x)\right]=\int g(x)q(x)\mathrm {d} x

とする。また、特にパラメータ $β$ で一般化された事後分布平均を

\mathbb {E} _{w}^{\beta }\left[f(w)\right]={\frac {\int f(w)\prod _{i=1}^{n}p(X_{i}|w)^{\beta }\varphi (w)\mathrm {d} w}{\int \prod _{i=1}^{n}p(X_{i}|w)^{\beta }\varphi (w)\mathrm {d} w}}

と書く。ここで導入されたパラメータ $β$ は統計力学とのアナロジーで逆温度と呼ばれる。

またベイズ推定の文脈で、パラメータ $w$ の事後分布を用いて期待値をとったモデル分布（事後予測分布）を

p^{\ast }(x)=\mathbb {E} _{w}\left[p(x|w)\right]

と書く。

WAIC

定義

\mathrm {WAIC} ={\frac {1}{n}}\sum _{i}(-\log {p^{\ast }(X_{i})})+{\frac {1}{n}}\sum _{i=1}^{n}\left[\mathbb {E} _{w}\left[\log {p(X_{i}|w)^{2}}\right]-\mathbb {E} _{w}\left[\log {p(X_{i}|w)}\right]^{2}\right]

ただし、文献により定義が定数倍違う場合があることに注意。

意味付け

考えている確率モデルの性能を評価するため、観測データから得られた事後予測分布 $p * (x)$ が実際のデータ分布 $q(x)$ にどのくらい近いかを考えたい。そこで、以下で定義される量（汎化誤差）を考える:

G_{n}=\mathbb {E} _{x}\left[-\log p^{\ast }(x)\right]=\int q(x)\left(-\log {p^{\ast }(x)}\right)dx

これは真の分布 $q(x)$ と予測分布 $p * (x)$ との交差エントロピー $H(q||p *)$ である。これは $q(x)$ が $p * (x)$ と等しい時最小値 $H(q)$ をとる（ $H(q)$ は $q(x)$ のエントロピー）。

しかし実際には無限に観測データを手に入れられるわけではないので、真の分布 $q(x)$ の形状を知らない場合には上の積分は評価できない。そこで、真のデータ分布での平均値を求める代わりに、有限の観測データによるサンプル平均を使った経験誤差を考える：

T_{n}={\frac {1}{n}}\sum _{i}(-\log {p^{\ast }(X_{i})})

これは汎化誤差の近似を与える（サンプルサイズが非常に大きい極限で汎化誤差に漸近する）が、有限のサンプルを用いて計算しているため真の汎化誤差の値から系統的に少しずれてしまう。WAICはこの経験誤差と汎化誤差とのズレを汎関数分散

V_{n}=\sum _{i=1}^{n}\left[\mathbb {E} _{w}\left[\log {p(X_{i}|w)^{2}}\right]-\mathbb {E} _{w}\left[\log {p(X_{i}|w)}\right]^{2}\right]

で補正し、有限の観測データしかない場合でも汎化誤差の良い近似値を計算できるようにしたものである。

WBIC

定義

広く使えるベイズ情報量規準 (WBIC) は、逆温度パラメータを $β * = 1 / log n$ とおいたときの一般化事後分布に対する対数尤度の期待値

\mathrm {WBIC} =\mathbb {E} _{w}^{\beta ^{\ast }}\!{\bigl [}-\sum _{i=1}^{n}\log p(X_{i}\mid w){\bigr ]}

として定義される。すなわち「逆温度 $β * = 1 / log n$ でMCMC チェーンを回し、そのチェーン上の対数尤度を平均した量」が WBIC である。

意味付け

ベイズ統計の文脈でモデル同士を比較するのに使われるのがベイズファクターである。ベイズファクターはモデル同士のエビデンス

{\mathcal {E}}=\int \prod _{i=1}^{n}p(X_{i}|w)\varphi (w)dw

の比で与えられる。実用上はこれの対数値を使うのが便利なので、これの負の対数値

{\mathcal {F}}=-\log {\mathcal {E}}

（統計力学とのアナロジーでベイズ自由エネルギーと呼ぶ）を考える。BICは正則モデル（事後分布が正規分布でよく近似できる）についてこれの良い近似（定義によってはその定数倍）を与えるが、WBICは非正則（特異的）なモデルに対しても自由エネルギーの良い近似値を与える。

参考文献

^ Sumio Watanabe (2010). “Asymptotic Equivalence of Bayes Cross Validation and Widely Applicable Information Criterion in Singular Learning Theory”. Journal of Machine Learning Research 11: 3571–3594.
^ 広く使える情報量規準(WAIC)の続き
^ Sumio Watanabe (2013). “A Widely Applicable Bayesian Information Criterion”. Journal of Machine Learning Research 14: 867–897.

外部リンク

渡辺澄夫による解説

広く使える情報量規準(WAIC) 　(リンク切れ？）
広く使えるベイズ情報量規準(WBIC)　(リンク切れ？）

記述統計学

連続データ

位置	平均算術幾何調和中央値分位数順序統計量最頻値階級値
分散	範囲偏差偏差値標準偏差標準誤差変動係数決定係数相関係数自己相関共分散自己共分散分散共分散行列百分率統計的ばらつき
モーメント	分散歪度尖度

カテゴリデータ

推計統計学

パラメトリック	t検定ウェルチのt検定 F検定 Z検定二項検定ジャック–ベラ検定シャピロ–ウィルク検定分散分析共分散分析
ノンパラメトリック	ウィルコクソンの符号順位検定マン・ホイットニーのU検定カイ二乗検定イェイツのカイ二乗検定累積カイ二乗検定フィッシャーの正確確率検定尤度比検定 G検定アンダーソン–ダーリング検定コルモゴロフ–スミルノフ検定カイパー検定マンテル検定コクラン・マンテル・ヘンツェルの統計量
その他	帰無仮説対立仮説有意棄却

区間推定

モデル選択基準

その他

ベイズ統計学

確率	主観確率ベイズ確率事前確率事後確率最大事後確率
その他	ベイズ推定ベイズ因子

相関係数	ピアソンの積率相関係数スピアマンの順位相関係数ケンドールの順位相関係数偏相関係数
その他	自己相関空間的自己相関相互相関交絡変数相関関係と因果関係擬似相関錯誤相関

モデル

線形	リッジ回帰ラッソ回帰エラスティックネット
非線形	k近傍法回帰木ランダムフォレストニューラルネットワークサポートベクター回帰射影追跡回帰
時系列	自己回帰モデル自己回帰移動平均モデル ARCHモデル対移動平均比率法トレンド定常傾向推定共和分構造変化

線形	線形判別分析ロジスティック回帰単純ベイズ分類器単純パーセプトロン線形サポートベクターマシン
二次	二次判別分析
非線形	k近傍法決定木ランダムフォレストニューラルネットワークサポートベクターマシンベイジアンネットワーク隠れマルコフモデル
その他	二項分類多クラス分類第一種過誤と第二種過誤

教師なし学習

クラスタリング	k平均法（k-means++法） DBSCAN
密度推定（英語版）	カーネル密度推定（カーネル）
その他	主成分分析独立成分分析自己組織化写像

生存時間分析

応用

出版物

全般

その他

この項目は、統計学に関連した書きかけの項目です。この項目を加筆・訂正などしてくださる協力者を求めています（プロジェクト:数学／Portal:数学）。

Index: pl ar de en es fr it arz nl ja pt ceb sv uk vi war zh ru af ast az bg zh-min-nan bn be ca cs cy da et el eo eu fa gl ko hi hr id he ka la lv lt hu mk ms min no nn ce uz kk ro simple sk sl sr sh fi ta tt th tg azb tr ur zh-yue hy my ace als am an hyw ban bjn map-bms ba be-tarask bcl bpy bar bs br cv nv eml hif fo fy ga gd gu hak ha hsb io ig ilo ia ie os is jv kn ht ku ckb ky mrj lb lij li lmo mai mg ml zh-classical mr xmf mzn cdo mn nap new ne frr oc mhr or as pa pnb ps pms nds crh qu sa sah sco sq scn si sd szl su sw tl shn te bug vec vo wa wuu yi yo diq bat-smg zu lad kbd ang smn ab roa-rup frp arc gn av ay bh bi bo bxr cbk-zam co za dag ary se pdc dv dsb myv ext fur gv gag inh ki glk gan guw xal haw rw kbp pam csb kw km kv koi kg gom ks gcr lo lbe ltg lez nia ln jbo lg mt mi tw mwl mdf mnw nqo fj nah na nds-nl nrm nov om pi pag pap pfl pcd krc kaa ksh rm rue sm sat sc trv stq nso sn cu so srn kab roa-tara tet tpi to chr tum tk tyv udm ug vep fiu-vro vls wo xh zea ty ak bm ch ny ee ff got iu ik kl mad cr pih ami pwn pnt dz rmy rn sg st tn ss ti din chy ts kcg ve

Prefix: a b c d e f g h i j k l m n o p q r s t u v w x y z 0 1 2 3 4 5 6 7 8 9

Portal di Ensiklopedia Dunia

Portal : Agama

Portal : Bahasa

Portal : Biografi

Portal : Budaya

Portal : Elektronika

Portal : Geografi

Portal : Ilmu

Portal : Masyarakat

Portal : Matematika

Portal : Pendidikan

Portal : Politik

Portal : Sejarah

Portal : Seni

Portal : Teknologi

Kembali kehalaman sebelumnya