Смещение вследствие пропущенных переменных (англ. Omitted variable bias) — явление в регрессионном анализе, связанное с получением, смещённых и несостоятельных оценок регрессионных коэффициентов вследствие некорректной спецификации модели, а именно невключения в оцениваемую модель независимых переменных, оказывающих причинно-следственное влияние на зависимую переменную, или невозможности включить в неё некую ненаблюдаемую независимую переменную.
Формальный вывод
Представим, что истинная регрессионная модель выглядит следующим образом:
где
— вектор отклика,
и
— матрица и вектор независимых переменных. При условии, что
и
, то оценки
и
соответственно будут МНК-оценками регрессионной зависимости отклика от независимых переменных. В частности,
(где
— объединённая матрица независимых переменных).
Чтобы смоделировать смещение вследствие пропущенных переменных, опустим предиктор
, включив его в состав нескоррелированной с
части модели:
где
.
Тогда МНК-оценки коэффициентов при предикторах будут несостоятельны в сравнении с истинным коэффициентом
:
Поскольку, согласно допущению изначальной модели,
, то
, тогда как
откуда
.
Литература
- Cameron A. C., Trivedi P. K. Microeconometrics: methods and applications. – Cambridge university press, 2005. — 1034 p. — P. 92-93.
- Wooldridge J. M. Introductory Econometrics: A Modern Approach. – South-Western College Pub, 2002. — 819 p. — P. 87-92, 165-166.