Liniowy model prawdopodobieństwa

Liniowy model prawdopodobieństwa to model regresji zastosowany dla binarnej zmiennej zależnej- jest to jeden ze standardowych i najprostszych modeli, pozwalających szacować prawdopodobieństwo wystąpienia określonego zdarzenia. W postaci teoretycznej przyjmuje on postać:

zaś w postaci uogólnionej (zapis macierzowy):

 

Jak wspomniano, liniowy model prawdopodobieństwa to model regresji liniowej - zmienną objaśnianą jest w nim zmienna dwumianowa y, przy czym jej wartość oczekiwaną stanowi prawdopodobieństwo zajścia rozpatrywanego zdarzenia p = P(y=1). (1

Model ten można szacować metodą najmniejszych kwadratów, pamiętać należy jednakże, że nie zostaną spełnione w tym modelu klasyczne warunki stosowalności MNK.

 

Kluczowe wady i ograniczenia modelu
Podstawową wadą modeli liniowego prawdopodobieństwa jest możliwość wykroczenia zmiennej zależnej poza wartości z przedziału <0; 1>. W takim przypadku interpretacja wyników prognoz jest utrudniona.

Poza wykraczaniem realizacji prognoz poza granice <0, 1> kilka założeń modelu linowego zostaje naruszonych. Podstawowe ograniczenia stosowania modelu liniowego dla zmiennej zależnej binarnej(1:

- heteroskedastyczność;
W związku z heteroskedastycznością liniowego modelu prawdopodobieństwa estymator oszacowany za pomocą metody najmniejszych kwadratów jest nieefektywny. Błędy szacunku są obciążone, dające w rezultacie błędne wyniki statystyki testowej. Oszacowania linowego modelu prawdopodobieństwa mogą zostać skorygowane za pomocą uogólnionej metody najmniejszych kwadratów.

- normalność rozkładu reszt;
Warunek normalności rozkładu reszt modelu liniowego prawdopodobieństwa nie jest spełniony. Realizacje zmiennej objaśnianej y przyjmują tylko dwie alternatywne wartości 0 lub 1. Reszty modelu zatem nie będą miały rozkłady zgodnego z normalnym. Wartości reszt ui będą dodatnie dla y=1 oraz ujemne dla y=0.

- bezsensowne prognozy, wykraczające poza granice interpretacji;

 

A zatem:
Założenie linowego przyrostu prawdopodobieństwa wydaje się być w praktyce badań ekonomicznych niemożliwe do zastosowania.

 

1. Marek Gruszczyński, „Mikroekonometria: Modele i metody analizy danych indywidualnych”, Wolters Kluwer Business, Warszawa 2012, s. 76

2. Oparto na J.Scott Long “Regression models for categorical and limited dependent variables”. Sage publications Inc. 1997. str. 38-40.

DM Soft