Jak najít problém se zbytkovým Plot

Ve statistice jsou rezidua jsou rozdíly mezi hodnotami závislé proměnné predikované modelem a hodnotami skutečné závislé proměnné . Běžná regrese předpokládá, že rezidua mají normální rozdělení . Předpokládá také, žerozptyl reziduí je konstantní po úrovních nezávislých proměnných , a že rezidua nejsou ve spojení snezávislou . Jeden způsob, jak kontrolovat poslední dva předpoklady , je podívat se na zbytkové pozemku , který vykresluje nezávislou proměnnou na ose x a zbytky na ose y . Návod
Stránka 1

Podívejte se na změny v šíření rozptylu jako nezávislý zvyšuje variabilní . Podívejte se na zbytky v blízkosti spodního konce osy x , v blízkosti středu osy x a v blízkosti horního konce . Vzdálenost mezi nejvyšším a nejnižším zbytků by mělo být přibližně stejná v celé úrovně nezávislé proměnné . Pokud tomu tak není , budete mít problém, známý jako heteroskedasticita .
2

Podívejte se na zvýšení nebo snížení reziduí jako nezávislé proměnné zvyšuje. Na všech úrovních nezávislé proměnné , by se zbytky , které mají být soustředěný kolem 0. Mělo by být anizvýšení , ani snížení , ani by měla být ve tvaru písmene U vzoru (nízký uprostřed, vysoké na obou koncích ), nebo obráceného písmene U Sublingvální vzor. Děj by měl vypadat jako klubíčko. Pokud tomu tak není , pak máte problém s proměnnými , které jsou v daném modelu.
3

Podívejte se na odlehlých hodnot. Žádná zbytková by měla být mnohem vyšší než ostatní . Je-li jeden bod vyskočí , nebomálo udělat , a to buď mnohem nižší , nebo mnohem vyšší než ostatní , pak ty, může být spojena s odlehlých hodnot. To by mohlo býtzadávání dat chybu , nebo by to mohlo být velmi neobvyklý případ .

Napsat komentář