Homoskedasticiteit

Uit Methodologiewinkel
Ga naar: navigatie, zoeken

Wat is de aanname van Homoskedastisticiteit?

De aanname van homoskedasticiteit - een aanname voor regressie - houdt in dat wordt aangenomen dat de residuals dezelfde variantie hebben op elk niveau van de voorspeller. Een voorbeeld: Je hebt een regressielijn getrokken door een scatterplot. De afstand tussen de individuele observaties (de stippen in je plot) en de lijn is de residual: zoveel wijkt deze waarde af van de voorspelde waarde. Er is aan de assumptie van homoskedasticiteit voldaan op het moment dat die residuals op elk level van de voorspeller (op de x-as) een gelijke variantie hebben (dus gemiddeld dezelfde afstand tot de regressielijn). Wanneer dit niet het geval is, (bijvoorbeeld omdat bij het ene niveau van de predictor de waardes er ver onder en boven liggen, terwijl bij het andere niveau van de predictor ze netjes bij de regressielijn liggen) is er sprake van heteroskedasticiteit.

Waarvoor gebruik je dit?

Als je slechts geïnteresseerd bent in het schatten van de parameters in een regressiemodel (het intercept, de richtingscoëfficientent etc), dan is het niet een groot probleem op het moment dat er niet wordt voldaan aan de aanname van homoscedasticiteit. Heteroscedasticiteit heeft echter wel een grote invloed op de standaard error en daarmee dus ook op de betrouwbaarheidsintervallen en de significantietoetsen van je parameters. Deze zijn op het moment dat deze aanname wordt geschonden niet meer betrouwbaar.

Hoe uit te voeren in SPSS?

Zoals eerder vermeld, is homoscedasticiteit een aanname van regressie. Een regressie kan worden uitgevoerd door via het hoofdmenu naar Analyze --> Regression --> Linear te gaan.

Vervolgens voer je je onafhankelijke en afhankelijke variabelen in, en klik je op Plots

Deelonderwerp

. De plot die je sowieso nodig hebt om homoscedasticiteit te checken is de plot met ZPRED op de x-as en ZRESID op de y-as. Ook kan je een plot toevoegen met SRESID op de y-as en ZPRED op de x-as; deze geeft ook informatie over eventuele homo-/heteroscedasticiteit.

Screenshot2.png

Interpreteren SPSS-output

De meest belangrijke plot die je nodig hebt om homoscedasticiteit te checken is die met ZRESID op de y-as en ZPRED op de x-as. Deze zet de z-waardes van de voorspelde waardes af tegen de z-waardes van de residuals. Als de scatterplot niet mooi in een wolk cirkelt, maar afwijkingen vertoont, kan er worden geconcludeerd dat er waarschijnlijk sprake is van heteroscedasticiteit. De onderstaande grafiek is een voorbeeld van een scatterplot met de z-waardes van de voorspelde waardes op de x-as, en de z-waardes van de residuals op de y-as.

Screenshot3.png


Aangezien deze data er niet erg scheef uitziet, kan er in dit geval worden geconcludeerd dat er waarschijnlijk aan de aanname van homoscedasticiteit is voldaan. Dit is dus echter wel een beslissing die je neemt op basis van een plot: er bestaat geen directe toets bestaat die test of er wordt voldaan aan deze verwachting. Het is een kwestie van goed kijken naar de data en daaruit een gefundeerde conclusie trekken.

Rapporteren conclusie

Wanneer er wordt voldaan aan een verwachting kan dat heel kort worden opgeschreven ('Er is voldaan aan de aanname van homoscedasticiteit' ). Wanneer er echter niet wordt voldaan aan deze aanname, wordt er idealiter beargumenteerd waarom het wel of geen probleem zou zijn voor verdere data-analyse. Ben je alleen geïnteresseerd in het schatten van parameters in je model, dan is het niet zo'n probleem als er niet is voldaan aan deze aanname. Mocht je wel geïnteresseerd zijn in significantietesten, dan kunnen eventueel non-parametrische tests worden uitgevoerd.