Lineariteit

Uit Methodologiewinkel
Versie door Methodol-fmg (Overleg | bijdragen) op 7 jul 2014 om 15:25 (Hoe uit te voeren in SPSS)

(wijz) ← Oudere versie | Huidige versie (wijz) | Nieuwere versie → (wijz)
Ga naar: navigatie, zoeken

Wat is de aanname van lineariteit en waarvoor heb je deze nodig?

De aanname van lineariteit is geen moeilijk te begrijpen aanname, maar hij is echter wel zeer zeker van belang. De aanname van lineariteit gebruik je voor regressie modellen, en houdt in dat de relatie tussen je onafhankelijke variabele(n) en je afhankelijke variabele van een lineaire aard moet zijn. Het betekent simpelweg dat je een rechte lijn zou moeten kunnen trekken door een scatterplot. Andere mogelijke verbanden tussen onafhankelijke en afhankelijke variabelen zijn bijvoorbeeld een exponentieel verband, of een parabolisch verband.

Hieronder zie je links een voorbeeld van een exponentieel verband, en rechts een parabolisch verband.

Insomnia2.pngInsomniapara.png

Wanneer de data zich als bijvoorbeeld één van bovenstaande grafieken gedraagt, zijn de schattingen van een regressiemodel niet meer betrouwbaar. Onderstaand grafiek toont wel een lineair verband aan tussen insomnia en depressie: hoe hoger de score op insomnia, hoe hoger de score op depressie, en de afstand tussen twee punten op de x-as zorgt steeds voor een evengrote verandering in de afhankelijke variabele.

Lijn2.png

Nota bene: bovenstaande verbanden zijn slechts theoretisch van aard en zeggen niets over het werkelijke verband tussen insomnia en depressie. Ook zijn deze plaatjes zeer geidealiseerd: echte data zal nooit zo mooi volgens deze verbanden werken. Deze plaatjes zijn dus puur ter illustratie van het fenomeen lineariteit.

Hoe uit te voeren in SPSS

Wanneer je een Multipele regressie uitvoert in SPSS (Analyze --> Regression --> Linear) kan je bij Plots kiezen voor Produce all partial plots (zie onderstaand plaatje). Je krijgt dan voor alle onafhankelijke variabelen een scatterplot te zien, waaruit je het verband tussen deze variabele en de afhankelijke variabele kan opmaken. Er is dus geen test voor het wel of niet voldaan aan de aanname van lineariteit: het is een kwestie van goed kijken naar plots en hier een weloverwogen beslissing over maken.

Linearity.png

Interpreteren SPSS-output

In je output vind je nu per onafhankelijke variabele 1 scatterplot. Door goed te kijken naar deze plot, kan je opmaken of er een lineair verband bestaat tussen de onafhankelijke en de afhankelijke variabele, of wellicht een andere soort. Onderstaande plot geeft de relatie aan tussen insomnia en depressie uit mijn -gesimuleerde- data.

Linearityplot.png

Als we goed kijken naar deze plot, kunnen we opmerken dat hoe hoger de score van insomnia, hoe hoger de score van depressie (het is dus in ieder geval geen parabolisch verband). Ook zien we niet dat depressie opeens heel veel meer toeneemt dan ervoor; de toename lijkt regelmatig. Je zou er een rechte lijn dor kunnen trekken. We kunnen daarom concluderen dat er in dit geval sprake is van een lineair verband tussen insomnia en depressie.

Rapporteren conclusie

In principe wordt er niet veel gerapporteerd over het voldoen aan de aanname van lineariteit. Als deze aanname echter wordt gebroken, zijn de parameters uit je regressiemodel niet meer betrouwbaar. Een mogelijk alternatief op dat moment is een polynomiale regressie uitvoeren, die niet-lineaire verbanden fitten toestaat.