One-way ANOVA

Uit Methodologiewinkel
Ga naar: navigatie, zoeken

Waar deze test voor wordt gebruikt

De test wordt gebruikt om te toetsen of er verschillen zijn tussen de gemiddelden van meerdere groepen. Een ANOVA kan bijvoorbeeld gebruikt worden als we willen toetsen of er een verschil in IQ (afhankelijke variabele: IQ scores) is tussen vmbo-t, havo en vwo leerlingen (onafhankelijke variabele: groepen leerlingen).

De ANOVA is een omnibus toets en toont dus alleen of er een verschil is, maar niet waar deze precies is. Daarvoor moeten andere toetsen gebruikt worden. Een manier om erachter te komen waar het verschil precies zit is om gebruik te maken van contrasten (planned comparisons). Dit houdt in dat er voor de analyse wordt gevraagd om bepaalde vergelijkingen te maken tussen de verschillende groepen (gebaseerd op vooraf opgestelde hypothesen). Een andere optie is om een post hoc test te doen, hierbij heb je geen verwachtingen over de uitkomst en worden alle mogelijke contrasten vergeleken.

Assumpties

1. Normaal Verdeeld – De afhankelijke variabele moet voor iedere groep normaal verdeeld moeten zijn, zie Normaliteit.

2. Niveau van de variabelen - De onafhankelijke variabelen zijn op categorisch niveau en de afhankelijke variabelen zijn continu of op interval niveau.

3. Homogeniteit van Varianties - De variantie van de afhankelijke variabele moet voor iedere groep ruwweg hetzelfde zijn.

4. Onafhankelijkheid - De scores zijn onafhankelijk, zie Onafhankelijkheid.


De ANOVA wordt gezien als een robuuste test. Dit houdt in dat ook in het geval dat een deel van de assumpties wordt geschonden het resultaat nog steeds interpreteerbaar is.


Wat te doen als je niet aan je assumptie(s) voldoet?

Wanneer er niet wordt voldaan aan de aanname van normaliteit kan de One-way ANOVA nog steeds worden uitgevoerd omdat de F-test robuust is.

Anders kan de non-parametrische variant worden uitgevoerd: de Kruskal-Wallis test.

Hoe uit te voeren in SPSS

Klik op Analyze > Compare Means > One-Way ANOVA

ANOVA.png

1. Variabelen Invoeren

Vervolgens voer je bij "Dependent List" de afhankelijke variabele (IQscore) in.

Bij "Fixed Factor" voeren we nu de onafhankelijke variabele (niveau = groepen leerlingen) in.


2. Vervolg Analyses

Doordat ANOVA een omnibus test is weten we, op het moment dat we een significant effect vinden, nog niet waar dit significante effect zit. Daarom voeren we nog andere toetsen uit. Als we specifieke hypotheses hebben vergelijken we specifieke groepen met elkaar en maken we gebruik van contrasten (zie 2.1 hieronder). Als we geen specifieke hypotheses hebben vergelijken we alle groepen met elkaar middels post-hoc analyse (zie 2.2 hieronder).

Merk op dat je normaal dus óf contrast analyse uitvoert óf een post-hoc analyse maar niet allebei.


2.1. Contrasten

Contrasten gebruiken we dus alleen als we specifieke hypotheses hebben over welke groepen van elkaar zullen verschillen.

Anovacontrast.png

Omdat we maar één afhankelijke variabele hebben vinken we "Polynomial" aan. Vervolgens specificeren we de contrasten. Hierbij kennen we aan elke groep een cijfer toe om aan te geven of we deze wel of niet willen vergelijken. Let op: het totaal moet altijd 0 zijn.

Bijvoorbeeld: 1 0 -1

Dit contrast geeft aan dat we de eerste groep willen vergelijken met de laatste groep en dat we de tweede groep buiten beschouwing laten. Klik vervolgens op "next" om een nieuw contrast toe te voegen.


2.2. Post-Hoc Analyses

Als we geen specifieke hypotheses hebben over welke groepen van elkaar zullen verschillen willen we exploratief alle groepen met elkaar vergelijken. Dit doen we middels post-hoc analyses. Vink als je post-hoc analyses wilt uitvoeren de volgende opties aan:

Anovaposthoc.png


3. Options

Bij options is het handig om de volgende opties aan te klikken:

Anovaoptions.png


- "Descriptive Statistics": hierdoor krijg je een tabel met gemiddelden en standaard deviaties wat handig is om de resultaten te interpreteren

- "Homogeneity of variance tests": hierdoor krijg je de resultaten van een Levene's test om de aanname van gelijke (homogene) varianties te testen, zie Assumpties hierboven.

- "Welch" en "Brown-Forsythe": er zijn twee alternatieve F-ratios voor het geval dat de aanname van homogene varianties geschonden is. Dus wanneer deze assumptie geschonden is kunnen we deze F-ratios interpreteren.


Interpreteren SPSS-output

De output bestaat (wanneer uitgevoerd zoals hierboven beschreven) uit verschillende tabellen.

1. Descriptive Statistics

Wanneer je onder "Options" hebt aangegeven dat je "Descriptive Statistics" wilt krijg je de volgende tabel. Hierin staat het gemiddelde, de bijbehorende standaard deviatie en het aantal proefpersonen voor elke groep. Ook wordt het 95%-betrouwbaarheidsinterval voor het gemiddelde, en de totale range (minimum en maximum) gegeven. We kunnen bijvoorbeeld zien dat er 10 deelnemers zijn met VMBO-t richting, die een een IQ hebben van 97.5 gemiddeld met een standaarddeviatie van 8.90.

Anovadescriptives.png

2. Levene's test

De Levene's test wordt gebruikt om de assumptie van gelijke (homogene) varianties te testen. In ons geval is de Levene's test significant (p = .027) waardoor de assumptie van gelijke varianties is geschonden. Doordat er ook een aangepaste F-ratio wordt gegeven door SPSS kunnen we toch de output interpreteren.

Anovalevenes.png

3. ANOVA

In de ANOVA tabel staan de resultaten van de toets. Deze is opgedeeld in een 'between-group' effect en een 'within-group' effect. Wij zijn hierbij geïnteresseerd in het 'between-group' effect. Dit geeft namelijk aan of er een verschil is tussen de verschillende groepen (bij Sig.).

In ons voorbeeld blijkt dat de groepen significant verschillen (p < .001)

Anova.png

Maar let op: uit de Levene's test bleek dat de varianties niet gelijk waren in alle groepen. Daarom moeten we de Welch of de Brown-Forsythe interpreteren. Ook volgens de Welch en de Brown-Forsythe blijken de groepen significant te verschillen (p = .002 en p < .001 respectievelijk)

Anovarobuust.png

4. Contrasten

Bij de resultaten van de contrasten worden twee tabellen gegeven. In de eerste tabel staat de contrasten die we hebben gespecificeerd. In ons geval vergelijken we bij het eerste contrast de IQ scores van VMBO-t leerlingen met die van de HAVO leerlingen. In het tweede contrast vergelijken we de IQ scores van de HAVO leerlingen met die van de VWO leerlingen. In de tweede tabel staat of de contrasten significant zijn. Let hierbij op welke resultaten je interpreteert. In de eerste twee regels staan de resultaten wanneer is voldaan aan de assumptie van gelijke varianties, terwijl in de onderste twee regels de resultaten staan weergegeven wanneer deze assumptie geschonden is. In ons geval moeten we dus kijken bij "Does not assume equal variances". Beide contrasten blijken significant te zijn. Dus: de IQ scores van VMBO-t leerlingen verschilt van die van HAVO leerlingen (p = .039) en de IQ scores van HAVO leerlingen verschilt van die van VWO leerlingen (p = .007).

Anovacontrastsresults.png

5. Post-Hoc

Bij de post-hoc analyses worden alle groepen met elkaar vergelijken. De tabel laat zien wat het verschil is in afhankelijke variabele tussen de twee groepen en of dat verschil significant is. Ook wordt het 95%-betrouwbaarheidsinterval gegeven.

Anovaposthocresults.png

Uit de tabel blijkt dat er geen significant verschil (p = .257) is in IQ score tussen VMBO-t leerlingen en HAVO leerlingen. Er blijkt een significant verschil (p < .001) te zijn in IQ score tussen VMBO-t leerlingen en VWO leerlingen. Er blijkt ook een significant verschil (p = .005) in IQ score tussen HAVO leerlingen en VWO leerlingen.

Let op: bij de contrasten worden er andere significantie waarden gevonden dan bij de post-hoc analyses. Dit komt doordat er bij de post-hoc analyses meerdere vergelijkingen worden uitgevoerd. Daar moet voor worden gecorrigeerd om zo een verhoogde kans op een Type-1 fout tegen te gaan. Op het moment dat je specifieke hypotheses hebt, is het dus verstandig om een contrastanalyse uit te voeren omdat de kans om een verschil aan te tonen als dit verschil er ook echt is groter is (de power is groter bij contrastanalyse, zie Power analysis).

Rapporteren conclusie

Een ANOVA liet zien dat er een significant verschil is in IQ scores tussen leerlingen van verschillende opleidingen, F(2, 18.075) = 13.35, p < .001.

Let op: dat het aantal vrijheidsgraden geen heel getal is komt doordat we een correctie hebben uitgevoerd omdat de assumptie van gelijke varianties was geschonden.

In geval dat je contrasten hebt gespecificeerd noem je dat "contrasten hebben aangetoond dat ...": Contrasten toonden aan dat het IQ van VMBO-t leerlingen lager was (M = 97.5, SD = 8.90) dan het IQ van HAVO leerlingen (M = 105.1 , SD = 5.93), t(15.68) = -2.25, p = .039. Daarnaast bleek dat het IQ van HAVO leerlingen lager was (M = 105.1 , SD = 5.93) dan het IQ van VWO leerlingen (M = 121.3, SD = 14.76), t(11.84) = - 3. 22, p = .007.

In het geval dat je post-hoc analyses hebt uitgevoerd rapporteer je opdezelfde manier, maar geef je aan dat post-hoc analyses dit hebben aangetoond (voor een voorbeeld zie Factorial ANOVA).

Non-parametrische variant

Voor de non-parametrische variantie zie: Kruskal-Wallis Test