De repeated measures ANOVA
Bij onderzoeken gebeurt het vaak dat één proefpersoon, of een groep proefpersonen, meerdere metingen ondergaat. Dit is bijvoorbeeld vaak het geval bij het testen van medicatie of bij andere behandelingen. In deze gevallen is het uitvoeren van standaardmethodes zoals ANOVA niet toereikend, en moet er uitgeweken worden naar procedures die specifiek gericht zijn op herhaalde metingen binnen een groep.
Wanneer spreken we van herhaalde metingen?
Er is sprake van herhaalde metingen wanneer er sprake is van tenminste één onafhankelijke variabele die meer dan een keer gemeten wordt. Denk bijvoorbeeld aan een onderzoek naar behandeling van depressie. In dit geval is de score op een psychologische test de afhankelijke variabele. De score van de proefpersonen wordt gemeten; hierna ontvangt de ene helft van de proefpersonen een medicijn; de andere groep krijgt een placebo. Na afloop vindt er een nameting plaats en worden vergelijkingen gemaakt. Merk hierbij op dat een persoon dus meerdere metingen ondergaat.
Waarom geen gewone ANOVA?
De ANOVA ofwel
Analysis
of
Variance, is een veelgebruikte procedure binnen de statistiek om te onderzoeken of er verschillen tussen groepen zijn. In feite is het een soort uitgebreide versie van de veelgebruikte t-procedure; waar bij een t-procedure hooguit twee groepen met elkaar vergeleken kunnen worden, kunnen er met behulp van een ANOVA meerder groepen tegen elkaar afgezet worden. Aangezien er bij herhaalde metingen ook meerdere groepen met elkaar vergeleken worden, zou het voor de hand liggen om hier ook een ANOVA voor te gebruiken.
Toch kan de standaard ANOVA-procedure niet gebruikt worden bij herhaalde metingen. De belangrijkste reden hiervoor is dat deze procedure de assumptie heeft dat alle waarnemingen onafhankelijk moeten zijn. Aangezien er bij herhaalde metingen meerdere metingen bij één en dezelfde proefpersoon (of groep proefpersonen) zijn uitgevoerd, kunnen we hier niet spreken van onafhankelijkheid. Het toch uitvoeren van een standaard procedure leidt tot een vertekening van standaardfouten en is dus niet goed te interpreteren.
Repeated measures ANOVA
Waar een ANOVA een uitgebreide versie is van de standaard t-procedure, kan de repeated measures ANOVA (RM-ANOVA) gezien worden als een uitgebreide variant van de paired t-test.
Ook bij de RM-ANOVA worden de gemiddelden van alle groepen met elkaar vergeleken. De nulhypothese luidt dan ook als volgt: μ1=μ2=...=μk. Merk hierbij wel op dat deze groepen niet onafhankelijk zijn, zoals bij een normale ANOVA wel het geval is!
Between- en within-factors
Een ander groot verschil ten opzichte van de normale ANOVA, is dat er bij de RM-ANOVA niet alleen between-factors, maar ook within-factors worden onderscheiden. Met between-factors worden de factoren bedoeld die de proefpersonen opdelen in groepen; dit kunnen bijvoorbeeld variabelen als geslacht en leeftijd zijn. Met de within-factor wordt een factor bedoeld die één groep ondergaat: in het geval van herhaalde metingen kan dit bijvoorbeeld een bepaalde behandeling zijn, of een voor- en nameting. De within-factor is wel opgenomen in de RM-ANOVA. Omdat er sprake is van één concept dat steeds gemeten wordt (dus één afhankelijke variabele), wordt deze RM-ANOVA ook wel
univariate genoemd.
Zoals eerder gezegd kent een standaard ANOVA eigenlijk alleen between-factors; de overige onverklaarde variantie wordt aangeduid als "error". Bij een RM-ANOVA wordt deze error verkleind, omdat in dit geval een deel van de variantie ook te verklaren is aan de hand van de individuele verschillen bij metingen, oftewel de within-factors. Dit heeft als voordeel dat er uiteindelijk sprake is van een hogere power bij deze procedure, en dat er dus ook minder proefpersonen gebruikt hoeven te worden voor eenzelfde resultaat. Er kleven echter ook wat nadelen bij het onderscheiden van within-factors: zo is het moeilijk om rekening te houden met bijvoorbeeld leereffecten die al snel bij proefpersonen kunnen optreden. Daarnaast resulteert het uiteraard ook in een ingewikkelder model en assumpties waar moeilijker aan voldaan wordt.
Assumpties bij (univariate) RM-ANOVA
De assumpties van de RM-ANOVA zijn nagenoeg hetzelfde als de assumpties bij een normale ANOVA. Echter kent de RM-ANOVA nog twee extra eisen.
Allereerst is er de assumptie van
multivariate normaliteit. Hiermee wordt bedoeld dat elke meting die gedaan moet worden, normaal verdeeld moet zijn. Daarnaast is ook
compound symmetry vereist: dit houdt in dat zowel de varianties als de covarianties van alle metingen hetzelfde zijn.
De assumptie van compound symmetry is een erg strenge assumptie, en in de praktijk voldoet bijna geen enkele meting hieraan. Gelukkig bestaat er een goedwerkend alternatief voor compound symmetry:
sfericiteit. Sfericiteit is de gelijkheid van varianties van de verschilscores tussen alle metingen. Dit is met de hand uit te rekenen, of te toetsen met een test zoals de Mauchly's Test. Wanneer er aan de eis van compound symmetry wordt voldaan, is er ook automatisch sprake van sfericiteit; andersom is dit niet het geval.
Als er ook niet aan de assumptie van sfericiteit wordt voldaan, kun je een (univariate) RM-ANOVA niet goed interpreteren: de type I-fout is toegenomen. In dit geval kun je ervoor kiezen om alsnog een univariate RM-ANOVA uit te voeren en een correctie toe te passen voor deze vertekening in type I-fout. Bekende correcties zijn die van Huyn-Feldt en de Greenhouse-Geisser.
Een andere mogelijkheid is om geen univariate test uit te voeren, maar een multivariate.
RM-MANOVA
Waar een univariate model ervan uitgaat dat er sprake is van meerdere metingen van een en dezelfde onafhankelijke variabele, gaat een multivariate model ervan uit dat er meerdere verschillende variabelen zijn waar niet per se een relatie tussen bestaat. Hierdoor hoeft ook niet aan de assumptie van compound symmetry of sfericiteit te hoeven voldaan. Het gebruik van een RM-MANOVA is dan ook een goede oplossing wanneer een RM-ANOVA geen optie is.
De univariate manier heeft echter meer vrijheidsgraden, en dus ook een betere power. Wanneer het mogelijk is, verdient een univariate model dan ook de voorkeur.