De MANOVA of multivariantie-analyse
De multivariate analysis of variance, meestal afgekort tot MANOVA, is een statistische analysemethode. Net zoals bij de enkelvoudige variantieanayse, de ANOVA, worden er bij de MANOVA twee of meer groepen met elkaar vergeleken. De MANOVA maakt het echter mogelijk om deze groepen op meerdere afhankelijke variabelen tegelijk te vergelijken
Voordelen van de MANOVA
In veel onderzoeken zullen er meerdere variabelen zijn die een rol spelen. Door in een statistische variabele al deze variabelen mee te nemen is het mogelijk om een vollediger beeld te krijgen van de te onderzoeken fenomenen. Omdat het model meer kan verklaren heeft het ook meer power dan wanneer je meerdere separate ANOVA's uit zou voeren. Het is dan ook mogelijk dat er met een MANOVA significante verschillen tussen groepen gevonden worden, die met univariate tests niet naar voren zouden komen.
Een voorbeeld: je wil onderzoek doen naar het verband tussen leeftijd en taalvaardigheid. Je zou dan drie groepen kunnen maken (bijvoorbeeld 12-20 jaar, 21-30 jaar en 31-40 jaar) en ze zowel een toets Engels als een toets Nederlands laten maken. Leeftijd is dan een onafhankelijke variabele in drie categorieën; de scores van de Engelse en Nederlandse toetsen zijn allebei een afhankelijke variabele. Je vergelijkt dan of de scores van zowel de Engelse als de Nederlandse toets per groep verschillend zijn. De MANOVA maakt het mogelijk om al deze variabelen in één model te verwerken.
Een ander voordeel van MANOVA ten opzichte van het uitvoeren van verschillende losse ANOVA's is de beperking van kanskapitalisatie. Bij het uitvoeren van een test bestaat er de kans dat er een significant verschil wordt gevonden tussen groepen terwijl dit in werkelijkheid niet het geval is. Dit wordt de type I-fout genoemd en berust op toeval. In de meeste onderzoeken wordt deze foutmarge zo klein mogelijk gehouden. Bij het uitvoeren van verschillende tests achter elkaar heb je echter steeds weer opnieuw te maken met deze foutmarge: de kans op een type I-fout wordt hierdoor steeds groter. Dit wordt kanskaptalisatie genoemd. Wanneer je een MANOVA uitvoert met alle variabelen in één model heb je ook maar één keer te maken met de type I-fout.
Nadelen van de MANOVA
Hoewel het erg verleidelijk lijkt om zoveel mogelijk variabelen in een MANOVA mee te nemen is dit in de praktijk toch niet aan te raden. Door het toevoegen van variabelen die niet direct relevant zijn bestaat de kans dat de power lager wordt. Dit betekent dat het mogelijk is om geen significante verschillen tussen je groepen te vinden, terwijl deze er in werkelijkheid wel zijn! Het is dus aan te raden om hooguit twee à drie afhankelijke variabelen in je model mee te nemen: dit dienen dan ook variabelen te zijn waarvan je verwacht dat ze van belang zijn en dus relevant voor je onderzoek. Een ander probleem van de MANOVA is dat het, net als de ANOVA, slechts aan kan geven dat er verschil tussen je groepen bestaat: om welke groepen het hierbij gaat en hoe groot dat verschil dan is, is echter niet af te leiden. Om hier achter te komen dien je aanvullende analyses uit te voeren.
Hoe werkt een MANOVA?
De MANOVA is gebaseerd op covarianties: deze parameter geeft aan in hoeverre er een lineair verband bestaat tussen variabelen. Er wordt gekeken in hoeverre de samenhang tussen de afhankelijke variabelen per groep verschilt. Dit in tegenstelling tot de ANOVA, waar met de zogenaamde Sums of Squares wordt gerekend. Het rekenen met lineaire verbanden is een logisch gevolg van het gebruik van meerdere afhankelijke variabelen in het model.
Hypothesen
Als nulhypothese geldt dat het lineaire verband tussen de afhankelijke variabelen voor alle onafhankelijke variabelen hetzelfde is. De alternatieve hypothese geldt dat voor al de afhankelijke variabelen minstens één onafhankelijke variabele afwijkt.
Assumpties
Om een MANOVA te kunnen uitvoeren dient aan een aantal assumpties te worden voldaan. Deze voorwaarden zijn vrijwel dezelfde als voor de ANOVA-procedure geldt: dit omdat de ANOVA en de MANOVA vrijwel op dezelfde manier werken. De MANOVA kent echter nog een extra assumptie ten gevolge van het gebruik van meerdere onafhankelijke variabelen. Wanneer er niet aan de assumpties voldaan wordt is het weliswaar mogelijk om een MANOVA toe te passen; de resultaten die hieruit voortkomen zijn echter niet betrouwbaar en kunnen niet goed geïnterpreteerd worden. Gelukkig is het in veel gevallen mogelijk om hiervoor te corrigeren.
Onafhankelijke metingen
Onafhankelijke metingen zijn belangrijk omdat dit een positief effect heeft op je standaardfout. Wanneer metingen niet onafhankelijk zijn loop je de kans dat je significante verschillen tussen je groepen vindt terwijl die er in werkelijkheid niet zijn.
Deze assumptie heeft niet zozeer te maken met de verdeling van je data, maar voornamelijk met de manier van dataverzameling. Als de data eenmaal verzameld is, is het lastig om nog correcties toe te passen om aan deze assumptie te voldoen. Het is dus belangrijk dat je de assumptie van onafhankelijke metingen bij het vormgeven van je onderzoek al in je achterhoofd houdt!
Multivariate normaliteit van de afhankelijke variabelen
Net zoals de ANOVA vereist de MANOVA ook normaliteit. Multivariate normaliteit is echter een extreem strenge assumptie die ook moeilijk te controleren valt. Het houdt namelijk in dat alle individuele variabelen, maar ook alle lineaire combinaties en daarnaast ook alle combinaties van variabelen gelijk verdeeld zijn.
Het is vrijwel onmogelijk om te controleren of aan al deze voorwaarden voldaan wordt. De beste benadering bereik je door naar de univariate normaliteit en de bivariate normaliteit te bekijken, bijvoorbeeld door middel van een scatterplot. Eventuele niet-normale verdelingen zijn mogelijk bij te stellen door het transformeren van data; echter wordt het model hier ook complexer door. Het verzamelen van meer data kan ook een oplossing zijn, omdat meer data een betere benadering geeft van een normale verdeling. In de praktijk is het meestal echter het makkelijkst om uit te wijken naar een alternatief model waar geen multivariate normaliteit wordt vereist.
Homogeniteit
Binnen elke groep dienen de varianties en covarianties gelijk te zijn. Wanneer dit het geval is kun je ervan uitgaan dat je model optimaal aansluit bij de werkelijkheid. Wanneer de groepen niet gelijk zijn in (co)variantie bestaat de kans dat je model te liberaal of te conservatief is. Dit houdt in dat de kans om je nulhypothese te verwerpen groter of kleiner is dan noodzakelijk.
Software zoals SPSS kent tests om te controleren of aan deze assumptie voldaan wordt, waaronder Box' M-test. Mocht er geen sprake zijn van homogeniteit kan transformatie van je data een oplossing bieden; ook kun je uitwijken naar een ander model waarin deze assumptie niet van belang is.
Lineair verband tussen de onafhankelijke variabelen
Deze assumptie is uniek voor de MANOVA, omdat dit model in tegenstelling tot de ANOVA meerdere afhankelijke variabelen kent. Om een MANOVA uit te kunnen voeren is het belangrijk dat er een lineair verband tussen deze variabelen bestaat. Als dit niet het geval is, dan zijn de variabelen in je model niet optimaal.
Het is makkelijk om te kijken of er een lineair verband bestaat door een visuele weergave te maken in de vorm van bijvoorbeeld een scatterplot. Mocht de assumptie geschonden worden kan je eventueel een transformatie uitvoeren, of de variabele die toch niet goed in het model past verwijderen.
Software
Het toepassen van een MANOVA is complex en brengt veel rekenwerk met zich mee: het is bijna onmogelijk om alles met de hand te doen. Gelukkig bestaat er verschillende software waar deze analyse makkelijk in uitgevoerd kan worden. Zo kent het bekende statistische computerprogramma SPSS een voorgeprogrammeerde functie om een MANOVA uit te kunnen voeren. Ook R is een bekend programma waarmee een MANOVA uitgevoerd kan worden.