De MANOVA of multivariantie-analyse

De MANOVA of multivariantie-analyse De multivariate analysis of variance, meestal afgekort tot MANOVA, is een statistische analysemethode. Net zoals bij de enkelvoudige variantieanayse, de ANOVA, worden er bij de MANOVA twee of meer groepen met elkaar vergeleken. De MANOVA maakt het echter mogelijk om deze groepen op meerdere afhankelijke variabelen tegelijk te vergelijken

Voordelen van de MANOVA

In veel onderzoeken zullen er meerdere variabelen zijn die een rol spelen. Door in een statistische variabele al deze variabelen mee te nemen is het mogelijk om een vollediger beeld te krijgen van de te onderzoeken fenomenen. Omdat het model meer kan verklaren heeft het ook meer power dan wanneer je meerdere separate ANOVA's uit zou voeren. Het is dan ook mogelijk dat er met een MANOVA significante verschillen tussen groepen gevonden worden, die met univariate tests niet naar voren zouden komen.

Een voorbeeld: je wil onderzoek doen naar het verband tussen leeftijd en taalvaardigheid. Je zou dan drie groepen kunnen maken (bijvoorbeeld 12-20 jaar, 21-30 jaar en 31-40 jaar) en ze zowel een toets Engels als een toets Nederlands laten maken. Leeftijd is dan een onafhankelijke variabele in drie categorieën; de scores van de Engelse en Nederlandse toetsen zijn allebei een afhankelijke variabele. Je vergelijkt dan of de scores van zowel de Engelse als de Nederlandse toets per groep verschillend zijn. De MANOVA maakt het mogelijk om al deze variabelen in één model te verwerken.

Een ander voordeel van MANOVA ten opzichte van het uitvoeren van verschillende losse ANOVA's is de beperking van kanskapitalisatie. Bij het uitvoeren van een test bestaat er de kans dat er een significant verschil wordt gevonden tussen groepen terwijl dit in werkelijkheid niet het geval is. Dit wordt de type I-fout genoemd en berust op toeval. In de meeste onderzoeken wordt deze foutmarge zo klein mogelijk gehouden. Bij het uitvoeren van verschillende tests achter elkaar heb je echter steeds weer opnieuw te maken met deze foutmarge: de kans op een type I-fout wordt hierdoor steeds groter. Dit wordt kanskaptalisatie genoemd. Wanneer je een MANOVA uitvoert met alle variabelen in één model heb je ook maar één keer te maken met de type I-fout.

Nadelen van de MANOVA

Hoewel het erg verleidelijk lijkt om zoveel mogelijk variabelen in een MANOVA mee te nemen is dit in de praktijk toch niet aan te raden. Door het toevoegen van variabelen die niet direct relevant zijn bestaat de kans dat de power lager wordt. Dit betekent dat het mogelijk is om geen significante verschillen tussen je groepen te vinden, terwijl deze er in werkelijkheid wel zijn! Het is dus aan te raden om hooguit twee à drie afhankelijke variabelen in je model mee te nemen: dit dienen dan ook variabelen te zijn waarvan je verwacht dat ze van belang zijn en dus relevant voor je onderzoek. Een ander probleem van de MANOVA is dat het, net als de ANOVA, slechts aan kan geven dat er verschil tussen je groepen bestaat: om welke groepen het hierbij gaat en hoe groot dat verschil dan is, is echter niet af te leiden. Om hier achter te komen dien je aanvullende analyses uit te voeren.

Hoe werkt een MANOVA?

De MANOVA is gebaseerd op covarianties: deze parameter geeft aan in hoeverre er een lineair verband bestaat tussen variabelen. Er wordt gekeken in hoeverre de samenhang tussen de afhankelijke variabelen per groep verschilt. Dit in tegenstelling tot de ANOVA, waar met de zogenaamde Sums of Squares wordt gerekend. Het rekenen met lineaire verbanden is een logisch gevolg van het gebruik van meerdere afhankelijke variabelen in het model.

Hypothesen

Als nulhypothese geldt dat het lineaire verband tussen de afhankelijke variabelen voor alle onafhankelijke variabelen hetzelfde is. De alternatieve hypothese geldt dat voor al de afhankelijke variabelen minstens één onafhankelijke variabele afwijkt.

Assumpties

Om een MANOVA te kunnen uitvoeren dient aan een aantal assumpties te worden voldaan. Deze voorwaarden zijn vrijwel dezelfde als voor de ANOVA-procedure geldt: dit omdat de ANOVA en de MANOVA vrijwel op dezelfde manier werken. De MANOVA kent echter nog een extra assumptie ten gevolge van het gebruik van meerdere onafhankelijke variabelen. Wanneer er niet aan de assumpties voldaan wordt is het weliswaar mogelijk om een MANOVA toe te passen; de resultaten die hieruit voortkomen zijn echter niet betrouwbaar en kunnen niet goed geïnterpreteerd worden. Gelukkig is het in veel gevallen mogelijk om hiervoor te corrigeren.

Onafhankelijke metingen

Onafhankelijke metingen zijn belangrijk omdat dit een positief effect heeft op je standaardfout. Wanneer metingen niet onafhankelijk zijn loop je de kans dat je significante verschillen tussen je groepen vindt terwijl die er in werkelijkheid niet zijn.

Deze assumptie heeft niet zozeer te maken met de verdeling van je data, maar voornamelijk met de manier van dataverzameling. Als de data eenmaal verzameld is, is het lastig om nog correcties toe te passen om aan deze assumptie te voldoen. Het is dus belangrijk dat je de assumptie van onafhankelijke metingen bij het vormgeven van je onderzoek al in je achterhoofd houdt!

Multivariate normaliteit van de afhankelijke variabelen

Net zoals de ANOVA vereist de MANOVA ook normaliteit. Multivariate normaliteit is echter een extreem strenge assumptie die ook moeilijk te controleren valt. Het houdt namelijk in dat alle individuele variabelen, maar ook alle lineaire combinaties en daarnaast ook alle combinaties van variabelen gelijk verdeeld zijn.

Het is vrijwel onmogelijk om te controleren of aan al deze voorwaarden voldaan wordt. De beste benadering bereik je door naar de univariate normaliteit en de bivariate normaliteit te bekijken, bijvoorbeeld door middel van een scatterplot. Eventuele niet-normale verdelingen zijn mogelijk bij te stellen door het transformeren van data; echter wordt het model hier ook complexer door. Het verzamelen van meer data kan ook een oplossing zijn, omdat meer data een betere benadering geeft van een normale verdeling. In de praktijk is het meestal echter het makkelijkst om uit te wijken naar een alternatief model waar geen multivariate normaliteit wordt vereist.

Homogeniteit

Binnen elke groep dienen de varianties en covarianties gelijk te zijn. Wanneer dit het geval is kun je ervan uitgaan dat je model optimaal aansluit bij de werkelijkheid. Wanneer de groepen niet gelijk zijn in (co)variantie bestaat de kans dat je model te liberaal of te conservatief is. Dit houdt in dat de kans om je nulhypothese te verwerpen groter of kleiner is dan noodzakelijk.

Software zoals SPSS kent tests om te controleren of aan deze assumptie voldaan wordt, waaronder Box' M-test. Mocht er geen sprake zijn van homogeniteit kan transformatie van je data een oplossing bieden; ook kun je uitwijken naar een ander model waarin deze assumptie niet van belang is.

Lineair verband tussen de onafhankelijke variabelen

Deze assumptie is uniek voor de MANOVA, omdat dit model in tegenstelling tot de ANOVA meerdere afhankelijke variabelen kent. Om een MANOVA uit te kunnen voeren is het belangrijk dat er een lineair verband tussen deze variabelen bestaat. Als dit niet het geval is, dan zijn de variabelen in je model niet optimaal.

Het is makkelijk om te kijken of er een lineair verband bestaat door een visuele weergave te maken in de vorm van bijvoorbeeld een scatterplot. Mocht de assumptie geschonden worden kan je eventueel een transformatie uitvoeren, of de variabele die toch niet goed in het model past verwijderen.

Software

Het toepassen van een MANOVA is complex en brengt veel rekenwerk met zich mee: het is bijna onmogelijk om alles met de hand te doen. Gelukkig bestaat er verschillende software waar deze analyse makkelijk in uitgevoerd kan worden. Zo kent het bekende statistische computerprogramma SPSS een voorgeprogrammeerde functie om een MANOVA uit te kunnen voeren. Ook R is een bekend programma waarmee een MANOVA uitgevoerd kan worden.
© 2016 - 2024 Myrsky, het auteursrecht van dit artikel ligt bij de infoteur. Zonder toestemming is vermenigvuldiging verboden. Per 2021 gaat InfoNu verder als archief, artikelen worden nog maar beperkt geactualiseerd.
Gerelateerde artikelen
De repeated measures ANOVADe repeated measures ANOVABij onderzoeken gebeurt het vaak dat één proefpersoon, of een groep proefpersonen, meerdere metingen ondergaat. Dit is b…
Break-even-analyseBij een onderneming is het handig om te weten hoe je er financieel voor staat. Het is daarbij nodig dat een ondernemer w…
De discriminantie-analyseDe discriminantie-analyseVeel statistiek is gericht op het vergelijken van en het identificeren van verschillen tussen groepen. Discriminantie-an…
De ANOVA of variantie-analyseDe ANOVA of variantie-analyseBinnen de statistiek worden regelmatig groepen met elkaar vergeleken. Wanneer er slechts twee groepen met elkaar worden…

Factoranalyse: de componentenanalyseFactoranalyse: de componentenanalyseFactoranalyse is een parapluterm voor verschillende multivariate analyses, die als doel hebben om meerdere afhankelijke…
Fractalen: definitie, theorie en voorbeeldenFractalen: definitie, theorie en voorbeeldenDe gelijkvormigheid van figuren hebben sinds het begin der tijden al een soort aantrekkingskracht gehad op de mens. Geli…
Bronnen en referenties
  • Inleidingsfoto: Edar, Pixabay
  • Stevens, James P. Applied multivariate statistics for the social sciences. Routledge, 2012.
  • Rijksuniversiteit Groningen. Multivariate Analysis Course. Groningen, 2016.
Myrsky (75 artikelen)
Gepubliceerd: 27-09-2016
Rubriek: Wetenschap
Subrubriek: Wiskunde
Bronnen en referenties: 3
Per 2021 gaat InfoNu verder als archief. Het grote aanbod van artikelen blijft beschikbaar maar er worden geen nieuwe artikelen meer gepubliceerd en nog maar beperkt geactualiseerd, daardoor kunnen artikelen op bepaalde punten verouderd zijn. Reacties plaatsen bij artikelen is niet meer mogelijk.