Wat is een t-toets? Beter uw enquêteresultaten vergelijken

Wat zijn t-toetsen? Een gids voor het analyseren van enquêteresultaten

Lees hoe u statistisch significante verschillen in groepsgemiddelden, enquêteresultaten en A/B-testresultaten herkent met een eenvoudige t-toets.

Aan de slag

vrouw die aan grafieken van t-toetsen werkt

Iedereen kan wel het verschil zien tussen twee getallen. Maar het is lastiger om te achterhalen of dit verschil statistisch significant is.

Stel u hebt op het werk een klanttevredenheidsenquête afgenomen. Uw leidinggevende wil analyseren of mannen uw bedrijf een lagere Net Promoter Score® (NPS) geven dan vrouwen.

In de gegevens ziet u dat de gemiddelde score van mannelijke respondenten een 9 was en die van vrouwen een 12. Hoe weet u of 9 een significant verschil is met 12? Daar komt de t-toets bij om de hoek kijken.

In dit artikel definiëren we t-toetsen en hun toepassingen, geven we voorbeelden en leggen we uit hoe u de resultaten kunt interpreteren.

Wat zijn t-toetsen?

Een t-toets is een statistische test die beoordeelt of het verschil tussen twee gemiddelden significant is op basis van de t-verdeling. Zo ontdekt u of een waargenomen verschil tussen groepen echt bestaat of waarschijnlijk door toeval wordt veroorzaakt.

Het testen op statistische significantie is gebruikelijk bij concepttests en producttests. Bij concepttests worden A/B-tests vaak gebruikt om te bepalen of het ene advertentieconcept beter presteert dan het andere. Producttests werken op vergelijkbare wijze. Hiermee gaat u na of een product zich staande zal houden wanneer het op de markt wordt gebracht.

Formules voor t-toetsen

T-toetsen gebruiken specifieke formules om gemiddelden te vergelijken en te bepalen of een verschil statistisch significant is. De t-toets met twee steekproeven is de meest gebruikelijke optie bij de analyse van enquêtes:

Hier vindt u de formules voor de t-toets met één steekproef en de gecombineerde t-toets:

t-toets met één steekproef en gecombineerde t-toets

Bij zowel de t-toets met één steekproef als de gecombineerde t-toets wordt de berekende t-waarde vergeleken met een kritieke waarde uit de t-verdeling om te bepalen of het verschil significant is.

Waarvoor wordt een t-toets gebruikt?

Gebruik een t-toets wanneer u wilt weten of twee gemiddelden in uw enquêteresultaten echt van elkaar verschillen en niet alleen cijfermatig. Met t-toetsen kunt u groepsgemiddelden vergelijken, verschillen tussen steekproeven evalueren en vaststellen of een verschil statistisch significant is op basis van de p-waarde en het betrouwbaarheidsinterval.

Veelvoorkomende scenario's voor enquêtes zijn:

Twee groepen vergelijken. Gebruik een t-toets met twee steekproeven (onafhankelijke steekproeven) om na te gaan of segmenten verschillend reageren, zoals mannen versus vrouwen, nieuwe versus terugkerende klanten of verschillende werknemersgroepen.
Een concept of interventie testen in vergelijking tot een controlegroep. Bij A/B-tests of concepttests kunt u met een t-toets bepalen of één versie beter presteert dan de andere.
Verschillen in scores evalueren. Vergelijk statistieken zoals de Net Promoter Score® (NPS), de klanttevredenheidsscore (Customer Satisfaction Score, CSAT) of de klantinspanningsscore (Customer Effort Score, CES) om te bepalen of het gemiddelde van een groep statistisch significant hoger of lager is.
Veranderingen met verloop van tijd controleren. Met een t-toets van twee steekproeven ziet u of de scores van dezelfde respondenten zijn veranderd na bijvoorbeeld een evenement, productlancering of campagne.

Gebruik een t-toets wanneer u een verschil in gemiddelden wilt beoordelen, een benchmarkvergelijking wilt testen of een hypothese wilt valideren met kleine steekproeven. De t-toets is dus een betrouwbare keuze voor enquêteanalyse, A/B-tests en andere situaties waarbij u bewijs nodig hebt dat er daadwerkelijk een verschil in uw data bestaat.

Een korte controle van aannames voordat u een t-toets uitvoert

Voordat u een t-toets uitvoert, controleert u of uw data aan een paar basisvoorwaarden voldoen zodat de resultaten betrouwbaar zijn.

Onafhankelijke reacties. Elk antwoord moet afkomstig zijn van een andere persoon en mag geen invloed hebben op de andere reacties. Vermijd dubbele inzendingen, gedeelde apparaten en verborgen groepen.
Ongeveer een normale verdeling rond het gemiddelde. Een t-toets werkt het beste wanneer de steekproefverdeling van het gemiddelde ongeveer normaal is. Dit is meestal het geval bij een steekproefomvang van ongeveer 30 deelnemers of meer per groep.
Vergelijkbare variantie. Als de varianties van de twee groepen sterk verschillen of de steekproefgroottes ongelijk zijn, gebruik dan de t-toets van Welch in plaats van de standaard t-toets met twee steekproeven.

Met een snelle controle van deze basisvoorwaarden weet u zeker dat een verschil in uw data daadwerkelijk een signaal is en geen ruis.

Drie veelvoorkomende typen t-toetsen en wanneer u deze gebruikt

Er zijn drie typen t-toetsen die vaak door onderzoekers worden gebruikt. Deze t-toetsen hebben hun eigen doelen, die we hieronder toelichten.

1. Een t-toets met één steekproef

Aan de t-toets met één steekproef kunt u zien of het gemiddelde van de gegevens in één groep (in dit geval de totale CES) afwijkt van een door u opgegeven waarde.

Bijvoorbeeld: De huidige gemiddelde klantinspanningsscore (CES) van uw bedrijf is 4,2. Is deze CES van 4,2 significant problematischer dan de industrienorm van 5,0?

2. T-toets met twee steekproeven

T-toetsen met twee steekproeven onderzoeken of de gemiddelden van twee onafhankelijke groepen significant van elkaar verschillen. Als de varianties van de groepen ongelijk lijken of de steekproefgroottes uit balans zijn, gebruik dan de t-toets van Welch (beschikbaar in de meeste analysetools), omdat deze geen gelijke varianties veronderstelt.

Bijvoorbeeld: Uw hypothese is dat mannen uw bedrijf een lagere NPS geven dan vrouwen. Het gemiddelde NPS-cijfer van mannelijke respondenten is 9, terwijl het gemiddelde van vrouwen 12 is. Verschilt 9 significant van 12?

3. Gecombineerde t-toets

Deze toets gebruikt u als u dezelfde enquête twee keer afneemt bij dezelfde groep. Met een gecombineerde t-toets kunt u zien of het gemiddelde tussen de eerste en tweede enquête is veranderd.

Bijvoorbeeld: U hebt een enquête twee keer afgenomen bij dezelfde groep klanten: de eerste keer in april en de tweede keer in mei, nadat ze een advertentie voor uw bedrijf hadden gezien. Is de NPS van uw bedrijf veranderd nadat klanten de advertentie hebben gezien?

Een t-toets in vier stappen uitvoeren (met voorbeeld)

Een vrouw die grafieken bekijkt op een laptop

De uitvoering van een t-toets telt vier stappen.

In deze sectie doorlopen we deze vier stappen aan de hand van het eerdere voorbeeld met NPS-cijfers:

Uw hypothese is dat mannen uw bedrijf een lagere NPS geven dan vrouwen. Het gemiddelde NPS-cijfer van mannen is 9, terwijl dat van vrouwen 12 is. Verschilt 9 significant van 12? Hier is een voorbeeld van een t-toets met twee steekproeven.

Laten we de stappen en het voorbeeld van de t-toets eens onder de loep nemen.

1. De t-statistiek berekenen

Elke soort t-toets heeft een eigen formule om de t-statistiek te berekenen. Voor dit voorbeeld gebruiken we de formule voor de t-toets met twee steekproeven:

t is de t-statistiek
x1 is de gemiddelde NPS-score voor mannen → 9
x2 is het gemiddelde voor vrouwen → 12
n1 is het aantal mannen dat de NPS-vraag heeft beantwoord → stel dat 20 mannen de enquête hebben ingevuld
n2 is het aantal vrouwen → 23 vrouwen hebben gereageerd
s1 is de standaarddeviatie van de NPS voor mannen → stel de berekende standaarddeviatie is 12,48
s2 is de standaarddeviatie van de NPS voor vrouwen → de berekende standaarddeviatie is 10,51

U voert de t-toetsen waarschijnlijk uit in een spreadsheet of statistisch programma (zoals Excel of SPSS). Als u de berekeningen daarentegen handmatig wilt doen, vindt u hieronder de formules voor de andere twee soorten t-toetsen.

2. De vrijheidsgraden berekenen

De vrijheidsgraden zijn het aantal manieren waarop het gemiddelde kan variëren. In dit geval zijn de vrijheidsgraden het aantal NPS-beoordelingen dat u kunt ontvangen van een bepaalde groep respondenten. Net als met de t-toets is de formule voor vrijheidsgraden afhankelijk van het type t-toets dat u gebruikt.

Deze formule moet worden gebruikt om de vrijheidsgraden in t-toetsen met twee steekproeven te berekenen.

3. De kritieke waarde bepalen

De kritieke waarde is de drempel waarbij het verschil tussen twee getallen als statistisch significant wordt beschouwd.

Volgens deze tabel is bij een tweezijdige toets met een alfa van 0,05 en 41 vrijheidsgraden de kritieke waarde 2,02. De meeste analisten gebruiken wel een tweezijdige toets in plaats van een eenzijdige, omdat die conservatiever is.

Bekijk voor meer informatie over de verschillen tussen eenzijdige en tweezijdige toetsen deze video van de Khan Academy.

4. De absolute waarde van de t-statistiek vergelijken met de kritieke waarde

Als de t-statistiek groter is dan uw kritieke waarde, is het verschil significant. Als de t-statistiek kleiner is, dan zijn uw cijfers statistisch gezien gelijk.

In ons voorbeeld is de absolute waarde van de t-statistiek 0,86 (niet groter dan de kritieke waarde van 2,02). U kunt dus concluderen dat mannen niet significant lagere NPS-scores geven dan vrouwen.

De resultaten van de t-toets interpreteren

Bij de interpretatie van de resultaten van de t-toets kijkt u naar de t-waarde, p-waarde en het betrouwbaarheidsinterval om te begrijpen of het verschil tussen uw groepen een echt effect laat zien of aan het toeval moet worden toegeschreven. Deze maatstaven laten samen zien hoe groot het verschil is, hoe sterk het bewijs is en welk betrouwbaarheidsniveau u aan het resultaat kunt toekennen. In de vragen en antwoorden hieronder leest u wat deze precies betekenen en hoe u de resultaten van een t-toets analyseert.

Wat houdt de t-waarde in?

De t-waarde laat zien hoe groot het verschil tussen de groepsgemiddelden is ten opzichte van de variabiliteit in uw data. Een grotere absolute t-waarde houdt in dat het signaal meer is dan ruis. Een kleinere waarde suggereert juist dat het verschil toeval kan zijn.

Wat is een p-waarde bij de enquêteanalyse?

De p-waarde geeft aan hoe waarschijnlijk uw resultaat is als de nulhypothese (geen echt verschil) waar is. Veel teams hanteren een grens van 0,05: p ≤ 0,05 wijst op een statistisch significant verschil, terwijl p > 0,05 betekent dat er in deze steekproef geen betekenisvol verschil is.

Wat is een betrouwbaarheidsinterval en waarom is het belangrijk?

Een betrouwbaarheidsinterval (CI, confidence interval) geeft een waarschijnlijk bereik voor het werkelijke verschil tussen gemiddelden en biedt meer context dan alleen een ja/nee-oordeel over de significantie. Als het CI nul omvat, is het effect niet doorslaggevend. Blijft het CI helemaal boven of onder nul, dan is het resultaat significant voor het gekozen betrouwbaarheidsniveau.

Hoe weet u of een verschil betekenisvol is?

Een verschil is betekenisvol als het zowel statistisch significant als praktisch relevant is. Kijk naar de geschatte omvang van het effect en het betrouwbaarheidsinterval om na te gaan hoe groot het verschil kan zijn en of het van belang is voor uw beslissing.

Hoe beïnvloedt de steekproefgrootte de significantie van de t-toets?

Grotere steekproeven verlagen de variabiliteit, verkleinen de betrouwbaarheidsintervallen en maken het makkelijker om echte verschillen te vinden. Kleinere steekproeven brengen meer onzekerheid met zich mee, waardoor grensgevallen lastiger te interpreteren zijn.

De resultaten van uw t-toets presenteren

Met een duidelijke samenvatting van de t-toetsresultaten ziet u waarom u de vergelijking uitvoerde, wat de test heeft aangetoond en hoe zeker u bent over het verschil tussen de groepen. Uw taak is om de statistische uitkomsten te vertalen naar begrijpelijke taal, het verband te leggen met de oorspronkelijke vraag en te benadrukken wat de bevindingen betekenen voor de daaropvolgende beslissingen.

Voeg deze kernpunten toe aan het overzicht van de t-toetsresultaten:

Geef aan wat het doel is. Beschrijf eerst waarom u een t-toets hebt uitgevoerd en wat het doel van de test was. Leg bijvoorbeeld uit dat u een t-toets hebt ingezet om een statistisch significant verschil aan te tonen tussen de gemiddelden van twee groepen binnen uw enquêteresultaten.
Deel beschrijvende statistieken. Geef vervolgens het gemiddelde en de standaarddeviatie van elke onderzochte groep weer. Zo hebben belanghebbenden de nodige context om de gevonden verschillen te begrijpen. Vermeld verder de steekproefgrootte per groep voor extra duiding.
Presenteer de resultaten van uw t-toets. Geef daarna de t-waarde, het aantal vrijheidsgraden (df), de p-waarde en de analyse van het betrouwbaarheidsinterval (indien berekend) weer.
Deel uw bevindingen. Tot slot deelt u uw bevindingen met de verschillende partijen. Geef kort aan of het verschil statistisch significant was en wat dat betekent voor uw hypothese of onderzoeksvraag.
Noem de vervolgstappen. Leg aan de partijen uit wat uw onderzoeksresultaten betekenen voor het bedrijf. Geef aan welke vervolgstappen nodig zijn en hoe de resultaten uw beslissingen kunnen beïnvloeden.

Veelgemaakte fouten bij het gebruik van t-toetsen in enquêtes

Door een paar eenvoudige fouten te vermijden, krijgt u betrouwbaardere t-toetsresultaten uit uw enquêtegegevens.

Lage p-waarden proberen te bereiken zonder naar het daadwerkelijke verschil te kijken. Een resultaat kan ‘statistisch significant’ zijn terwijl het verschil tussen de groepen te klein is om van belang te zijn. Denk aan de omvang van het verschil en het betrouwbaarheidsinterval om te bepalen of dit echt betekenisvol is.
Veel groepen vergelijken zonder uw aanpak aan te passen. Als u veel segmenten of vragen test, neemt de kans toe dat u per toeval een verschil vindt. Begin met een bredere test zoals ANOVA, of pas eenvoudige correcties toe wanneer u meerdere t-toetsen uitvoert.
Een A/B-test te vroeg stoppen. Als u resultaten vaak controleert en de test beëindigt zodra iets veelbelovend lijkt, kan dat tot verkeerde conclusies leiden. Bepaal vooraf de steekproefgrootte of een tijdsperiode voordat u begint.
T-toetsen gebruiken voor het verkeerde type data. Als uw vraag rangschikkingen of erg vertekende beoordelingsschalen gebruikt, is een t-toets misschien niet geschikt. De gemiddelden kunnen dan misleidend zijn. Zorg ervoor dat de gegevens geschikt zijn voor een numerieke schaal.
De basisvoorwaarden overslaan. T-toetsen werken het beste wanneer de antwoorden onafhankelijk zijn en de groepen een vergelijkbare spreiding hebben. Als de spreiding tussen de groepen sterk verschilt, gebruik dan de t-toets van Welch voor een betrouwbaarder resultaat.

Veelgestelde vragen over t-toetsen

T-toetsen versus ANOVA
Z-toetsen versus t-toetsen
Z-toetsen en t-toetsen lijken op elkaar omdat ze beide statistische significantie bepalen. Maar z-toetsen worden meestal gebruikt bij grotere steekproeven (n > 30). Dit komt doordat de verdeling van de gemiddelden bij grotere steekproeven normaal verdeeld raakt. Z-toetsen zijn dus betrouwbaarder bij grotere steekproeven, omdat ze werken met de normale standaardverdeling.
Een ander verschil tussen z-toetsen en t-toetsen is dat bij een z-toets de standaarddeviatie van de populatie (σ) bekend moet zijn. U gebruikt een t-toets wanneer de standaarddeviatie van de populatie onbekend is en u de spreiding schat met de standaarddeviatie van de steekproef (s). T-toetsen komen veel vaker voor, omdat in de praktijk de standaarddeviatie van de populatie meestal niet bekend is.

Betere enquêtes ontwikkelen voor analyse met SurveyMonkey

T-toetsen worden gebruikt om te bepalen of het verschil tussen de gemiddelden van twee steekproefgroepen statistisch significant is. U kunt t-toetsen toepassen bij de analyse van enquêtegegevens om de betrouwbaarheid van uw gegevens aan te tonen.

Met SurveyMonkey vereenvoudigt u het proces van het maken en versturen van enquêtes naar steekproefgroepen voor de onderzoeksbehoeften van uw organisatie. Stel marktonderzoeksenquêtes en vragenlijsten helemaal zelf op of kies uit meer dan 400 enquêtesjablonen uit ons ruime aanbod.

Begin vandaag nog met het verzamelen van enquêtegegevens voor analyse, zodat uw organisatie betere beslissingen kan nemen om door te groeien. Maak nu gratis een account.

Klaar om aan de slag te gaan?

Gratis registreren

NPS, Net Promoter en Net Promoter Score zijn geregistreerde handelsmerken van Satmetrix Systems, Inc., Bain & Company en Fred Reichheld.

Meer hulpbronnen bekijken

Een vrouw die een hijab draagt en onderzoeksinzichten bekijkt op laptop

Oplossingen voor uw functie

Met SurveyMonkey werkt u slimmer en beter. Ontdek hoe u meer impact maakt met winnende strategieën, producten, ervaringen en meer.

Meer informatie

Een man en een vrouw die op hun laptop naar een artikel kijken en informatie noteren op plakbriefjes

De beste tips voor het schrijven van kwalitatieve onderzoeksvragen

Ontdek hoe u effectieve kwalitatieve onderzoeksvragen schrijft. Bekijk typen, voorbeelden en tips om vragen te schrijven.

Meer informatie

Een glimlachende man met een bril die een laptop gebruikt

Hornblower verbetert de ervaring van klanten wereldwijd

Ontdek hoe Hornblower met SurveyMonkey en krachtige AI het meeste uit zijn NPS-data haalt, klantinzichten verzamelt en de klantervaring verbetert.

Meer informatie

Een vrouw die informatie bekijkt op haar laptop

3 trends op de werkplek met impact op het personeelsbestand van de toekomst

Nieuw onderzoek over trends op de werkplek en hoe medewerkers privétijd, thuiswerken en de kloof tussen werken op afstand en op kantoor overbruggen

Meer informatie