Lees hoe u statistisch significante verschillen in groepsgemiddelden, enquêteresultaten en A/B-testresultaten herkent met een eenvoudige t-toets.
Iedereen kan wel het verschil zien tussen twee getallen. Maar het is lastiger om te achterhalen of dit verschil statistisch significant is.
Stel u hebt op het werk een klanttevredenheidsenquête afgenomen. Uw leidinggevende wil analyseren of mannen uw bedrijf een lagere Net Promoter Score® (NPS) geven dan vrouwen.
In de gegevens ziet u dat de gemiddelde score van mannelijke respondenten een 9 was en die van vrouwen een 12. Hoe weet u of 9 een significant verschil is met 12? Daar komt de t-toets bij om de hoek kijken.
In dit artikel definiëren we t-toetsen en hun toepassingen, geven we voorbeelden en leggen we uit hoe u de resultaten kunt interpreteren.
Een t-toets is een statistische test die beoordeelt of het verschil tussen twee gemiddelden significant is op basis van de t-verdeling. Zo ontdekt u of een waargenomen verschil tussen groepen echt bestaat of waarschijnlijk door toeval wordt veroorzaakt.
Het testen op statistische significantie is gebruikelijk bij concepttests en producttests. Bij concepttests worden A/B-tests vaak gebruikt om te bepalen of het ene advertentieconcept beter presteert dan het andere. Producttests werken op vergelijkbare wijze. Hiermee gaat u na of een product zich staande zal houden wanneer het op de markt wordt gebracht.
T-toetsen gebruiken specifieke formules om gemiddelden te vergelijken en te bepalen of een verschil statistisch significant is. De t-toets met twee steekproeven is de meest gebruikelijke optie bij de analyse van enquêtes:
Hier vindt u de formules voor de t-toets met één steekproef en de gecombineerde t-toets:
Bij zowel de t-toets met één steekproef als de gecombineerde t-toets wordt de berekende t-waarde vergeleken met een kritieke waarde uit de t-verdeling om te bepalen of het verschil significant is.
Gebruik een t-toets wanneer u wilt weten of twee gemiddelden in uw enquêteresultaten echt van elkaar verschillen en niet alleen cijfermatig. Met t-toetsen kunt u groepsgemiddelden vergelijken, verschillen tussen steekproeven evalueren en vaststellen of een verschil statistisch significant is op basis van de p-waarde en het betrouwbaarheidsinterval.
Veelvoorkomende scenario's voor enquêtes zijn:
Gebruik een t-toets wanneer u een verschil in gemiddelden wilt beoordelen, een benchmarkvergelijking wilt testen of een hypothese wilt valideren met kleine steekproeven. De t-toets is dus een betrouwbare keuze voor enquêteanalyse, A/B-tests en andere situaties waarbij u bewijs nodig hebt dat er daadwerkelijk een verschil in uw data bestaat.
Voordat u een t-toets uitvoert, controleert u of uw data aan een paar basisvoorwaarden voldoen zodat de resultaten betrouwbaar zijn.
Met een snelle controle van deze basisvoorwaarden weet u zeker dat een verschil in uw data daadwerkelijk een signaal is en geen ruis.
Er zijn drie typen t-toetsen die vaak door onderzoekers worden gebruikt. Deze t-toetsen hebben hun eigen doelen, die we hieronder toelichten.
Aan de t-toets met één steekproef kunt u zien of het gemiddelde van de gegevens in één groep (in dit geval de totale CES) afwijkt van een door u opgegeven waarde.
Bijvoorbeeld: De huidige gemiddelde klantinspanningsscore (CES) van uw bedrijf is 4,2. Is deze CES van 4,2 significant problematischer dan de industrienorm van 5,0?
T-toetsen met twee steekproeven onderzoeken of de gemiddelden van twee onafhankelijke groepen significant van elkaar verschillen. Als de varianties van de groepen ongelijk lijken of de steekproefgroottes uit balans zijn, gebruik dan de t-toets van Welch (beschikbaar in de meeste analysetools), omdat deze geen gelijke varianties veronderstelt.
Bijvoorbeeld: Uw hypothese is dat mannen uw bedrijf een lagere NPS geven dan vrouwen. Het gemiddelde NPS-cijfer van mannelijke respondenten is 9, terwijl het gemiddelde van vrouwen 12 is. Verschilt 9 significant van 12?
Deze toets gebruikt u als u dezelfde enquête twee keer afneemt bij dezelfde groep. Met een gecombineerde t-toets kunt u zien of het gemiddelde tussen de eerste en tweede enquête is veranderd.
Bijvoorbeeld: U hebt een enquête twee keer afgenomen bij dezelfde groep klanten: de eerste keer in april en de tweede keer in mei, nadat ze een advertentie voor uw bedrijf hadden gezien. Is de NPS van uw bedrijf veranderd nadat klanten de advertentie hebben gezien?
De uitvoering van een t-toets telt vier stappen.
In deze sectie doorlopen we deze vier stappen aan de hand van het eerdere voorbeeld met NPS-cijfers:
Uw hypothese is dat mannen uw bedrijf een lagere NPS geven dan vrouwen. Het gemiddelde NPS-cijfer van mannen is 9, terwijl dat van vrouwen 12 is. Verschilt 9 significant van 12? Hier is een voorbeeld van een t-toets met twee steekproeven.
Laten we de stappen en het voorbeeld van de t-toets eens onder de loep nemen.
Elke soort t-toets heeft een eigen formule om de t-statistiek te berekenen. Voor dit voorbeeld gebruiken we de formule voor de t-toets met twee steekproeven:
U voert de t-toetsen waarschijnlijk uit in een spreadsheet of statistisch programma (zoals Excel of SPSS). Als u de berekeningen daarentegen handmatig wilt doen, vindt u hieronder de formules voor de andere twee soorten t-toetsen.
De vrijheidsgraden zijn het aantal manieren waarop het gemiddelde kan variëren. In dit geval zijn de vrijheidsgraden het aantal NPS-beoordelingen dat u kunt ontvangen van een bepaalde groep respondenten. Net als met de t-toets is de formule voor vrijheidsgraden afhankelijk van het type t-toets dat u gebruikt.
Deze formule moet worden gebruikt om de vrijheidsgraden in t-toetsen met twee steekproeven te berekenen.
De kritieke waarde is de drempel waarbij het verschil tussen twee getallen als statistisch significant wordt beschouwd.
Volgens deze tabel is bij een tweezijdige toets met een alfa van 0,05 en 41 vrijheidsgraden de kritieke waarde 2,02. De meeste analisten gebruiken wel een tweezijdige toets in plaats van een eenzijdige, omdat die conservatiever is.
Bekijk voor meer informatie over de verschillen tussen eenzijdige en tweezijdige toetsen deze video van de Khan Academy.
Als de t-statistiek groter is dan uw kritieke waarde, is het verschil significant. Als de t-statistiek kleiner is, dan zijn uw cijfers statistisch gezien gelijk.
In ons voorbeeld is de absolute waarde van de t-statistiek 0,86 (niet groter dan de kritieke waarde van 2,02). U kunt dus concluderen dat mannen niet significant lagere NPS-scores geven dan vrouwen.
Bij de interpretatie van de resultaten van de t-toets kijkt u naar de t-waarde, p-waarde en het betrouwbaarheidsinterval om te begrijpen of het verschil tussen uw groepen een echt effect laat zien of aan het toeval moet worden toegeschreven. Deze maatstaven laten samen zien hoe groot het verschil is, hoe sterk het bewijs is en welk betrouwbaarheidsniveau u aan het resultaat kunt toekennen. In de vragen en antwoorden hieronder leest u wat deze precies betekenen en hoe u de resultaten van een t-toets analyseert.
De t-waarde laat zien hoe groot het verschil tussen de groepsgemiddelden is ten opzichte van de variabiliteit in uw data. Een grotere absolute t-waarde houdt in dat het signaal meer is dan ruis. Een kleinere waarde suggereert juist dat het verschil toeval kan zijn.
De p-waarde geeft aan hoe waarschijnlijk uw resultaat is als de nulhypothese (geen echt verschil) waar is. Veel teams hanteren een grens van 0,05: p ≤ 0,05 wijst op een statistisch significant verschil, terwijl p > 0,05 betekent dat er in deze steekproef geen betekenisvol verschil is.
Een betrouwbaarheidsinterval (CI, confidence interval) geeft een waarschijnlijk bereik voor het werkelijke verschil tussen gemiddelden en biedt meer context dan alleen een ja/nee-oordeel over de significantie. Als het CI nul omvat, is het effect niet doorslaggevend. Blijft het CI helemaal boven of onder nul, dan is het resultaat significant voor het gekozen betrouwbaarheidsniveau.
Een verschil is betekenisvol als het zowel statistisch significant als praktisch relevant is. Kijk naar de geschatte omvang van het effect en het betrouwbaarheidsinterval om na te gaan hoe groot het verschil kan zijn en of het van belang is voor uw beslissing.
Grotere steekproeven verlagen de variabiliteit, verkleinen de betrouwbaarheidsintervallen en maken het makkelijker om echte verschillen te vinden. Kleinere steekproeven brengen meer onzekerheid met zich mee, waardoor grensgevallen lastiger te interpreteren zijn.
Met een duidelijke samenvatting van de t-toetsresultaten ziet u waarom u de vergelijking uitvoerde, wat de test heeft aangetoond en hoe zeker u bent over het verschil tussen de groepen. Uw taak is om de statistische uitkomsten te vertalen naar begrijpelijke taal, het verband te leggen met de oorspronkelijke vraag en te benadrukken wat de bevindingen betekenen voor de daaropvolgende beslissingen.
Voeg deze kernpunten toe aan het overzicht van de t-toetsresultaten:
Door een paar eenvoudige fouten te vermijden, krijgt u betrouwbaardere t-toetsresultaten uit uw enquêtegegevens.
T-toetsen worden gebruikt om te bepalen of het verschil tussen de gemiddelden van twee steekproefgroepen statistisch significant is. U kunt t-toetsen toepassen bij de analyse van enquêtegegevens om de betrouwbaarheid van uw gegevens aan te tonen.
Met SurveyMonkey vereenvoudigt u het proces van het maken en versturen van enquêtes naar steekproefgroepen voor de onderzoeksbehoeften van uw organisatie. Stel marktonderzoeksenquêtes en vragenlijsten helemaal zelf op of kies uit meer dan 400 enquêtesjablonen uit ons ruime aanbod.
Begin vandaag nog met het verzamelen van enquêtegegevens voor analyse, zodat uw organisatie betere beslissingen kan nemen om door te groeien. Maak nu gratis een account.
NPS, Net Promoter en Net Promoter Score zijn geregistreerde handelsmerken van Satmetrix Systems, Inc., Bain & Company en Fred Reichheld.

Met SurveyMonkey werkt u slimmer en beter. Ontdek hoe u meer impact maakt met winnende strategieën, producten, ervaringen en meer.

Ontdek hoe u effectieve kwalitatieve onderzoeksvragen schrijft. Bekijk typen, voorbeelden en tips om vragen te schrijven.

Ontdek hoe Hornblower met SurveyMonkey en krachtige AI het meeste uit zijn NPS-data haalt, klantinzichten verzamelt en de klantervaring verbetert.

Nieuw onderzoek over trends op de werkplek en hoe medewerkers privétijd, thuiswerken en de kloof tussen werken op afstand en op kantoor overbruggen





