Pdf downloaden
Pdf downloaden
Het testen van een hypothese wordt ondersteund door statistische analyse. Statistische significantie wordt berekend aan de hand van een p-waarde, die de waarschijnlijkheid aangeeft van het geobserveerde resultaat, gegeven dat aan een bepaalde stelling (de nulhypothese) is voldaan. [1] X Bron Indien deze p-waarde kleiner is dan het gestelde significantieniveau (meestal 0,05), dan kan de experimentator aannemen dat de nulhypothese onwaar is en de alternatieve hypothese aanvaarden. Met behulp van een eenvoudige t-test, kun je een p-waarde berekenen en de significantie vergelijken tussen twee verschillende groepen van een gegevensverzameling.
Stappen
-
Definieer je hypothese. De eerste stap bij de beoordeling van de statistische significantie is het definiëren van de te beantwoorden vraag en het stellen van je hypothese. De hypothese is een bewering over je experimentele gegevens en de verschillen die zich in de populatie kunnen voordoen. Bij elk experiment is er zowel een nul als een alternatieve hypothese. [2] X Bron In het algemeen zal je twee groepen met elkaar vergelijken, om te zien of ze hetzelfde zijn of verschillend.
- De nulhypothese (H 0 ) stelt in het algemeen dat er geen verschil is tussen je twee gegevensverzamelingen. Bijvoorbeeld: studenten die het materiaal voor de les hebben gelezen behalen geen betere eindcijfers.
- De alternatieve hypothese (H a ) is het tegenovergestelde van de nulhypothese en is de bewering die je met je experimentele gegevens probeert te ondersteunen. Bijvoorbeeld: studenten die het materiaal voor de les hebben gelezen behalen betere eindcijfers.
-
Stel het significantieniveau in om te bepalen hoe ongebruikelijk je gegevens moeten zijn, voordat ze als significant kunnen worden beschouwd. Het significantieniveau (ook wel alfa genoemd) is de drempelwaarde die je hebt ingesteld om de significantie te bepalen. Is de p-waarde kleiner dan of gelijk aan het ingestelde significantieniveau, dan kunnen de gegevens als statistisch significant beschouwd worden. [3] X Bron
- Als een algemene regel wordt het significantieniveau (of alfa) vaak ingesteld op 0,05, wat betekent dat de waarschijnlijkheid van het bij toeval observeren van de aanwezige verschillen in je gegevens, slechts 5% is.
- Een hoger betrouwbaarheidsniveau (en dus een lagere p-waarde) betekent dat de resultaten significanter zijn.
- Wil je dat de gegevens betrouwbaarder zijn, stel dan de p-waarde lager in dan 0,01. Lagere p-waarden worden gewoonlijk gebruikt in de industrie bij het opsporen van fouten in producten. Het is zeer belangrijk om een groot vertrouwen te kunnen hebben dat elk deel precies zo werkt als het hoort.
- Voor de meeste experimenten naar een hypothese, is een significantieniveau van 0,05 aanvaardbaar.
-
Beslis om gebruik te maken van een eenzijdige of tweezijdige test. Een van de veronderstellingen die een t-toets maakt, is dat gegevens normaal wordt verdeeld. Een normale verdeling van gegevens vormt een bell-curve waarbij het grootste deel van de testgegevens in het midden valt. [4] X Bron De t-test is een wiskundige test om te zien of gegevens buiten de normale verdeling (boven of onder) vallen, in de 'staarten' van de curve.
- Als je niet zeker weet of je gegevens boven of onder de controlegroep vallen, gebruik dan een tweeledige test. Hiermee kun je testen op de significantie in beide richtingen.
- Als je weet in welke richting je gegevens geneigd zijn om te bewegen, gebruik dan een eenzijdige test. In het gegeven voorbeeld verwacht je dat de cijfers van de studenten zullen verbeteren; daarom gebruik je een eenzijdige test.
-
Bepaal de grootte van de steekproef met een krachtanalyse. De kracht van een test is de waarschijnlijkheid dat het verwachte resultaat zal worden geobserveerd, gegeven een specifieke steekproefgrootte. [5] X Bron De gangbare drempelwaarde voor kracht (of β) is 80%. Een krachtanalyse kan een beetje lastig worden zonder enkele voorlopige gegevens, omdat je wat informatie nodig hebt over de verwachte middelste waarden tussen elke groep en hun standaarddeviaties. Gebruik een online krachtanalyse-calculator, om de optimale steekproefgrootte voor je gegevens te bepalen. [6] X Bron
- Onderzoekers doen meestal een kleine pilotstudie om hun krachtanalyse te informeren en voor het bepalen van de steekproefgrootte nodig voor een groter, meer uitgebreid onderzoek.
- Als je niet over de middelen beschikt om een complexe pilotstudie te doen, doe dan een aantal schattingen over mogelijke gemiddelden op basis van het lezen van de literatuur en de studies die andere personen mogelijk hebben uitgevoerd. Dit geeft je een goed uitgangspunt voor de steekproefgrootte om mee te beginnen.
Advertentie
-
Bepaal de formule voor de standaarddeviatie. De standaarddeviatie is een maatstaf voor de spreiding van je gegevens. Het geeft je informatie over hoe vergelijkbaar elk gegevenspunt binnen je steekproef is. Op het eerste gezicht lijkt de vergelijking misschien een beetje ingewikkeld, maar de volgende stappen loodsen je wel door de berekening. De formule is: s = √∑((x i – µ) 2 /(N – 1)).
- s is de standaardafwijking.
- ∑ geeft aan dat je alle verzamelde steekproefwaarden moet optellen.
- x i vertegenwoordigt elke individuele waarde van je gegevens.
- µ is de gemiddelde (of het midden) van je gegevens voor elke groep.
- N is het totaal van de steekproef.
-
Bepaal het gemiddelde van de testgegevens in elke groep. Voor het berekenen van de standaarddeviatie, moet je eerst het gemiddelde nemen van de testgegevens in de afzonderlijke groepen. Het gemiddelde wordt aangeduid met de Griekse letter mu of µ. Tel hiertoe elke gegeven bij elkaar op en deel dit vervolgens door het totale aantal gegevens. [7] X Bron
- Bijvoorbeeld, om het gemiddelde cijfer te vinden van de groep die het materiaal heeft gelezen voorafgaand aan de les, kijken we naar enkele gegevens. Voor de eenvoud gebruiken we een gegevensverzameling van 5 punten: 90, 91, 85, 83 en 94.
- Tel alle gegevens bij elkaar op: 90 + 91 + 85 + 83 + 94 = 443.
- Deel de som door het aantal gegevens, N = 5:443 / 5 = 88,6.
- Het gemiddelde cijfer van deze groep is 88,6.
-
Trek elk gegeven af van het gemiddelde. Het volgende deel van de berekening omvat het deel (x i – µ) van de vergelijking. Je trekt hierbij elk gegeven af van het zojuist berekende gemiddelde. In ons voorbeeld eindig je met vijf aftrekkingen.
- (90 – 88,6), (91- 88,6), (85 – 88,6), (83 – 88,6) en (94 – 88,6).
- De berekende getallen zijn nu 1,4, 2,4, -3,6, -5,6, en 5,4.
-
Kwadrateer elk van deze getallen en tel ze bij elkaar op. Elk van de nieuwe getallen die je zojuist hebt berekend, wordt nu gekwadrateerd. Deze stap zorgt ook voor negatieve tekens. Heb je een minteken na deze stap of aan het einde van je berekening, dan kan het zijn dat je deze stap bent vergeten.
- In ons voorbeeld werken we nu met 1,96 5,76, 12,96, 31,36 en 29,16.
- Het optellen van deze vierkanten geeft: 1,96 + 5,76 + 12,96 + 31,36 + 29,16 = 81,2.
-
Deel dit door de grootte van de totale steekproef, min 1. De formule deelt door N-1, omdat het een correctie is voor het feit dat je nog niet een hele populatie hebt geteld; je neemt een steekproef uit de populatie van alle studenten om een schatting te kunnen maken. [8] X Bron
- Trek af: N – 1 = 5 – 1 = 4
- Deel: 81,2/4 = 20,3
-
Neem de vierkantswortel. Zodra je hebt gedeeld door het aantal gegevens min één, bereken je de vierkantswortel van dit laatste getal. Dit is de laatste stap bij het berekenen van de standaarddeviatie. Er zijn statistische programma's die deze berekening voor je kunnen doen, na het invoeren van de ruwe gegevens.
- In ons voorbeeld is de standaarddeviatie van de definitieve cijfers van studenten die vóór de les de stof hadden gelezen: s = √20,3 = 4,51.
Advertentie
-
Bereken het verschil tussen je twee groepen van de steekproef. Tot op dit punt heeft het voorbeeld alleen een van de groepen van de steekproef behandeld. Als je twee groepen wilt gaan vergelijken, dan zal je uiteraard gegevens hebben uit beide groepen. Bereken de standaarddeviatie van de tweede groep testgegevens en gebruik die voor de berekening van het verschil tussen de twee experimentele groepen. De formule voor variantie is s d = √((s 1 /N 1 ) + (s 2 /N 2 )). [9] X Bron
- s d is de variantie tussen je groepen.
- s 1 is de standaarddeviatie van groep 1, en N 1 is de steekproefgrootte van groep 1.
- s 2 is de standaarddeviatie van groep 2, en N 2 is de steekproefgrootte van groep 2.
- Laten we ten behoeve van ons voorbeeld, stellen dat de gegevens van groep 2 (studenten die niet vóór de les hadden gelezen) een steekproefgrootte had van 5 en een standaarddeviatie van 5,81. De variantie is:
- s d = √((s 1 ) 2 /N 1 ) + ((s 2 ) 2 /N 2 ))
- s d = √(((4,51) 2 /5) + ((5,81) 2 /5)) = √((20,34/5) + (33,76/5)) = √(4,07 + 6,75) = √10,82 = 3,29.
-
Bereken de t-score van je gegevens. Met een t-score kun je gegevens omzetten in een vorm waarmee je ze kunt vergelijken met andere gegevens. Met t-scores kun je een t-test uitvoeren, voor het berekenen van de waarschijnlijkheid dat twee groepen beduidend van elkaar verschillen. De formule voor een t-score is: t = (µ 1 – µ 2 )/s d . [10] X Bron
- µ 1 is het gemiddelde van de eerste groep.
- µ 2 is het gemiddelde van de tweede groep.
- s d is de variantie tussen de steekproeven.
- Gebruik het grotere gemiddelde als µ 1 , zodat je geen negatieve waarde hebt voor t.
- Laten we in ons voorbeeld zeggen dat het gemiddelde van de steekproef voor groep 2 (degenen die niet hebben gelezen) 80 was. De t-score is dan: t = (µ 1 – µ 2 )/s d = (88,6 – 80)/3,29 = 2,61.
-
Bepaal de vrijheidsgraad van je steekproef. Wanneer je de t-score gebruikt, wordt het aantal vrijheidsgraden bepaald met behulp van de grootte van de steekproef. Tel het aantal testgegevens uit elke groep bij elkaar op en deel vervolgens door twee. In ons voorbeeld is de vrijheidsgraad (degrees of freedom; d.f.) 8, omdat er vijf gegevens waren in de eerste groep en vijf in de tweede groep ((5 + 5) – 2 = 8). [11] X Bron
-
Gebruik een t-tabel voor het beoordelen van de significantie. Een tabel met t-scores [12] X Bron en het aantal vrijheidsgraden vind je in een standaard statistiekboek of online. Kijk naar de rij met de vrijheidsgraad voor je gegevens en zoek de p-waarde die overeenkomt met je t-score.
- Met 8 d.f. en een t-score van 2,61, valt de p-waarde voor een eenzijdige test tussen 0,01 en 0,025. Omdat ons ingestelde significantieniveau kleiner is dan of gelijk aan 0,05, zijn onze gegevens statistisch significant. Met deze gegevens, verwerpen we de nulhypothese en accepteren we de alternatieve hypothese: [13] X Bron Studenten die het materiaal voorafgaand aan de les hebben gelezen, krijgen betere eindcijfers.
-
Overweeg een vervolgstudie. Veel onderzoekers doen een kleine pilotstudie met een paar metingen, om te begrijpen hoe ze een grotere studie moeten opzetten. Een andere studie, met meer metingen, zal helpen bij het vergroten van je vertrouwen in je conclusie.Advertentie
Tips
- Statistiek is een omvangrijk en ingewikkeld vakgebied. Volg een vak op het niveau van de middelbare school of hoger onderwijs over statistische inferentie, om statistische significantie beter te leren begrijpen.
Advertentie
Waarschuwingen
- Deze analyse is specifiek voor een t-toets voor het testen van de verschillen tussen twee normaal verdeelde populaties. Je hebt wellicht een andere statistische toets nodig, afhankelijk van de complexiteit van je gegevensverzameling.
Advertentie
Bronnen
- ↑ http://blog.minitab.com/blog/adventures-in-statistics/how-to-correctly-interpret-p-values
- ↑ https://statistics.laerd.com/statistical-guides/hypothesis-testing-3.php
- ↑ http://www.stat.yale.edu/Courses/1997-98/101/sigtest.htm
- ↑ https://web.csulb.edu/~msaintg/ppa696/696stsig.htm#INTERPRET THE Chi
- ↑ http://www.jeremymiles.co.uk/misc/power/
- ↑ http://powerandsamplesize.com/Calculators/Compare-2-Means/2-Sample-1-Sided
- ↑ https://www.mathsisfun.com/data/standard-deviation-formulas.html
- ↑ https://www.mathsisfun.com/data/standard-deviation-formulas.html
- ↑ http://archive.bio.ed.ac.uk/jdeacon/statistics/tress4a.html
Over dit artikel
Deze pagina is 9.401 keer bekeken.
Advertentie