PDF download Pdf downloaden PDF download Pdf downloaden

De correlatiecoëfficiënt, aangeduid als r of ρ, is de maat voor de lineaire correlatie (de relatie, zowel qua sterkte als qua richting) tussen twee variabelen. Hij varieert van -1 tot +1, waarbij plus- en mintekens worden gebruikt om de positieve en negatieve correlatie weer te geven. Als de correlatiecoëfficiënt precies -1 is, dan is het verband tussen de twee variabelen volledig negatief; als de correlatiecoëfficiënt precies +1 is, dan is het verband volledig positief. Twee variabelen kunnen een positieve correlatie hebben, een negatieve correlatie, of helemaal geen correlatie. Je kunt de correlatie met de hand berekenen, door gebruik te maken van een aantal gratis correlatieberekeningen die online beschikbaar zijn, of door gebruik te maken van de statistische functies van een goede grafische rekenmachine.

Methode 1
Methode 1 van 4:

De correlatiecoëfficiënt met de hand berekenen

PDF download Pdf downloaden
  1. Om te beginnen met het berekenen van een efficiënte correlatie, onderzoek je eerst de dataparen. Het is nuttig om ze in een tabel te zetten, zowel verticaal als horizontaal. Label elke rij of kolom x en y. [1]
    • Bijvoorbeeld: stel dat je vier dataparen hebt voor x en y . De tabel kan er dan als volgt uitzien:
      • x || y
      • 1 || 1
      • 2 || 3
      • 4 || 5
      • 5 || 7
  2. Om het gemiddelde te berekenen, moet je alle waarden van x optellen en vervolgens delen door het aantal waarden. [2]
    • Uitgaande van het bovenstaande voorbeeld, merk je op dat je vier waarden hebt voor x . Om het gemiddelde te berekenen, tel je alle waarden voor x op en deel je deze door 4. De berekening ziet er dan zo uit:
  3. Om het gemiddelde van y te vinden, volg je dezelfde stappen, waarbij je alle waarden van y bij elkaar optelt en vervolgens deelt door het aantal waarden. [3]
    • In het bovenstaande voorbeeld heb je ook vier waarden voor y . Tel al deze waarden bij elkaar op en deel ze dan door 4. De berekeningen gaan er dan als volgt uitzien:
  4. Als je eenmaal je gemiddelden hebt, kun je de standaardafwijking berekenen. Gebruik hiervoor de formule: [4]
    • Met de voorbeeldgegevens gaan je berekeningen er als volgt uitzien:
  5. Gebruikmakend van dezelfde basisstappen, zoek je de standaardafwijking van y . Je gaat dezelfde formule gebruiken, met behulp van de gegevenspunten voor y. [5]
    • Met de voorbeeldgegevens gaan je berekeningen er als volgt uitzien:
  6. De formule voor het berekenen van een correlatiecoëfficiënt maakt gebruik van gemiddelden, standaardafwijkingen en het aantal paren in een gegevensverzameling (weergegeven met n ). De correlatiecoëfficiënt zelf wordt weergegeven door de kleine letter r of de Griekse letter ρ (rho). Voor dit artikel gebruiken we de formule die bekend staat als de Pearson-correlatiecoëfficiënt, zoals hieronder weergegeven: [6]
    • Je kunt lichte variaties in de formule opmerken, hier of in andere uitleg. Zo zullen sommigen de Griekse notatie met rho en sigma gebruiken, terwijl anderen r en s zullen gebruiken. Sommige uitleg kan iets andere formules gebruiken, maar ze zullen wiskundig gezien gelijk zijn aan deze.
  7. Je hebt nu de middelen en standaardafwijkingen voor je variabelen, dus kun je verdergaan met de correlatiecoëfficiëntenformule. Onthoud dat n staat voor het aantal waarden dat je hebt. Je hebt de andere relevante informatie al uitgewerkt in de stappen hierboven. [7]
    • Gebruik makend van de steekproefgegevens, zou kun je de gegevens in de correlatiecoëfficiëntenformule invoeren en als volgt berekenen:
    • [
      ]
  8. Voor deze gegevensverzameling is de correlatiecoëfficiënt 0,988. Dit getal vertelt je twee dingen over de gegevens. Kijk naar het teken van het getal en de grootte van het getal. [8]
    • Omdat de correlatiecoëfficiënt positief is, kun je zeggen dat er een positieve correlatie is tussen de x-data en de y-data. Dit betekent dat als de x-waarden toenemen, je verwacht dat de y-waarden ook toenemen.
    • Omdat de correlatiecoëfficiënt zeer dicht bij +1 ligt, zijn de x-data en y-data zeer nauw met elkaar verbonden. Als je deze punten in een grafiek zou weergeven, zou je zien dat ze een zeer goede benadering van een rechte lijn vormen.
    Advertentie
Methode 2
Methode 2 van 4:

Online correlatiecalculators gebruiken

PDF download Pdf downloaden
  1. Het meten van correlatie is een vrij standaard berekening voor statistici. De berekening kan voor grote datasets erg vervelend worden als het met de hand wordt gedaan. Daarom hebben veel bronnen veelvoorkomende correlatieberekeningen online beschikbaar gesteld. Gebruik een willekeurige zoekmachine en voer de zoekterm 'correlatiecalculator' in.
  2. Lees de instructies op de website zorgvuldig door, zodat je de gegevens goed kunt invoeren. Het is belangrijk dat gegevensparen op volgorde worden gehouden, anders krijg je een onjuist correlatieresultaat. Verschillende websites gebruiken verschillende opmaak om gegevens in te voeren.
  3. Deze berekeningssites zijn populair omdat je na het invoeren van de gegevens over het algemeen alleen nog maar op de knop 'Berekenen' hoeft te klikken -- het resultaat verschijnt dan automatisch.
    Advertentie
Methode 3
Methode 3 van 4:

Een grafische rekenmachine gebruiken

PDF download Pdf downloaden
  1. Schakel op je grafische rekenmachine de statistiekfunctie in en selecteer vervolgens het commando 'Edit' (Bewerken). [9]
    • Elke rekenmachine heeft iets andere toetscommando's. Dit artikel geeft de specifieke instructies voor de Texas Instruments TI-86.
    • Open de Stat-functie door op [2nd]-Stat te drukken (boven de toets '+') te drukken en dan op F2-Edit.
  2. De meeste rekenmachines zullen de statistische gegevens bewaren tot die gewist zijn. Om er zeker van te zijn dat je oude gegevens niet verwart met nieuwe gegevens, moet je eerst alle eerder opgeslagen informatie wissen. [10]
    • Gebruik de pijltjestoetsen om de cursor te verplaatsen om de categorie 'xStat' te markeren. Druk dan op 'Clear' en 'Enter. Dit zou alle waarden in de xStat-kolom moeten wissen.
    • Gebruik de pijltjestoetsen om de categorie 'yStat' te markeren. Druk op 'Clear' en 'Enter' om ook de gegevens van die kolom te wissen.
  3. Gebruik de pijltjestoetsen om de cursor naar de eerste ruimte onder de xStat-hoofding te verplaatsen. Typ je eerste gegevenswaarde in en druk vervolgens op Enter. Je zou de ruimte onderin het scherm 'xStat(1)=__' moeten zien, waarbij je waarde de lege ruimte vult. Wanneer je op Enter drukt, zullen de gegevens de tabel vullen, de cursor zal naar de volgende regel gaan, en de regel aan de onderkant van het scherm zou nu 'xStat(2)=__' moeten weergeven. [11]
    • Ga door met het invoeren van alle x-waarden.
    • Als je de x-waarden hebt ingevuld, gebruik dan de pijltjestoetsen om naar de yStat kolom te gaan en de y-waarden in te voeren.
    • Wanneer alle gegevens zijn ingevoerd, druk je op Exit om het scherm te wissen en het Stat-menu te verlaten.
  4. De correlatiecoëfficiënt is een maat voor hoe goed de gegevens een rechte lijn benaderen. Een grafische rekenmachine met statistische functies kan zeer snel de best passende lijn en correlatiecoëfficiënt berekenen. [12]
    • Voer de Stat-functie in en druk dan op de Calc-knop. Op de TI-86 is dit [2nd][Stat][F1].
    • Kies de Lineaire Regressieberekeningen. Op de TI-86 is dit [F3], met als label 'LinR.' Op het grafische scherm wordt dan de regel 'LinR _' weergegeven met een knipperende cursor.
    • Je moet nu de namen van de twee variabelen invoeren die je wilt berekenen. Dit zijn xStat en yStat.
      • Op de TI-86, selecteer je de namenlijst ('Names') door op [2nd][List][F3] te drukken.
      • De onderste regel van je scherm zou nu de beschikbare variabelen moeten tonen. Kies [xStat] (dit is waarschijnlijk knop F1 of F2), voer dan een komma in en vervolgens [yStat].
      • Druk op Enter om de gegevens te berekenen
  5. Wanneer je op Enter drukt, zal de rekenmachine direct de volgende informatie berekenen voor de gegevens die je hebt ingevoerd: [13]
    •  : Dit is de algemene formule voor een rechte lijn. In plaats echter van de bekende 'y=mx+b,' wordt dit in omgekeerde volgorde gepresenteerd.
    • . Dit is de waarde van het snijpunt met de y-as van de lijn die het best past.
    • . Dit is de helling van de lijn die het best past.
    • . Dit is de correlatiecoëfficiënt.
    • . Dit is het aantal gegevensparen dat in de berekening is gebruikt.
    Advertentie
Methode 4
Methode 4 van 4:

De basiskennis herhalen

PDF download Pdf downloaden
  1. Correlatie verwijst naar de statistische relatie tussen twee grootheden. De correlatiecoëfficiënt is een enkel getal dat je kunt berekenen voor twee reeksen datapunten. Het getal is altijd iets tussen -1 en +1, en geeft aan hoe nauw de twee datasets met elkaar verbonden zijn. [14]
    • Als je bijvoorbeeld de lengte en leeftijd van kinderen tot ongeveer 12 jaar zou meten, zou je verwachten dat je een sterke positieve correlatie vindt. Naarmate kinderen ouder worden, hebben ze de neiging om langer te worden.
    • Een voorbeeld van een negatieve correlatie is het vergelijken van de tijd die iemand doorbrengt met het beoefenen van golfslagen en de golfscore van die persoon. Naarmate het oefenen vordert, zou de score moeten dalen.
    • Uiteindelijk zou je weinig correlatie verwachten, positief of negatief, tussen de schoenmaat van een persoon, bijvoorbeeld, en diens examencijfers.
  2. Het rekenkundig gemiddelde, of 'gemiddelde', van een verzameling gegevens, wordt berekend door alle waarden van de gegevens bij elkaar op te tellen en vervolgens te delen door het aantal waarden in de verzameling. Wanneer je de correlatiecoëfficiënt voor je gegevens wilt bepalen, moet je het gemiddelde van elke verzameling gegevens berekenen. [15]
    • Het gemiddelde van een variabele wordt aangeduid met de variabele met een horizontale lijn erboven. Dit wordt vaak aangeduid als 'x-balk' of 'y-balk' voor de gegevensverzamelingen van x en y. Als alternatief kan het gemiddelde worden aangeduid met de kleine Griekse letter μ (mu). Om het gemiddelde van -gegevenspunten van x aan te geven, kun je bijvoorbeeld μ x or μ(x).
    • Als je bijvoorbeeld een verzameling hebt van x (1,2,5,6,9,10), dan wordt het gemiddelde van deze gegevens als volgt berekend:
  3. In de statistiek meet de standaardafwijking de variatie, waarbij de spreiding van de getallen ten opzichte van het gemiddelde wordt weergegeven. Een groep getallen met een lage standaardafwijking ligt vrij dicht bij elkaar. Een groep getallen met een hoge standaardafwijking ligt meer verspreid. [16]
    • Als symbool wordt de standaardafwijking uitgedrukt met de kleine letter s of de Griekse letter σ (sigma). De standaardafwijking van de x-gegevens wordt dus geschreven als s x of σ x .
  4. De sommatie-operator is een van de meest voorkomende operatoren in de wiskunde, en geeft een som van waarden aan. Het wordt weergegeven door de Griekse hoofdletter, sigma of ∑. [17]
    • Als je bijvoorbeeld een verzameling hebt van gegevenspunten x (1,2,5,6,9,10), dan betekent ∑x:
      • 1+2+5+6+9+10 = 33
    Advertentie

Tips

  • De correlatiecoëfficiënt wordt soms de 'Pearson product-moment correlatiecoëfficiënt' genoemd, ter ere van Karl Pearson, de ontwikkelaar ervan.
  • In het algemeen staat een correlatiecoëfficiënt hoger dan 0,8 (positief of negatief) voor een sterke correlatie; een correlatiecoëfficiënt lager dan 0,5 (weer positief of negatief) staat voor een zwakke correlatiecoëfficiënt.
Advertentie

Waarschuwingen

  • Correlatie toont aan dat twee gegevensverzamelingen op een of andere manier met elkaar verbonden zijn. Wees echter voorzichtig om dit niet te interpreteren als een oorzakelijk verband. Als je bijvoorbeeld de schoenmaten van mensen en hun lengte met elkaar vergelijkt, zal je waarschijnlijk een sterke positieve correlatie vinden. Grotere mensen hebben over het algemeen grotere voeten. Dit betekent echter niet dat lang worden je voeten doet groeien, of dat grote voeten ervoor zorgen dat je lang wordt. Ze gebeuren gewoon samen.
Advertentie

Over dit artikel

Deze pagina is 9.019 keer bekeken.

Was dit artikel nuttig?

Advertentie