PDF download Pdf downloaden PDF download Pdf downloaden

Met Spearmans rangcorrelatiecoëfficiënt kun je zien of twee variabelen gerelateerd zijn met een monotone functie (d.w.z. dat als het ene getal toeneemt, het andere getal ook toeneemt of vice versa). Om Spearmans rangcorrelatiecoëfficiënt uit te rekenen moet je datasets ordenen en vergelijken om Σd 2 vinden, om vervolgens die waarde in te voeren in de standaard- of vereenvoudigde versie van de formule voor Spearmans rangcorrelatiecoëfficiënt. Je kunt deze coëfficient ook uitrekenen met Excel-formules of R-opdrachten.

Methode 1
Methode 1 van 3:

Handmatig

PDF download Pdf downloaden
  1. Step 1 Teken je gegevenstabel.
    Hiermee orden je de informatie die je nodig hebt om Spearmans rangcorrelatiecoëfficiënt uit te rekenen. Je hebt nodig:
    • 6 kolommen met koppen, zoals hierboven aangegeven.
    • Net zoveel rijen als je gegevensparen hebt.
  2. Step 2 Vul de eerste twee kolommen met je gegevensparen.
  3. Step 3 Rangschik de datapunten van de eerste kolom in de derde kolom, van 1 tot n (het totaal aantal datapunten dat je hebt).
    Geef het laagste nummer positie 1, het volgende nummer positie 2, enzovoorts.
  4. Step 4 Doe met de vierde kolom hetzelfde als in stap 3, maar rangschik nu de tweede kolom.
    • Step 4 Doe met de vierde kolom hetzelfde als in stap 3, maar rangschik nu de tweede kolom.
      Als je twee (of meer) datapunten met dezelfde waarde in een kolom hebt, pak dan het gemiddelde van de posities die die datapunten normaal gesproken zouden hebben, en geef de datapunten dit gemiddelde als hun nieuwe positie.
      In het voorbeeld rechts zijn er twee vijven die normaal gesproken positie 2 en 3 zouden hebben. Het zijn twee dezelfde nummers, dus pak het gemiddelde van hun posities. Het gemiddelde van 2 en 3 is 2,5, dus geef beide vijven positie 2,5.
  5. Step 5 Bereken in de kolom ‘d’ het verschil tussen de twee posities in elk gegevenspaar.
    Oftewel, als eentje positie 1 heeft en de ander positie 3, is het verschil 2. (Positief of negatief maakt niet uit, aangezien we dit verschil in de volgende stap gaan kwadrateren.)
  6. Step 6 Kwadrateer de waardes in de d-kolom en noteer deze waarden in de d2-kolom.
  7. Deze waarde is Σd 2 .
    Step 7 Tel alle datapunten in de d2-kolom bij elkaar op.
    • Als er in de vorige stappen geen gelijke datapunten voorkwamen, voer dan Σd 2 in in de eenvoudige formule voor Spearmans rangcorrelatiecoëfficiënt
      Step 8 Kies een van de onderstaande formules:

      en vul voor ‘n’ het aantal gegevensparen in om je antwoord te vinden.
      Step 8 Kies een van de onderstaande formules:
    • Als er in de vorige stappen wél gelijke datapunten voorkwamen, gebruik dan de standaardformule voor Spearmans rangcorrelatiecoëfficiënt:
      Spearman.png
  8. 9
    Interpreteer het resultaat. Dit kan variëren tussen -1 en 1.
    • Dicht bij -1 – Negatieve correlatie.
    • Dicht bij 0 – Geen lineaire correlatie.
    • Dicht bij 1 – Positieve correlatie.
    Advertentie
Methode 2
Methode 2 van 3:

In Excel

PDF download Pdf downloaden
  1. 1
    Maak nieuwe kolommen met de posities van de bestaande kolommen. Bijvoorbeeld: als je je data hebt in Kolom A2:A11, gebruik je de formule ‘=RANK(A2,A$2:A$11)’ en breid je het bereik uit over al je rijen en kolommen.
  2. 2
    Behandel gelijke datapunten zoals omschreven in stap 3 en 4 van methode 1.
  3. 3
    Maak in een nieuwe cel een correlatieberekening tussen de twee kolommen met een formule als ‘=CORREL(C2:C11,D2:D11)’. In dit geval zijn C en D de positie-kolommen. In de correlatie-cel verschijnt dan Spearmans rangcorrelatiecoëfficiënt.
    Advertentie
Methode 3
Methode 3 van 3:

Met R

PDF download Pdf downloaden
  1. 1
    Installeer R als je het nog niet hebt. (Zie https://www.r-project.org/ .)
  2. 2
    Sla je data op als een CSV-bestand, met de data die je wilt correleren in de eerste twee kolommen. Je kunt dit doen met het ‘Opslaan als’-menu.
  3. 3
    Open de R-editor. Als je in de terminal werkt, voer dan simpelweg R uit. Als je op je bureaublad zit, klik dan op het R-logo.
  4. 4
    Typ de volgende opdrachten:
    • d <- read.csv("NAAM_VAN_JE_CSV.csv") en druk op enter
    • cor(rank(d[,1]),rank(d[,2]))
    Advertentie

Tips

  • Voor de meeste datasets heb je minstens vijf gegevensparen nodig om een trend vast te kunnen stellen (in het voorbeeld werden slechts drie paren gebruikt om het voorbeeld makkelijker te maken).
Advertentie

Waarschuwingen

  • Spearmans rangcorrelatiecoëfficiënt toont alleen maar de correlatiesterkte aan als de datapunten continu toe- of afnemen. Als het spreidingsdiagram van de datapunten een andere trend vertoont, zal Spearmans rangcorrelatiecoëfficiënt de correlatie niet correct weergeven.
  • Deze formule gaat uit van de aanname dat er geen gelijke datapunten zijn. Als er wel gelijke datapunten zijn, zoals in het voorbeeld hierboven, gebruik dan de volgende definitie: de product-momentcorrelatiecoëfficiënt voor de rangnummers.
Advertentie

Over dit artikel

Deze pagina is 5.335 keer bekeken.

Was dit artikel nuttig?

Advertentie