Pdf downloaden
Pdf downloaden
Met Spearmans rangcorrelatiecoëfficiënt kun je zien of twee variabelen gerelateerd zijn met een monotone functie (d.w.z. dat als het ene getal toeneemt, het andere getal ook toeneemt of vice versa). Om Spearmans rangcorrelatiecoëfficiënt uit te rekenen moet je datasets ordenen en vergelijken om Σd 2 vinden, om vervolgens die waarde in te voeren in de standaard- of vereenvoudigde versie van de formule voor Spearmans rangcorrelatiecoëfficiënt. Je kunt deze coëfficient ook uitrekenen met Excel-formules of R-opdrachten.
Stappen
-
Teken je gegevenstabel. Hiermee orden je de informatie die je nodig hebt om Spearmans rangcorrelatiecoëfficiënt uit te rekenen. Je hebt nodig:
- 6 kolommen met koppen, zoals hierboven aangegeven.
- Net zoveel rijen als je gegevensparen hebt.
-
Vul de eerste twee kolommen met je gegevensparen.
-
Rangschik de datapunten van de eerste kolom in de derde kolom, van 1 tot n (het totaal aantal datapunten dat je hebt). Geef het laagste nummer positie 1, het volgende nummer positie 2, enzovoorts.
-
Doe met de vierde kolom hetzelfde als in stap 3, maar rangschik nu de tweede kolom.
-
Als je twee (of meer) datapunten met dezelfde waarde in een kolom hebt, pak dan het gemiddelde van de posities die die datapunten normaal gesproken zouden hebben, en geef de datapunten dit gemiddelde als hun nieuwe positie.
In het voorbeeld rechts zijn er twee vijven die normaal gesproken positie 2 en 3 zouden hebben. Het zijn twee dezelfde nummers, dus pak het gemiddelde van hun posities. Het gemiddelde van 2 en 3 is 2,5, dus geef beide vijven positie 2,5.
-
Als je twee (of meer) datapunten met dezelfde waarde in een kolom hebt, pak dan het gemiddelde van de posities die die datapunten normaal gesproken zouden hebben, en geef de datapunten dit gemiddelde als hun nieuwe positie.
-
Bereken in de kolom ‘d’ het verschil tussen de twee posities in elk gegevenspaar. Oftewel, als eentje positie 1 heeft en de ander positie 3, is het verschil 2. (Positief of negatief maakt niet uit, aangezien we dit verschil in de volgende stap gaan kwadrateren.)
-
Kwadrateer de waardes in de d-kolom en noteer deze waarden in de d 2 -kolom.
-
Kies een van de onderstaande formules:
- Als er in de vorige stappen geen gelijke datapunten voorkwamen, voer dan Σd 2
in in de eenvoudige formule voor Spearmans rangcorrelatiecoëfficiënt
en vul voor ‘n’ het aantal gegevensparen in om je antwoord te vinden.
- Als er in de vorige stappen wél gelijke datapunten voorkwamen, gebruik dan de standaardformule voor Spearmans rangcorrelatiecoëfficiënt:
- Als er in de vorige stappen geen gelijke datapunten voorkwamen, voer dan Σd 2
in in de eenvoudige formule voor Spearmans rangcorrelatiecoëfficiënt
-
9Interpreteer het resultaat. Dit kan variëren tussen -1 en 1.
- Dicht bij -1 – Negatieve correlatie.
- Dicht bij 0 – Geen lineaire correlatie.
- Dicht bij 1 – Positieve correlatie.
Advertentie
-
1Maak nieuwe kolommen met de posities van de bestaande kolommen. Bijvoorbeeld: als je je data hebt in Kolom A2:A11, gebruik je de formule ‘=RANK(A2,A$2:A$11)’ en breid je het bereik uit over al je rijen en kolommen.
-
2Behandel gelijke datapunten zoals omschreven in stap 3 en 4 van methode 1.
-
3Maak in een nieuwe cel een correlatieberekening tussen de twee kolommen met een formule als ‘=CORREL(C2:C11,D2:D11)’. In dit geval zijn C en D de positie-kolommen. In de correlatie-cel verschijnt dan Spearmans rangcorrelatiecoëfficiënt.Advertentie
-
1
-
2Sla je data op als een CSV-bestand, met de data die je wilt correleren in de eerste twee kolommen. Je kunt dit doen met het ‘Opslaan als’-menu.
-
3Open de R-editor. Als je in de terminal werkt, voer dan simpelweg R uit. Als je op je bureaublad zit, klik dan op het R-logo.
-
4Typ de volgende opdrachten:
- d <- read.csv("NAAM_VAN_JE_CSV.csv") en druk op enter
- cor(rank(d[,1]),rank(d[,2]))
Advertentie
Tips
- Voor de meeste datasets heb je minstens vijf gegevensparen nodig om een trend vast te kunnen stellen (in het voorbeeld werden slechts drie paren gebruikt om het voorbeeld makkelijker te maken).
Advertentie
Waarschuwingen
- Spearmans rangcorrelatiecoëfficiënt toont alleen maar de correlatiesterkte aan als de datapunten continu toe- of afnemen. Als het spreidingsdiagram van de datapunten een andere trend vertoont, zal Spearmans rangcorrelatiecoëfficiënt de correlatie niet correct weergeven.
- Deze formule gaat uit van de aanname dat er geen gelijke datapunten zijn. Als er wel gelijke datapunten zijn, zoals in het voorbeeld hierboven, gebruik dan de volgende definitie: de product-momentcorrelatiecoëfficiënt voor de rangnummers.
Advertentie
Over dit artikel
Deze pagina is 5.335 keer bekeken.
Advertentie