PDF download Pdf downloaden PDF download Pdf downloaden

Covariantie is een statistische berekening om de relatie tussen twee gegevensverzamelingen inzichtelijker te maken. Stel bijvoorbeeld dat antropologen de lengte en het gewicht van een de bevolking binnen een bepaalde cultuur bestuderen. Voor elke persoon in de studie, kan de lengte en het gewicht worden weergegeven met een gegevenspaar (x, y). Deze waarden kunnen worden gebruikt in een standaardformule voor het berekenen van de covariantierelatie. In dit artikel worden eerst de berekeningen uitgelegd voor het bepalen van de covariantie van een gegevensverzameling. Vervolgens zal er worden ingegaan op twee andere geautomatiseerde manieren voor het bepalen van het resultaat.

Methode 1
Methode 1 van 4:

De covariantie met de hand berekenen middels de standaardformule

PDF download Pdf downloaden
  1. De standaardformule voor het berekenen van de covariantie is . Om deze formule te kunnen gebruiken, moet je de betekenis van de variabelen en symbolen kennen: [1]
    • - Dit symbool is de Griekse letter 'sigma'. In wiskundige functies betekent dit het optellen van een reeks van wat volgt. In deze formule betekent het Σ-teken dat je de waarden in de teller van de breuk berekent, en ze daarna allemaal optelt, waarna je het totaal deelt door de noemer. [2]
    • - Deze variabele lees je als 'x sub i'. Het subscript i stelt een teller voor. Het betekent dat je een berekening gaat doen voor elke waarde van x in je gegevensverzameling.
    • - De 'avg' geeft aan dat x(avg) de gemiddelde waarde is van alle x gegevenspunten. Het gemiddelde wordt soms ook wel geschreven als een x met een korte horizontale lijn erboven. In die stijl lees je de variabele als 'x-bar', maar het betekent nog steeds het gemiddelde van de gegevensverzameling.
    • - Deze variabele lees je als 'y sub i'. Het subscript i is de teller. Het betekent dat je een berekening gaat doen voor elke waarde van y in je gegevensverzameling.
    • - De 'avg' geeft aan dat y(avg) de gemiddelde waarde is van alle x gegevenspunten. Het gemiddelde wordt soms ook wel geschreven als een y met een korte horizontale lijn erboven. In die stijl lees je de variabele als 'y-bar', maar het betekent nog steeds het gemiddelde van de gegevensverzameling.
    • - Deze variabele is het aantal elementen in je gegevensverzameling. Vergeet niet dat bij een covariantieprobleem, een enkel 'element' is samengesteld uit zowel een x-waarde als een y-waarde. De waarde 'n' is het aantal paren van gegevenspunten, en niet van afzonderlijke getallen.
  2. Voordat aan de slag gaat, is het nuttig om je gegevens te verzamelen. Maak een tabel die uit vijf kolommen bestaat. Je moet elke kolom als volgt aangeven:
    • - Vul deze kolom met de waarden van de punten van de x-gegevens.
    • - Vul deze kolom met de waarden van de y-gegevens. Zorg dat de y-waarden met de bijbehorende x-waarden zijn uitgelijnd. Bij een covariantieprobleem is de volgorde van de gegevenspunten en het koppelen van x en y belangrijk.
    • - Laat deze kolom leeg in het begin. Je gaat deze met gegevens vullen nadat je het gemiddelde van de x-gegevens hebt berekend.
    • - Laat deze kolom in het begin nog leeg. Je gaat deze met gegevens vullen nadat je het gemiddelde van de y-gegevens hebt berekend.
    • - Laat de laatste kolom ook leeg. Deze wordt tijdens het uitwerken van de opgave gevuld.
  3. Deze verzameling voorbeeldgegevens bevat 9 getallen. Om het gemiddelde te bepalen, tel je ze bij elkaar op en deel je de som door 9. Dit geeft het resultaat 1 + 3 + 2 + 5 + 8 + 7 + 12 + 2 + 4 = 44. Wanneer je dit door 9 deelt, krijg je het gemiddelde 4,89. Dit is de waarde die je gaat gebruiken als x(avg) voor de komende berekeningen. [3]
  4. Deze y-kolom moet ook bestaan uit 9 gegevenspunten die samenvallen met de x-gegevenspunten. Bepaal het gemiddelde hiervan. Voor deze verzameling voorbeeldgegevens wordt dit 8 + 6 + 9 + 4 + 3 + 3 + 2 + 7 + 7 = 49. Deel dit totaal door 9 tot en je krijgt een gemiddelde van 5,44. Je gaat 5,44 gebruiken als de waarde van y(avg) voor de komende berekeningen. [4]
  5. Bereken de waarden . Voor elk element in de x-kolom bereken je het verschil tussen dat getal en de gemiddelde waarde. Voor dit voorbeeldprobleem betekent dit het aftrekken van 4,89 van elke x-waarde. Als het oorspronkelijke gegevenspunt kleiner is dan het gemiddelde, zal je resultaat negatief zijn. Als het oorspronkelijke gegevenspunt groter is dan het gemiddelde, dan zal het resultaat positief zijn. Zorg ervoor dat je bijhoudt welke waarden negatief zijn. [5]
    • Bijvoorbeeld, het eerste gegevenspunt in de x-kolom is 1. De in te voeren waarde op de eerste regel van de kolom is: 1 – 4,89 = -3,89.
    • Herhaal dit proces voor elk gegevenspunt. De tweede regel wordt dus: 3 - 4,89 = -1.89. De derde regel wordt: 2 - 4,89 = -2,89. Blijf dit proces voorzetten voor alle gegevenspunten. De negen getallen in deze kolom worden: -3,89, -1,89, -2,89, 0,11, 3,11, 2,11, 7,11, -2,89, -0,89.
  6. Bereken de waarden . In deze column ga je soortgelijke aftreksommen maken, met de y-gegevenspunten en het y-gemiddelde. Als het oorspronkelijke gegevenspunt kleiner is dan het gemiddelde, zal het resultaat negatief zijn. Als het oorspronkelijke gegevenspunt groter is dan het gemiddelde, dan zal je resultaat positief zijn. Zorg ervoor dat je bijhoudt welke waarden negatief zijn. [6]
    • Voor de eerste regel wordt je berekening dus: 8 -5,44, = 2,56.
    • De tweede regel wordt: 6 – 5,44 = 0,56.
    • Blijf de waarden van elkaar aftrekken tot aan het einde van de gegevenslijst. Wanneer je klaar bent, heb je als het goed is de volgende negen waarden in deze kolom: 2,56, 0,56, 3,56, -1,44, -2,44, -2,44, -3,44, 1,56, 1,56.
  7. Je vult de rijen van de laatste kolom in door het vermenigvuldigen van de getallen die je hebt berekend in de twee eerdere kolommen van en . Zorg dat je rij voor rij werkt, en de twee getallen vermenigvuldigt met de bijbehorende gegevenspunten. Let onderweg op de eventuele negatieve waarden. [7]
    • In de eerste rij van deze voorbeeldgegevens, is de die je hebt berekend -3,89, en de waarde 2,56. Het product van deze twee getallen is: -3,89 x 2,56 = -9,96.
    • Voor de tweede rij vermenigvuldig je de twee getallen: -1,88 x 0,56 = -1,06.
    • Blijf doorgaan met het rij voor rij vermenigvuldigen tot aan het einde van de gegevensverzameling. Wanneer je klaar bent zouden de negen waarden in deze kolom als volgt moeten luiden: -9,96, -1,06, -10,29, -0,16, -7,59, -5,15, -24,46, -4,51, -1,39.
  8. Dit is waar het Σ-symbool zijn intrede doet. Na het uitvoeren van alle berekeningen tot zover, tel je de resultaten bij elkaar op. Voor deze verzameling voorbeeldgegevens zou je nu negen waarden in de laatste kolom moeten hebben. Tel die negen nummers bij elkaar op. Let goed op of een getal positief of negatief is.
    • De som van deze verzameling voorbeeldgegevens zou uit moeten komen op -64,57. Schrijf dit totaal in de ruimte aan de onderkant van de kolom. Dit is de waarde van de teller van de standaard covariantieformule.
  9. De teller van de standaard covariantieformule is de waarde die je zojuist hebt berekend. De noemer wordt vertegenwoordigd door (n-1), en is één minder dan het aantal paren van de gegevens in je gegevensverzameling.
    • In dit voorbeeldprobleem zijn er negen gegevensparen, dus n is 9. Daarom is de waarde van (n-1) gelijk aan 8.
  10. De laatste stap in de berekening van de covariantie is het delen van de teller, door de noemer, . Het quotiënt is de covariantie van je gegevens. [8]
    • Voor deze verzameling voorbeeldgegevens is deze berekening: -64,57/8 = -8,07.
    Advertentie
Methode 2
Methode 2 van 4:

Berekenen covariantie met behulp van een Excel-werkblad

PDF download Pdf downloaden
  1. Covariantie is een berekening die je een paar keer met de hand moet uitvoeren, zodat je de betekenis van het resultaat begrijpt. Als je echter covariantie routinematig gaat gebruiken voor het interpreteren van gegevens, dan heb je een snellere en geautomatiseerde manier om nodig om de resultaten te verkrijgen. Het is je nu inmiddels wellicht opgevallen dat bij onze relatief kleine gegevensverzameling van slechts negen gegevensparen, de berekeningen bestonden uit twee gemiddelden, achttien afzonderlijke aftrekkingen, negen vermenigvuldigingen, een optelling, en uiteindelijk nog een deling. Dat zijn 31 relatief kleine berekeningen om de oplossing te vinden. Onderweg loop je het risico dat je negatieve tekens mist of de resultaten verkeerd overneemt, waardoor het antwoord niet meer klopt.
  2. Als je vertrouwd bent met Excel (of een ander rekenprogramma), dan kun je gemakkelijk een tabel maken voor het bepalen van de covariantie. Label de koppen van de vijf kolommen net zoals bij de berekeningen met de hand: x, y, (x(i)-x(avg)), (y(i)-y(avg)) en Product. [9]
    • Om de naamgeving te vereenvoudigen noem je de derde kolom iets als 'x verschil' en de vierde kolom 'y verschil,' zolang je de betekenis van de gegevens maar onthoudt.
    • Als de tabel in de linkerbovenhoek van het werkblad begint, dan krijgt cel A1 het label x, terwijl de andere labels doorlopen tot cel E1.
  3. Typ de gegevenswaarden in de twee kolommen x en y. Onthoud dat de volgorde van de gegevenspunten van belang is, dus moet je elke y koppelen aan de overeenkomstige waarde van x. [10]
    • De x-waarden beginnen in cel A2 en gaan door tot het aantal gegevenspunten dat je nodig hebt.
    • De y-waarden beginnen in cel B2 en gaan door tot het aantal gegevenspunten dat je nodig hebt.
  4. Excel berekent de gemiddelden zeer snel voor je. Typ in de eerste lege cel onder elke kolom met gegevens, de formule =GEMIDDELDE(A2:A___). Vul de lege ruimte met het nummer van de cel dat overeenkomt met je laatste gegevenspunt. [11]
    • Bijvoorbeeld, heb je 100 gegevenspunten, dan worden de cellen A2 tot en met A101 gevuld, dus typ je in de cel: = GEMIDDELDE(A2:A101).
    • Voor de y-gegevens typ je de formule = GEMIDDELDE(B2:B101).
    • Vergeet niet dat een formule in Excel met een '='-teken begint.
  5. In cel C2 voer je de formule in voor het berekenen van de eerste aftrekking. Deze formule wordt: =A2-___. Vul de lege ruimte met het cel-adres welke het gemiddelde bevat van de x-gegevens. [12]
    • Bijvoorbeeld, van de 100 gegevenspunten komt het gemiddelde in cel A103, zodat je formule gelijk wordt aan: =A2-A103.
  6. Hetzelfde voorbeeld volgend komt deze in cel D2. De formule wordt: =B2-B103. [13]
  7. In de vijfde kolom moet je in cel E2 de formule typen voor het berekenen van het product van de twee voorafgaande cellen. Dit wordt dan: =C2*D2. [14]
  8. Tot nu toe heb je alleen de eerste paar gegevenspunten in rij 2 geprogrammeerd. Met behulp van je muis markeer je de cellen C2, D2 en E2. Plaats je cursor op het kleine vakje in de rechterbenedenhoek totdat een plusteken wordt weergegeven. Klik op de muisknop, houd deze ingedrukt en sleep de muis naar beneden om de selectie uit te breiden en de gehele gegevenstabel te vullen. Deze stap zal de drie formules automatisch kopiëren van de cellen C2, D2 en E2 naar de hele tabel. De tabel wordt als het goed is automatisch gevuld met alle de berekeningen. [15]
  9. Je hebt de som nodig van de items in de kolom 'Product'. Typ in de lege cel direct onder het laatste gegevenspunt in die kolom de formule: =SOM(E2:E___). Vul de lege ruimte met het cel-adres van het laatste gegevenspunt. [16]
    • In het voorbeeld met 100 gegevenspunten, gaat deze formule in cel E103. Typ: =SOM(E2:E102).
  10. Je kunt Excel ook de definitieve berekening voor je laten uitvoeren. De laatste berekening in cel E103 in ons voorbeeld vertegenwoordigt de teller van de covariantieformule. Typ direct onder die cel de formule: =E103/___. Vul de lege ruimte met het aantal gegevenspunten dat je hebt. In ons voorbeeld is dit 100. Het resultaat is de covariantie van je gegevens. [17]
    Advertentie
Methode 3
Methode 3 van 4:

Met behulp van online covariantiecalculators

PDF download Pdf downloaden
  1. Diverse scholen, bedrijven of andere bronnen hebben websites die de covariantiewaarden heel gemakkelijk voor je berekenen. Gebruik de zoekterm 'covariantie calculator' in een zoekmachine.
  2. Lees de instructies op de website zorgvuldig om ervoor te zorgen dat je de gegevens correct invoert. Het is belangrijk dat je gegevensparen in volgorde worden gehouden, anders is het gegenereerde resultaat een onjuiste covariantie. Websites hebben verschillende stijlen voor het invoeren van gegevens.
    • Op de website http://ncalculators.com/statistics/covariance-calculator.htm , is er bijvoorbeeld een horizontaal vak voor het invoeren van de x-waarden en een tweede horizontaal vak voor het invoeren van de y-waarden. Je moet je gegevens gescheiden door komma's invoeren. Dus, de x-gegevensverzameling die eerder in dit artikel werd berekend, zou dan moeten worden ingevoerd als 1,3,2,5,8,7,12,2,4. De y-gegevens als 8,6,9,4,3,3,2,7,7.
    • Op een ander site, https://www.thecalculator.co/math/Covariance-Calculator-705.html , wordt je gevraagd om de x-gegevens in te voeren in het eerste vak. Gegevens worden verticaal ingevoerd, met één item per regel. Daarom ziet de invoer op deze site eruit als:
    • 1
    • 3
    • 2
    • 5
    • 8
    • 7
    • 12
    • 2
    • 4
  3. Het aantrekkelijke van deze online berekeningen is dat je na het invoeren van de gegevens meestal slechts op de knop 'Calculate' hoeft te klikken, waarna de resultaten automatisch verschijnen. De meeste sites zullen je voorzien van de tussenliggende berekeningen van x(avg), y(avg) en n.
    Advertentie
Methode 4
Methode 4 van 4:

Het interpreteren van de resultaten van de covariantie

PDF download Pdf downloaden
  1. De covariantie is een enkel statistisch cijfer welke aangeeft wat de relatie is tussen de ene gegevensverzameling en een andere. In het voorbeeld zoals genoemd in de inleiding, worden de lengte en het gewicht gemeten. Je zou verwachten dat als mensen groeien, hun gewicht ook zal toenemen, wat leidt tot een positieve covariantieweergave. Een ander voorbeeld: Stel dat gegevens worden verzameld die het aantal uren aangeven dat iemand golf oefent en de score die hij of zij behaalt. In dit geval verwacht je een negatieve covariantie, wat betekent dat als het aantal trainingsuren toenemen, de golfscore zal afnemen. (Bij golf is een lagere score beter). [18]
    • Beschouw de verzameling voorbeeldgegevens die hierboven is berekend. De resulterende covariantie is -8,07. Het minteken betekent dat met het verhogen van de x-waarden, de y-waarden de neiging hebben om te dalen. Je kunt inzien dat dit waar is, door naar een paar van de waarden te kijken. Bijvoorbeeld, de x-waarden van 1 en 2 komen overeen met de y-waarden van 7, 8 en 9. De x-waarden van 8 en 12 zijn respectievelijk gekoppeld aan de y-waarden van 3 en 2.
  2. Als het getal van de covariantiescore groot is, hetzij een groot positief getal of een groot negatief getal, dan kun je dit interpreteren als twee data-elementen dit sterk verbonden zijn, hetzij op een positieve of negatieve manier. [19]
    • De covariantie -8,07 van de verzameling voorbeeldgegevens is vrij groot. Merk op dat de gegevens variëren van 1 tot en met 12. 8 is dus een vrij groot aantal. Dit wijst op een vrij sterke relatie tussen de gegevensverzamelingen x en y.
  3. Als je resultaat een covariantie is, gelijk aan of zeer dicht bij 0, dan kun je concluderen dat de gegevenspunten geen relatie hebben. Dat wil zeggen, een toename van de ene waarde kan, maar hoeft niet te leiden tot een toename van de andere. De twee termen zijn bijna willekeurig gekoppeld. [20]
    • Stel dat je schoenmaten relateert aan examencijfers. Omdat er zo veel factoren zijn die invloed hebben op de examencijfers van een student, valt een covariantiescore in de buurt van 0 te verwachten. Dit wijst erop dat er bijna geen verband bestaat tussen de twee waarden.
  4. Om covariantie visueel te begrijpen, kun je je gegevenspunten uitzetten in een x,y-grafiek. Wanneer je dat doet, zou je vrij gemakkelijk moeten zien dat de punten, hoewel niet precies in een rechte lijn, de neiging hebben om een cluster te benaderen in een diagonale lijn van linksboven naar rechtsonder. Dit is de beschrijving van een negatieve covariantie. Je ziet ook dat de waarde van de covariantie gelijk is aan -8,07. Dit is een vrij groot aantal vergeleken met de gegevenspunten. Het hoge aantal suggereert dat de covariantie vrij sterk is, wat je kunt afleiden uit de lineaire vorm van de gegevenspunten.
    • Lees op wikiHow artikelen over het tekenen van punten in een coördinatenstelsel, om dit nog eens door te nemen.
    Advertentie

Waarschuwingen

  • Covariantie heeft een beperkte toepassing in statistiek. Het is vaak een stap in de richting van het berekenen van correlatiecoëfficiënten of andere begrippen. Wees voorzichtig met al te boude interpretaties op basis van een covariantiescore.
Advertentie

Over dit artikel

Deze pagina is 25.105 keer bekeken.

Was dit artikel nuttig?

Advertentie