PDF download Pdf downloaden PDF download Pdf downloaden

De kwadratensom of SSE, is een voorlopige statistische berekening die tot andere gegevenswaarden leidt. Wanneer je een set van gegevenswaarden hebt, is het nuttig om te kunnen bepalen hoe nauw deze waarden aan elkaar verwant zijn. Je moet je gegevens in een tabel ordenen en daarna vrij eenvoudige berekeningen uitvoeren. Zodra je de SSE voor een dataset hebt gevonden, kun je vervolgens de variantie en standaardafwijking vinden.

Methode 1
Methode 1 van 3:

De SSE met de hand berekenen

PDF download Pdf downloaden
  1. De duidelijkste manier om de SSE te berekenen is door te beginnen met een tabel van drie kolommen. Label de drie kolommen , , and . [1]
  2. In de eerste kolom staan de waarden van je metingen. Vul de kolom met je meetwaarden. Dit kunnen de resultaten zijn van een experiment, een statistische studie of gewoon gegevens uit een wiskundeopgave. [2]
    • Stel in dit geval dat je met medische gegevens werkt en je een lijst hebt met de lichaamstemperatuur van tien patiënten. De verwachte normale lichaamstemperatuur is 98,6 graden. De temperatuur van tien patiënten wordt gemeten en geven de waarden 99,0, 98,6, 98,5, 101,1, 98,3, 98,6, 97,9, 98,4, 99,2 en 99,1. De temperatuur van tien patiënten wordt gemeten en geeft de waarden 99,0, 98,6, 98,5, 101,1, 98,3, 98,6, 97,9, 98,4, 99,2 en 99,1. Schrijf deze waarden in de eerste kolom.
  3. Voordat je de fout voor elke meting kunt berekenen, moet je het gemiddelde van de volledige dataset berekenen. [3]
    • Het gemiddelde van een gegevensverzameling is de som van de waarden, gedeeld door het aantal waarden in de verzameling. Dit kan symbolisch worden weergegeven, met de variabele :
    • Voor deze gegevens wordt het gemiddelde als volgt berekend:
  4. In de tweede kolom van je tabel moet je de foutwaarden voor elke data-waarde invullen. De fout is het verschil tussen de meting en het gemiddelde. [4]
    • Voor de gegeven dataset, trek je het gemiddelde, 98,87, af van elke gemeten waarde, en vul je de tweede kolom in met de resultaten. Deze tien berekeningen gaan als volgt:
  5. Zoek in de derde kolom van de tabel het kwadraat van elk van de resulterende waarden in de middelste kolom. Deze vertegenwoordigen de kwadraten van de deviatie van het gemiddelde voor elke gemeten gegevenswaarde. [5]
    • Voor elke waarde in de middelste kolom gebruik je een rekenmachine om het kwadraat te berekenen. Noteer de resultaten in de derde kolom, als volgt:
  6. De laatste stap is het vinden van de som van de waarden in de derde kolom. Het gewenste resultaat is de SSE, ofwel de som van de kwadraten van de fouten.
    • Voor deze dataset wordt de SSE berekend door de tien waarden in de derde kolom bij elkaar op te tellen:
    Advertentie
Methode 2
Methode 2 van 3:

Een Excel-spreadsheet maken om de SSE te berekenen

PDF download Pdf downloaden
  1. Je maakt een tabel met drie kolommen in Excel, met dezelfde drie kopjes als hierboven.
    • In cel A1, typ je 'Waarde' als kop.
    • In vak B1 typ je 'Deviatie' als kop.
    • In vak C1 typ je 'Deviatie in het kwadraat' als kop.
  2. In de eerste kolom moet je de waarden van je metingen invoeren. Als de set klein is, kunt je deze eenvoudig met de hand intypen. Als je een grote dataset hebt, kan het nodig zijn om de gegevens te kopiëren en in de kolom te plakken.
  3. Excel heeft een functie die het gemiddelde voor je berekent. In een lege cel onder je datatabel (het maakt niet uit welke cel je kiest), voer je het volgende in: [6]
    • =Gemiddelde(A2:___)
    • Typ geen lege ruimte. Vul die spatie in met de celnaam van je laatste gegevenspunt. Als je bijvoorbeeld 100 gegevenspunten hebt, gebruikt je de functie:
      • =Gemiddelde(A2:A101)
      • Deze functie bevat de gegevens van cel A2 tot en met A101, omdat de bovenste rij de kolomkoppen bevat.
    • Als je op Enter drukt of als je naar een andere cel in de tabel klikt, wordt de zojuist geprogrammeerde cel automatisch gevuld met het gemiddelde van je gegevenswaarden.
  4. In de eerste lege cel in de kolom 'Deviatie' moet je een functie invoeren om het verschil tussen elk gegevenspunt en het gemiddelde te berekenen. Hiertoe gebruik je de celnaam waar het gemiddelde zich bevindt. Laten we aannemen dat je voorlopig cel A104 hebt gebruikt. [7]
    • De functie voor de foutberekening, die je in cel B2 invoert, is:
      • =A2-$A$104. De dollartekens zijn nodig om er zeker van te zijn dat je vak A104 voor elke berekening vergrendelt.
  5. In de derde kolom kunt je Excel de opdracht geven om het gewenste kwadraat te berekenen. [8]
    • In cel C2, voer je de volgende functie in:
      • =B2^2
  6. Nadat je de functies in de bovenste cel van elke kolom, respectievelijk B2 en C2, hebt ingevoerd, moet je de volledige tabel invullen. Je zou de functie in elke regel van de tabel kunnen hertypen, maar dit zou veel te lang duren. Gebruik je muis, markeer de cellen B2 en C2 samen, en zonder de muisknop los te laten sleep je naar de onderste cel van elke kolom.
    • Als we ervan uitgaan dat je 100 datapunten in je tabel heeft, sleep je je muis naar de cellen B101 en C101.
    • Wanneer je de muisknop loslaat, worden de formules gekopieerd naar alle cellen van de tabel. De tabel moet automatisch worden gevuld met de berekende waarden.
  7. Kolom C van je tabel bevat alle gekwadrateerde foutwaarden. De laatste stap is om Excel de som van deze waarden te laten berekenen. [9]
    • In een cel onder de tabel, waarschijnlijk C102 in dit voorbeeld, vul je de volgende functie in:
      • =Som(C2:C101)
    • Als je op Enter klikt of wegklikt in een andere cel van de tabel, krijg je de SSE-waarde van je gegevens.
    Advertentie
Methode 3
Methode 3 van 3:

SSE relateren aan andere statistische gegevens

PDF download Pdf downloaden
  1. Het vinden van de SSE voor een dataset is over het algemeen een bouwsteen voor het vinden van andere, meer bruikbare, waarden. De eerste daarvan is variantie. De variantie is een meting die aangeeft hoeveel de gemeten gegevens afwijken van het gemiddelde. Het is eigenlijk het gemiddelde van de gekwadrateerde verschillen ten opzichte van het gemiddelde. [10]
    • Omdat de SSE de som van de gekwadrateerde fouten is, kun je het gemiddelde (dat is de variantie) vinden, gewoon door te delen door het aantal waarden. Als je echter de variantie van een steekproefreeks berekent, in plaats van een volledige populatie, deel je de variantie door (n-1) in plaats van door n. Dus:
      • Variantie = SSE/n, als je de variantie van een volledige populatie berekent.
      • Variantie = SSE/(n-1), als je de variantie van een steekproef van gegevens berekent.
    • Voor het steekproefprobleem van de temperatuur van de patiënten kunnen we aannemen dat 10 patiënten slechts een steekproef vormen. Daarom wordt de variantie dan als volgt berekend:
  2. De standaarddeviatie is een veelgebruikte waarde die aangeeft in hoeverre de waarden van een gegevensverzameling afwijken van het gemiddelde. De standaarddeviatie is de vierkantswortel van de variantie. Bedenk dat de variantie het gemiddelde is van de gekwadrateerde foutmetingen. [11]
    • Daarom kun je, nadat je de SSE hebt berekend, de standaarddeviatie als volgt vinden:
    • Voor de steekproef van de temperatuurmetingen kun je de standaarddeviatie als volgt vinden:
  3. Dit artikel heeft zich gericht op datasets die slechts één enkele waarde tegelijk meten. In veel studies zal je echter mogelijk twee afzonderlijke waarden vergelijken. Je wilt dan bijvoorbeeld weten hoe die twee waarden zich tot elkaar verhouden, niet alleen tot het gemiddelde van de dataset. Deze waarde is de covariantie. [12]
    • De berekeningen voor covariantie zijn te gedetailleerd om hier te kunnen worden beschreven, behalve om op te merken dat je de SSE voor elk gegevenstype zult gebruiken en die daarna gaat vergelijken. Voor een meer gedetailleerde beschrijving van de covariantie en de betrokken berekeningen, kun je artikelen over dit onderwerp op wikiHow vinden .
    • Als voorbeeld van het gebruik van covariantie, zou je de leeftijd van de patiënten in een medisch onderzoek kunnen vergelijken met de effectiviteit van een medicijn bij het verlagen van de koortstemperatuur. Dan heb je één dataset van leeftijden en een tweede dataset van temperaturen. Je vindt dan de SSE voor elke dataset, en van daaruit de variantie, standaardafwijkingen en covariantie.
    Advertentie

Over dit artikel

Deze pagina is 7.407 keer bekeken.

Was dit artikel nuttig?

Advertentie