Unduh PDF
Unduh PDF
Varians adalah ukuran seberapa tersebarnya data. Varians yang rendah menandakan data yang berkelompok dekat satu sama lain. Varians yang tinggi menandakan data yang lebih tersebar. Konsep ini memiliki banyak kegunaan di dalam statistik. Misalnya, membandingkan varians dari dua kelompok data (seperti hasil dari pasien laki-laki dan perempuan) adalah salah satu cara untuk menguji apakah sebuah variabel memiliki efek yang dapat diamati. [1] X Teliti sumber Varians juga berguna saat membuat model statistik, karena varians yang rendah menandakan data yang over-fitting . [2] X Teliti sumber
Langkah
-
Dapatkan data sampel. Dalam banyak kasus, ahli statistik hanya mendapatkan data sampel, atau sebagian dari populasi yang sedang mereka teliti. Misalnya, alih-alih menganalisis populasi "harga setiap mobil di Jerman", seorang ahli statistik dapat mencari harga dari sampel acak beberapa ribu mobil. Ia dapat menggunakan sampel ini untuk mendapatkan estimasi harga mobil di Jerman, namun hasilnya mungkin tidak sama dengan hasil sebenarnya.
- Contoh: Untuk menganalisis jumlah kue muffin yang terjual setiap hari di sebuah kafetaria, Anda mengumpulkan data dari enam hari acak dan memperoleh hasil sebagai berikut: 17, 15, 23, 7, 9, 13 . Data ini adalah sebuah sampel, bukan data populasi, karena Anda tidak mempunyai data penjualan setiap hari sejak kafetaria itu dibuka.
- Jika Anda memiliki "semua" data dari sebuah populasi, langsung lompat ke metode berikutnya .
-
Tuliskan rumus varians sampel. Varians dari sejumlah data menunjukkan seberapa tersebarnya data. Semakin varians mendekati nol, semakin data berkelompok. Ketika menggunakan data sampel, gunakan rumus berikut untuk menghitung varians: [3] X Teliti sumber
- = ∑[( - x̅) ] / (n - 1)
- adalah varians. Varians selalu diukur dalam unit kuadrat.
- merepresentasikan sebuah entri dalam data Anda.
- ∑, berarti "jumlah," artinya Anda memasukkan nilai dari setiap , lalu menjumlahkannya.
- x̅ adalah mean dari sampel.
- n adalah jumlah data.
-
Hitung mean dari sampel . Simbol x̅ menandakan mean dari sebuah sampel. [4] X Teliti sumber Hitung sebagaimana Anda menghitung mean: jumlahkan semua data, lalu membaginya dengan jumlah data.
- Contoh:
Mula-mula, jumlahkan semua data: 17 + 15 + 23 + 7 + 9 + 13 = 84
Lalu, bagi jawabannya dengan jumlah data, dalam contoh ini dengan enam: 84 ÷ 6 = 14.
Mean sampel = x̅ = 14 . - Anda dapat menganggap mean sebagai "titik tengah" dari data. Jika data berkumpul di sekitar mean, variansnya rendah. Jika data tersebar jauh dari mean, variansnya tinggi.
- Contoh:
Mula-mula, jumlahkan semua data: 17 + 15 + 23 + 7 + 9 + 13 = 84
-
Kurangkan nilai setiap data dengan mean. Sekarang kita menghitung - x̅, di mana adalah nilai dari tiap data. Setiap hasil menggambarkan deviasi data dari mean, atau dalam bahasa sederhana, seberapa jauh data dari mean. [5] X Teliti sumber .
- Contoh:
- x̅ = 17 - 14 = 3
- x̅ = 15 - 14 = 1
- x̅ = 23 - 14 = 9
- x̅ = 7 - 14 = -7
- x̅ = 9 - 14 = -5
- x̅ = 13 - 14 = -1 - Mudah sekali cara mengecek pekerjaan Anda, karena jumlahnya harus sama dengan nol. Ini terjadi karena definisi dari mean, jawaban negatif (nilai data lebih kecil dari mean) akan menghilangkan jawaban positif (nilai data lebih besar dari mean).
- Contoh:
-
Kuadratkan hasilnya. Seperti yang telah dijelaskan sebelumnya, jumlah dari seluruh nilai deviasi ( - x̅) akan sama dengan nol. Ini artinya "rata-rata deviasi" akan selalu sama dengan nol, dan hal ini tidak memberikan informasi apa-apa tentang sebaran data. Untuk menyelesaikan masalah ini, kita mengkuadratkan nilai setiap deviasi. Ini akan membuat angkanya menjadi positif semua, sehingga nilai negatif dan positif tidak saling menghilangkan. [6] X Teliti sumber
- Contoh:
( - x̅)
- x̅)
9 2 = 81
(-7) 2 = 49
(-5) 2 = 25
(-1) 2 = 1 - Sekarang Anda mendapatkan nilai ( - x̅) untuk setiap data dari sampel.
- Contoh:
-
Cari jumlah dari kuadrat nilai. Sekarang kita akan menghitung nilai seluruh pembilang di dalam rumus: ∑[( - x̅) ]. Huruf besar sigma, ∑, berarti jumlah dari semua nilai secara berurutan . Anda telah menghitung ( - x̅) untuk setiap nilai pada sampel, jadi sekarang Anda tinggal menjumlahkannya.
- Contoh: 9 + 1 + 81 + 49 + 25 + 1 = 166 .
-
Bagi dengan n - 1, di mana n adalah jumlah data. Dulu, para ahli statistik hanya membagi dengan n ketika menghitung varians sampel. Dengan demikian kita mendapat nilai rata-rata dari deviasi kuadrat, yang cocok untuk menghitung varians sampel tersebut. Tetapi ingatlah, sebuah sampel hanyalah estimasi dari populasi yang lebih besar. Jika kita mengambil sampel lain secara acak dan melakukan perhitungan, hasilnya akan berbeda. Tampaknya, membagi dengan n - 1 ketimbang n memberi perkiraan nilai varians yang lebih baik untuk populasi, yang sebetulnya ingin kita ketahui. Koreksi ini sudah menjadi begitu umum sehingga sekarang diterima sebagai definisi dari varians. [7] X Teliti sumber
- Contoh:
Ada enam data di dalam contoh ini, jadi n = 6.
Varians sampel adalah = 33.2
- Contoh:
Ada enam data di dalam contoh ini, jadi n = 6.
-
Pahami varians dan standar deviasi. Ingatlah bahwa di dalam rumus ini ada pengkuadratan, varians diukur dalam unit kuadrat dari data asli. Hal ini membuat kita sulit untuk memahami data secara intuitif. Oleh karena itu ada baiknya kita menggunakan standar deviasi. Anda tidak perlu repot-repot, karena standar deviasi didefinisikan sebagai akar kuadrat dari varians. Oleh karena itu varians sampel dituliskan dengan , dan standar deviasi sampel dengan .
- Misalnya, standar deviasi sampel dari contoh di atas adalah = s = √33.2 = 5.76.
Iklan
-
Mulailah dengan sejumlah data populasi. Istilah "populasi" mengacu pada semua pengamatan yang relevan. Misalnya, jika kita ingin meneliti tentang usia penduduk Texas, populasi yang kita gunakan adalah usia setiap orang yang tinggal di Texas. Kita mungkin butuh membuat lembar kerja ( spreadsheet ) untuk data sebesar itu, tetapi mari kita gunakan data yang lebih kecil sebagai contoh:
- Contoh:
Ada enam buah akuarium di dalam sebuah ruangan. Keenam akuarium tersebut terisi sejumlah ikan:
- Contoh:
Ada enam buah akuarium di dalam sebuah ruangan. Keenam akuarium tersebut terisi sejumlah ikan:
-
Tuliskan rumus varians populasi. Karena populasi memiliki semua data yang kita perlukan, rumus ini bisa kita gunakan untuk menghitung secara tepat varians populasi. Untuk membedakannya dengan varians sampel (yang hanya estimasi), ahli statistik menggunakan variabel yang berbeda: [8] X Teliti sumber
- σ = (∑( - μ) ) / n
- σ = varians populasi. Simbolnya adalah sigma dalam huruf kecil, dikuadratkan. Varians diukur dalam unit kuadrat.
- melambangkan entri dari setiap data.
- Entri di dalam ∑ dimasukkan untuk setiap nilai , lalu dijumlahkan.
- μ adalah mean dari populasi.
- n adalah jumlah data dari populasi.
-
Cari mean populasi. Ketika menganalisis sebuah populasi, simbol μ ("mu") melambangkan rata-rata aritmetik. Untuk mencari mean, jumlahkan semua data, lalu bagi dengan jumlah data.
- Anda mungkin mengira bahwa mean sama dengan "rata-rata". Berhati-hatilah sebab kata itu memiliki banyak definisi dalam matematika.
- Contoh: mean = μ = = 10.5
-
Kurangkan setiap data dengan mean. Data yang lebih dekat dengan mean akan menghasilkan selisih yang lebih dekat dengan nol. Ulangi pengurangan untuk setiap data, dan Anda dapat mulai mengamati seberapa tersebarnya data.
- Contoh:
- μ = 5 - 10.5 = -5.5
- μ = 5 - 10.5 = -5.5
- μ = 8 - 10.5 = -2.5
- μ = 12 - 10.5 = 1.5
- μ = 15 - 10.5 = 4.5
- μ = 18 - 10.5 = 7.5
- Contoh:
-
Kuadratkan setiap hasil. Sekarang kita bisa melihat bahwa beberapa angka negatif dihasilkan dari proses sebelumnya, dan beberapa yang lain positif. Jika Anda membayangkan data-data tersebut pada sebuah garis bilangan, kedua kategori ini mewakili data yang berada di sebelah kiri dan sebelah kanan mean. Hal ini tidak berguna dalam menghitung varians, karena kedua kelompok ini akan saling menghilangkan. Kuadratkanlah setiap angka supaya mereka menjadi positif.
- Contoh:
( - μ) untuk setiap nilai i dari 1 sampai 6:
(-5.5) = 30.25
(-5.5) = 30.25
(-2.5) = 6.25
(1.5) = 2.25
(4.5) = 20.25
(7.5) = 56.25
- Contoh:
-
Cari mean dari hasil. Sekarang Anda telah memperoleh sebuah nilai untuk setiap data, yang berhubungan (secara tidak langsung) dengan jarak data tersebut dari mean. Cari mean dari hasil ini dengan menjumlahkan mereka semuanya, lalu dibagi dengan jumlah angka.
- Contoh:
Varians dari populasi = 24.25
- Contoh:
-
Hubungan dengan rumus semula. Jika Anda ragu apakah perhitungan ini sama dengan rumus yang diberikan di awal, coba tuliskan seluruh perhitungan secara panjang:
- Setelah menemukan selisih dengan mean dan mengkuadratkannya, Anda mendapatkan hasil ( - μ) , ( - μ) , dan seterusnya ( - μ) , di mana adalah data terakhir.
- Carilah mean dari nilai-nilai ini, jumlahkan dan bagi dengan n: ( ( - μ) + ( - μ) + ... + ( - μ) ) / n
- Setelah menuliskan kembali pembilang dalam notasi sigma, Anda mendapatkan (∑( - μ) ) / n , yaitu rumus dari varians
Iklan
Tips
- Karena kita sulit untuk menginterpretasi nilai varians, nilai ini biasanya dipakai sebagai dasar untuk menghitung standar deviasi.
- Penggunaan "n-1" ketimbang "n" dalam penyebut ketika menganalisis sampel adalah sebuah teknik yang dikenal dengan koreksi Bessel. Sampel hanyalah sebuah perkiraan dari seluruh populasi, dan mean dari sampel mengalami bias dalam estimasi. Koreksi ini menghilangkan bias tersebut. [9] X Teliti sumber Hal ini terjadi karena begitu Anda memilih n - 1 data, data n terakhir sudah tertentu, karena hanya nilai tertentu yang dapat menghasilkan mean dari sampel (x̅) yang digunakan dalam rumus varians. [10] X Teliti sumber
Iklan
Referensi
- ↑ http://sphweb.bumc.bu.edu/otlt/MPH-Modules/BS/BS704_HypothesisTesting-ANOVA/BS704_HypothesisTesting-Anova_print.html
- ↑ http://insidebigdata.com/2014/10/22/ask-data-scientist-bias-vs-variance-tradeoff/
- ↑ https://www.youtube.com/watch?v=VgKHjVDK0uM
- ↑ http://stattrek.com/statistics/notation.aspx
- ↑ http://www.mathsisfun.com/data/standard-deviation.html
- ↑ https://www.youtube.com/watch?v=sOb9b_AtwDg
- ↑ https://www.youtube.com/watch?v=sOb9b_AtwDg
- ↑ https://www.youtube.com/watch?v=VgKHjVDK0uM
- ↑ http://datapigtechnologies.com/blog/index.php/understanding-standard-deviation-2/
Iklan