ดาวน์โหลดบทความ ดาวน์โหลดบทความ

ความแปรปรวนคือการวัดว่าชุดข้อมูลนั้นมีการกระจายตัวออกไปอย่างไร มันมีประโยชน์เวลาใช้สร้างตัวอย่างทางสถิติ เนื่องจากความแปรปรวนต่ำเป็นสัญญาณว่าคุณอาจมีการบีบอัดข้อมูลมากเกินไปจนไม่อาจทำนายผลได้ [1] บทความวิกิฮาวบทนี้จะสอนคุณว่าจะคำนวณความแปรปรวนได้อย่างไร

วิธีการ 1
วิธีการ 1 ของ 2:

คำนวณความแปรปรวนของกลุ่มตัวอย่างหนึ่ง

ดาวน์โหลดบทความ
  1. ในกรณีส่วนใหญ่ นักสถิติจะเข้าถึงได้แต่กลุ่มตัวอย่าง หรือเป็นสับเซ็ตของจำนวนประชากรทั้งหมดที่พวกเขากำลังศึกษา เช่น แทนที่จะวิเคราะห์ปริมาณ "ราคาของรถยนต์ทุกคันในเยอรมนี" นักสถิติจะหาราคาแบบสุ่มจากรถยนต์ไม่กี่พันคัน เขาสามารถใช้กลุ่มตัวอย่างนี้ไปคาดการณ์ราคารถยนต์ของเยอรมนีอย่างใกล้เคียงได้ แต่มันจะไม่ได้เป็นตัวเลขที่แท้จริงเป๊ะๆ
    • ตัวอย่าง: วิเคราะห์ตัวเลขของจำนวนมัฟฟิ่นที่ถูกขายในแต่ละวันของโรงอาหาร คุณสุ่มตัวอย่างหกวันได้ผลออกมาดังนี้: 38, 37, 36, 28, 18, 14, 12, 11, 10.7, 9.9. นี่เป็นแค่กลุ่มตัวอย่าง มิใช่จำนวนประชากรทั้งหมด เนื่องจากคุณไม่มีข้อมูลทุกวันนับแต่โรงอาหารเปิดขาย
    • หากคุณมีข้อมูล ทั้งหมด ของประชากรทั้งหมด ข้ามไปยังวิธีการด้านล่างแทน
  2. ความแปรปรวนของชุดข้อมูลจะบอกคุณให้รู้ว่าข้อมูลนั้นมีการกระจายตัวอย่างไร ยิ่งความแปรปรวนใกล้เคียงกับศูนย์ แสดงว่าแต่ละจุดข้อมูลนั้นอยู่ใกล้ชิดกันเป็นกลุ่มก้อนมากกว่า เวลาจะใช้ชุดข้อมูลตัวอย่างนั้น ให้ใช้สูตรต่อไปนี้คำนวณความแปรปรวน: [2]
    • = ∑[( - x̅) ] / (n - 1)
    • คือความแปรปรวน ความแปรปรวนจะวัดเป็นหน่วยยกกำลังสอง
    • แทนที่จุดข้อมูลในชุดข้อมูล
    • ∑, หมายถึง "รวม" จะบอกคุณให้คำนวณพจน์ต่อไปนี้สำหรับค่าแต่ละค่าของ แล้วบวกมันเข้าด้วยกัน
    • x̅ คือค่าเฉลี่ยของกลุ่มตัวอย่าง
    • n คือจำนวนสมาชิกของข้อมูล
  3. คำนวณหาค่าเฉลี่ยของกลุ่มตัวอย่าง . สัญลักษณ์ x̅ หรือ "x-bar" หมายถึงค่าเฉลี่ยของกลุ่มตัวอย่าง [3] คำนวณเหมือนกับที่คุณหาค่าเฉลี่ยใดๆ: บวกค่าทั้งหมดของจุดข้อมูลเข้าด้วยกัน แล้วหารด้วยจำนวนสมาชิกของข้อมูลนั้น
    • ตัวอย่าง: เริ่มต้นด้วยการบวกจุดข้อมูลแต่ละตัวเข้าด้วยกัน: 17 + 15 + 23 + 7 + 9 + 13 = 84
      จากนั้นหารคำตอบที่ได้ด้วยจำนวนสมาชิกของข้อมูล ในกรณีนี้คือหก: 84 ÷ 6 = 14
      ค่าเฉลี่ยของกลุ่มตัวอย่าง = x̅ = 14
    • คุณอาจมองว่าค่าเฉลี่ยเป็นเหมือน "จุดกึ่งกลาง" ของข้อมูล หากกลุ่มข้อมูลจับกลุ่มรวมตัวใกล้ค่าเฉลี่ย ความแปรปรวนก็จะต่ำ หากมันกระจายห่างออกจากค่าเฉลี่ย ก็แสดงว่าความแปรปรวนสูง
  4. ตอนนี้ได้เวลาต้องคำนวณ - x̅ โดยที่ คือจุดข้อมูลแต่ละตัวในชุดข้อมูล คำตอบแต่ละตัวจะบอกคุณถึงค่าเบี่ยงเบนจากค่าเฉลี่ย หรือพูดในภาษาทั่วไปคือ มันห่างจากค่าเฉลี่ยแค่ไหน [4] .
    • ตัวอย่าง:
      - x̅ = 17 - 14 = 3
      - x̅ = 15 - 14 = 1
      - x̅ = 23 - 14 = 9
      - x̅ = 7 - 14 = -7
      - x̅ = 9 - 14 = -5
      - x̅ = 13 - 14 = -1
    • วิธีการตรวจนั้นง่ายมาก เพราะคำตอบที่คุณได้ควรรวมกันแล้วเป็นศูนย์ ทั้งนี้มาจากนิยามของค่าเฉลี่ยนั่นเอง เนื่องจากคำตอบที่เป็นลบ (ห่างจากค่าเฉลี่ยไปยังจำนวนที่ต่ำกว่า) จะหักลบพอดีกับคำตอบที่เป็นบวก (ห่างจากค่าเฉลี่ยไปยังจำนวนที่สูงกว่า)
  5. ดังที่บอกไว้ข้างต้น ค่าเบี่ยงเบนที่คุณรวบรวมมา ( - x̅) รวมกันแล้วเท่ากับศูนย์ นั่นหมายถึง "ค่าเบี่ยงเบนเฉลี่ย" จะรวมกันได้ศูนย์เช่นเดียวกันเสมอ มันจึงไม่ได้บอกอะไรแก่เราเลยว่าข้อมูลมีการกระจายตัวเช่นไร เพื่อแก้ปัญหานี้ ให้ใส่กำลังสองกับค่าเบี่ยงเบนแต่ละตัว นี่จะทำให้มันกลายเป็นจำนวนบวกทั้งหมด ดังนั้น ค่าบวกและลบจะได้ไม่หักลบกันเองจนกลายเป็นศูนย์ [5]
    • ตัวอย่าง:
      ( - x̅)
      - x̅)
      9 2 = 81
      (-7) 2 = 49
      (-5) 2 = 25
      (-1) 2 = 1
    • ตอนนี้คุณมีค่า ( - x̅) สำหรับจุดข้อมูลแต่ละตัวในกลุ่มตัวอย่าง
  6. ตอนนี้ถึงเวลาคำนวณตัวเศษทั้งหมดของสูตร: ∑[( - x̅) ] ตัวซิกม่าพิมพ์ใหญ่, ∑, จะบอกเราถึงผลรวมค่าของพจน์ต่อไปนี้สำหรับแต่ละค่าของ คุณได้ทำการคำนวณ ( - x̅) สำหรับแต่ละค่าของ ในกลุ่มตัวอย่างแล้ว ดังนั้นที่คุณต้องทำก็เพียงรวมผลลัพธ์ที่ได้เข้าด้วยกัน
    • ตัวอย่าง: 9 + 1 + 81 + 49 + 25 + 1 = 166 .
  7. หารด้วย n – 1 โดยที่ n คือจำนวนสมาชิกของชุดข้อมูล. เมื่อก่อนนักสถิติจะหารแค่ n เมื่อจะคำนวณความแปรปรวนของกลุ่มตัวอย่าง มันจะให้ค่าเฉลี่ยของค่าเบี่ยงเบนยกกำลังสอง ซึ่งเหมาะสมสำหรับความแปรปรวนของกลุ่มตัวอย่างนั้น แต่อย่าเพิ่งลืมว่ากลุ่มตัวอย่างนั้นเป็นเพียงการคาดคะเนจำนวนประชากรทั้งหมดที่มากกว่านั้น หากคุณสุ่มกลุ่มตัวอย่างอีกชุดแล้วทำการคำนวณแบบเดิม คุณอาจได้ผลที่แตกต่างกัน กลายเป็นว่า การหารด้วย n - 1 แทนที่จะเป็นแค่ n จะทำให้ได้ผลการคาดคะเนความแปรปรวนของจำนวนประชากรทั้งหมดได้ดีกว่า การแก้ไขนี้ทำกันทั่วจนปัจจุบันได้รับการยอมรับว่าเป็นนิยามของความแปรปรวนของกลุ่มตัวอย่าง [6]
    • ตัวอย่าง: มีจำนวนสมาชิกค่าข้อมูลในกลุ่มตัวอย่างอยู่หก ดังนั้น n = 6
      ความแปรปรวนของกลุ่มตัวอย่าง = 33.2
  8. โปรดสังเกตว่า เนื่องจากมีเลขยกกำลังอยู่ในสูตร ความแปรปรวนจึงวัดเป็นหน่วยยกกำลังสองของข้อมูลเดิม มันอาจจะยากแก่การทำความเข้าใจอยู่หน่อย การใช้ค่าเบี่ยงเบนมาตรฐานจึงมักมีประโยชน์ แต่คุณก็ไม่ได้เสียแรงเปล่า เพราะค่าเบี่ยงเบนมาตรฐานนั้นนิยามว่าเป็นรากที่สองของความแปรปรวน นั่นคือสาเหตุที่เขียนความแปรปรวนของกลุ่มตัวอย่างเป็น และค่าเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่างเป็น
    • ตัวอย่างเช่น ค่าเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่างข้างต้น = s = √33.2 = 5.76.
    โฆษณา
วิธีการ 2
วิธีการ 2 ของ 2:

คำนวณความแปรปรวนของจำนวนประชากรทั้งหมด

ดาวน์โหลดบทความ
  1. คำว่า "ประชากร" หมายถึงจำนวนชุดทั้งหมดของกลุ่มสมาชิกที่มีความเกี่ยวข้อง เช่น หากคุณกำลังศึกษาอายุของผู้อาศัยอยู่ในรัฐเท็กซัส จำนวนประชากรทั้งหมดจะต้องรวมอายุของผู้อยู่ในเท็กซัสทุกคน คุณจะต้องสร้างตารางจัดเก็บข้อมูลที่ใหญ่มากสำหรับชุดข้อมูลจำนวนมากเช่นนี้ เราจะยกตัวอย่างชุดข้อมูลที่เล็กกว่านั้นให้ดู:
    • ตัวอย่าง: มีอ่างปลาทั้งหมดหกอ่างภายในห้องจัดแสดงของพิพิธภัณฑ์สัตว์น้ำ อ่างปลาทั้งหกนั้นประกอบไปด้วยประชากรปลาทั้งหมดดังนี้:





  2. เนื่องจากประชากรทั้งหมดมีอยู่ในฐานข้อมูล สูตรนี้จึงจะทำให้ได้ความแปรปรวนของประชากรที่ตรงพอดี เพื่อแยกมันออกจากความแปรปรวนแบบสุ่มตัวอย่าง (ซึ่งเป็นเพียงการคาดคะเน) นักสถิติจึงใช้ตัวแปรต่างกันออกไป: [7]
    • σ = (∑( - μ) ) / n
    • σ = ความแปรปรวนของประชากร นี่เป็นเครื่องหมายซิกม่าตัวพิมพ์เล็กยกกำลังสอง ความแปรปรวนนั้นวัดด้วยหน่วยยกกำลังสอง
    • แทนจุดข้อมูล
    • พจน์ที่อยู่ภายใน ∑ จะถูกคำนวณสำหรับค่าแต่ละค่าของ แล้วนำมารวมกัน
    • μ เป็นค่าเฉลี่ยของประชากร
    • n เป็นจำนวนสมาชิกในประชากร
  3. เมื่อวิเคราะห์ประชากร สัญลักษณ์ μ ("มิว") แทนที่ค่าเฉลี่ยเลขคณิต ในการหาค่าเฉลี่ยนั้น ให้บวกค่าของพจน์สมาชิกเข้าด้วยกัน แล้วหารด้วยจำนวนของสมาชิก
    • คุณสามารถคิดว่าค่าเฉลี่ยนั้นเป็น "การถัวเฉลี่ย" ก็ได้ แต่โปรดระวัง เพราะคำนี้มีนิยามได้หลายแบบในคณิตศาสตร์
    • ตัวอย่าง: ค่าเฉลี่ย = μ = = 10.5
  4. จุดข้อมูลที่อยู่ใกล้กับค่าเฉลี่ยจะทำให้ความแตกต่างใกล้เคียงกับศูนย์ ทำการลบซ้ำในแต่ละจุดข้อมูล แล้วคุณจะเริ่มมองภาพออกว่าข้อมูลมีการกระจายตัวขนาดไหน
    • ตัวอย่าง:
      - μ = 5 - 10.5 = -5.5
      - μ = 5 - 10.5 = -5.5
      - μ = 8 - 10.5 = -2.5
      - μ = 12 - 10.5 = 1.5
      - μ = 15 - 10.5 = 4.5
      - μ = 18 - 10.5 = 7.5
  5. ตอนนี้บางคำตอบจากขั้นตอนที่แล้วจะกลายเป็นค่าลบ และบางตัวเป็นค่าบวก หากคุณวาดภาพข้อมูลลงบนเส้นตัวเลข ตัวเลขสองกลุ่มนี้จะแทนที่ตัวเลขที่อยู่ข้างซ้ายของค่าเฉลี่ยกับตัวเลขที่อยู่ข้างขวาของค่าเฉลี่ย ซึ่งมันจะไม่มีประโยชน์ต่อการคำนวณความแปรปรวน เนื่องจากมันจะหักลบกันเองจนหมด จึงให้ใส่ยกกำลังสองเข้าไปในตัวเลขทุกตัวเพื่อให้มันกลายเป็นค่าบวกแทน
    • ตัวอย่าง:
      ( - μ) สำหรับค่าแต่ละค่าของ i จาก 1 ถึง 6:
      (-5.5) = 30.25
      (-5.5) = 30.25
      (-2.5) = 6.25
      (1.5) = 2.25
      (4.5) = 20.25
      (7.5) = 56.25
  6. ตอนนี้คุณจะมีค่าของจุดข้อมูลแต่ละตัวที่สัมพันธ์ (ทางอ้อม) ว่าจุดข้อมูลนั้นห่างจากค่าเฉลี่ยขนาดไหน หาค่าเฉลี่ยของค่าเหล่านี้โดยรวมมันเข้าด้วยกัน แล้วหารด้วยจำนวนสมาชิกของค่านั้น
    • ตัวอย่าง:
      ความแปรปรวนของประชากร = 24.25
  7. หากคุณไม่แน่ใจว่ามันจะตรงกับสูตรในตอนต้นของวิธีนี้หรือเปล่า ลองเขียนโจทย์ทั้งหมดออกมาเป็นแบบละเอียดก็ได้:
    • หลังจากหาความแตกต่างจากค่าเฉลี่ยและยกกำลังสองแล้ว คุณมีค่า ( - μ) , ( - μ) , และต่อไปเรื่อยๆ จนถึง ( - μ) , ที่ซึ่ง เป็นจุดข้อมูลตัวสุดท้ายในกลุ่ม
    • ในการหาค่าเฉลี่ยของค่าเหล่านี้ คุณบวกทั้งหมดเข้าด้วยกันแล้วหารด้วย n: ( ( - μ) + ( - μ) + ... + ( - μ) ) / n
    • หลังจากเขียนตัวเลขภายในสัญลักษณ์ซิกม่าแล้ว คุณจะได้ (∑( - μ) ) / n สูตรสำหรับความแปรปรวนนั่นเอง
    โฆษณา

เคล็ดลับ

  • เนื่องจากมันยากที่จะแปลผลความแปรปรวน ค่านี้จึงมักใช้เป็นจุดเริ่มต้นสำหรับการคำนวณค่าเบี่ยงเบนมาตรฐาน
  • การใช้ "n - 1" แทนที่จะเป็น "n" ในตัวหารเวลาวิเคราะห์กลุ่มตัวอย่างนั้นเป็นเทคนิคที่เรียกว่าการตรวจแก้ของเบสเซล (Bessel's correction) กลุ่มตัวอย่างเป็นเพียงการคาดคะเนจำนวนข้อมูลทั้งหมด และค่าเฉลี่ยของกลุ่มตัวอย่างจะเอนเอียงไปรับกับการคาดคะเนนั้น การตรวจแก้ให้ถูกนี้จะกำจัดการเอนเอียงนี้ [8] ทั้งนี้มันเกี่ยวข้องกับความจริงที่ว่า พอคุณเติมข้อมูล n - 1 ลงไป ตัวข้อมูล n ตัวสุดท้ายจะมีเงื่อนไขบังคับทันที เนื่องจากมีแต่ค่าเฉพาะที่จะมีผลในค่าเฉลี่ยของกลุ่มตัวอย่าง (x̅) ที่ใช้ในสูตรความแปรปรวน [9]
โฆษณา

เกี่ยวกับวิกิฮาวนี้

มีการเข้าถึงหน้านี้ 255,247 ครั้ง

บทความนี้เป็นประโยชน์กับคุณไหม

โฆษณา