ดาวน์โหลดบทความ ดาวน์โหลดบทความ

การทดสอบสมมติฐานนั้นใช้การวิเคราะห์สถิติเป็นแนวทาง นัยสำคัญเชิงสถิติ (Statistical significance) นั้นคำนวณโดยการใช้ค่าระดับความสำคัญ (p-value) ซึ่งจะบอกคุณถึงความเป็นไปได้ของผลที่กำลังถูกสังเกต ถ้าหากว่าข้อกำหนดเฉพาะเจาะจง (สมมติฐานหลัก) นั้นเป็นความจริง [1] ถ้าหากค่า p-value นี้น้อยกว่าระดับการทดสอบนัยสำคัญ (มักอยู่ที่ 0.05) แล้ว ผู้ทดลองสามารถสันนิษฐานได้ว่าสมมติฐานหลักนั้นผิดและยอมรับในสมมติฐานรองแทน การใช้แบบทดสอบ t-test ง่ายๆ นั้นจะทำให้คุณสามารถคำนวณค่า p-value และพิจารณานัยสำคัญระหว่างกลุ่มชุดข้อมูลที่แตกต่างกันสองกลุ่มได้

ส่วน 1
ส่วน 1 ของ 3:

กำหนดการทดลอง

ดาวน์โหลดบทความ
  1. ขั้นตอนแรกในการประเมินนัยสำคัญเชิงสถิตินั้นคือการให้คำนิยามคำถามที่คุณกำลังมองหาคำตอบและระบุสมมติฐานลงไป สมมติฐานคือข้อความจำเพาะเกี่ยวกับข้อมูลการทดลองและความแตกต่างที่อาจเกิดขึ้นได้ในกลุ่มตัวอย่างประชากร สำหรับการทดลองใดๆ แล้ว จะต้องมีทั้งสมมติฐานหลักกับสมมติฐานรอง [2] โดยทั่วไปแล้ว คุณจะต้องเปรียบเทียบตัวอย่างสองกลุ่มเพื่อดูว่ามันเหมือนกันหรือแตกต่างกันอย่างไร
    • สมมติฐานหลักหรือสมมติฐานเพื่อการทดสอบ (H 0 ) มักจะระบุว่าไม่มีความแตกต่างระหว่างชุดข้อมูลสองกลุ่มของคุณ ตัวอย่าง: นักเรียนที่อ่านหนังสือมาก่อนจะเข้าเรียนไม่ได้คะแนนในการสอบปลายภาคที่ดีกว่า
    • สมมติฐานรองหรือสมมติฐานแย้ง (H a ) เป็นด้านตรงข้ามของสมมติฐานหลักและเป็นข้อความที่คุณพยายามจะใช้ข้อมูลทางการทดลองมาสนับสนุน ตัวอย่าง: นักเรียนที่อ่านหนังสือมาก่อนจะเข้าเรียนจะทำคะแนนในการสอบปลายภาคได้ดีกว่า
  2. ตั้งระดับนัยสำคัญเพื่อตัดสินว่าข้อมูลของคุณผิดปกติอย่างไรก่อนที่จะนำมันมาคิดนัยสำคัญ. ระดับนัยสำคัญ (เรียกว่าอัลฟ่า) เป็นจุดเริ่มเปลี่ยนที่คุณตั้งขึ้นมาเพื่อตัดสินนัยสำคัญ หากค่า p-value น้อยกว่าหรือเท่ากับระดับนัยสำคัญที่ตั้งไว้ ข้อมูลนั้นก็จะถูกพิจารณาว่ามีนัยสำคัญในเชิงสถิติ [3]
    • ตามกฎทั่วไป ระดับนัยสำคัญ (หรืออัลฟ่า) มักจะตั้งยืนพื้นไว้ที่ 0.05, หมายถึงว่าความเป็นไปได้ของการสังเกตเห็นความแตกต่างในข้อมูลของคุณโดยบังเอิญจะมีเพียง 5%
    • ระดับความมั่นใจที่สูงกว่า (และดังนั้นจึงมีค่า p-value ที่ต่ำกว่า) หมายถึงผลยิ่งมีนัยสำคัญ
    • หากคุณต้องการความมั่นใจที่สูงขึ้นในข้อมูล ให้ตั้งค่า p-value ต่ำลงมาเหลือ 0.01 ค่า p-values ที่ต่ำลงมักจะถูกใช้ในการผลิตเมื่อมีการตรวจพบข้อบกพร่องในผลิตภัณฑ์ มันจำเป็นมากที่จะต้องเพิ่มความมั่นใจให้สูงเพื่อที่ทุกชิ้นส่วนจะทำงานได้ตรงตามกับที่มันควรจะเป็น
    • สำหรับการทดลองพิสูจน์สมมติฐานโดยทั่วไปนั้น ระดับนัยสำคัญที่ 0.05 เป็นสิ่งที่ยอมรับได้
  3. ตัดสินใจว่าจะใช้การทดสอบแบบทางเดียวหรือสองทาง. ข้อสันนิษฐานหนึ่งที่ t-test สร้างขึ้นก็คือว่าข้อมูลของคุณถูกแจกแจงแบบปกติหรือไม่ ข้อมูลที่มีการแจกแจงปกตินั้นจะก่อให้เกิดรูปโค้งทรงระฆังโดยที่กลุ่มตัวอย่างส่วนใหญ่จะตกอยู่ช่วงกลาง [4] t-test นั้นเป็นการทดสอบทางคณิตศาสตร์เพื่อดูว่าข้อมูลของคุณตกอยู่ด้านนอกของการแจกแจงปกติหรือไม่ ไม่ว่าจะสูงกว่าหรือต่ำกว่าใน “ขอบปลาย” ของเส้นโค้ง
    • การทดสอบแบบทางเดียวนั้นมีพลังมากกว่าการทดสอบแบบสองทาง เพราะมันทดสอบศักยภาพของความสัมพันธ์ในทิศทางเดียว (เช่นเฉพาะที่เหนือกว่ากลุ่มควบคุม) ในขณะที่การทดสอบแบบสองทางจะทดสอบศักยภาพของความสัมพันธ์ทั้งสองทาง (อย่างเช่นเอาทั้งที่อยู่เหนือกว่าและต่ำกว่ากลุ่มควบคุม) [5]
    • หากคุณไม่แน่ใจว่าชุดข้อมูลจะอยู่สูงหรือต่ำกว่ากลุ่มควบคุม ให้ใช้การทดสอบสองทาง นี่จะทำให้คุณได้ทดสอบนัยสำคัญในทิศทางทั้งสองด้าน
    • ถ้าคุณทราบว่าข้อมูลนั้นมีแนวโน้มจะไปในทิศทางไหน ก็ให้ใช้การทดสอบทางเดียว ดังตัวอย่างว่าคุณคาดหวังว่าเกรดของนักเรียนจะดีขึ้นกว่าเดิม ดังนั้นคุณก็ใช้การทดสอบทางเดียว
  4. พิจารณาขนาดกลุ่มตัวอย่างด้วยการวิเคราะห์อำนาจการทดสอบ. อำนาจของการทดสอบคือความเป็นไปได้ที่จะสังเกตผลตามที่คาดหวังไว้เมื่อได้กลุ่มตัวอย่างมาจำนวนหนึ่ง [6] จุดเริ่มเปลี่ยนทั่วไปสำหรับอำนาจการทดสอบ (หรือ β) อยู่ที่ 80% อำนาจการทดสอบสามารถคิดลัดได้โดยไม่ต้องมีข้อมูลเบื้องต้นบางอย่าง เพราะคุณต้องการข้อมูลเกี่ยวกับค่าเฉลี่ยที่คาดเอาไว้ระหว่างแต่ละกลุ่มและค่าเบี่ยงเบนมาตรฐานของพวกมัน ให้ใช้เครื่องคำนวณอำนาจการทดสอบออนไลน์เพื่อหาว่ากลุ่มตัวอย่างที่เหมาะสมสำหรับข้อมูลของคุณ [7]
    • นักวิจัยมักจะทำการศึกษาทดลองกลุ่มเล็กเพื่อให้ข้อมูลด้านอำนาจการทดสอบ และตัดสินขนาดของกลุ่มตัวอย่างที่ต้องการสำหรับการศึกษาที่ใหญ่และซับซ้อนกว่านั้น
    • ถ้าคุณไม่ได้มีเจตนาจะทำการศึกษาทดลองที่ซับซ้อน ให้ทำการประมาณค่าเฉลี่ยที่เป็นไปได้โดยยึดเอาจากการอ่านงานวิจัยที่เคยมีมา นี่จะให้คุณมีจุดเริ่มต้นที่ดีสำหรับการหาขนาดกลุ่มตัวอย่าง
    โฆษณา
ส่วน 2
ส่วน 2 ของ 3:

คำนวณส่วนเบี่ยงเบนมาตรฐาน

ดาวน์โหลดบทความ
  1. ส่วนเบี่ยงเบนมาตรฐานคือการวัดว่าข้อมูลของคุณมีการกระจายตัวอย่างไร มันจะให้ข้อมูลบอกคุณว่าจุดข้อมูลแต่ละจุดภายในกลุ่มตัวอย่างมีความคล้ายคลึงกันอย่างไร เมื่อดูแวบแรกสูตรอาจจะดูซับซ้อนไปนิด แต่ขั้นตอนต่อไปนี้จะนำคุณผ่านไปตลอดกระบวนการคิดคำนวณ สูตรคือ s = √∑((x i – µ) 2 /(N – 1))
    • s คือส่วนเบี่ยงเบนมาตรฐาน
    • ∑ แสดงว่าคุณจะต้องสรุปค่ากลุ่มตัวอย่างทั้งหมดที่เก็บรวบรวมมา
    • x i แทนค่าแต่ละตัวจากข้อมูลของคุณ
    • µ คือค่าเฉลี่ย (หรือค่ามัธยฐาน) ของชุดข้อมูลสำหรับแต่ละกลุ่ม
    • N คือจำนวนกลุ่มตัวอย่างทั้งหมด
  2. ในการคำนวณส่วนเบี่ยงเบนมาตรฐานนั้น อย่างแรกคุณจะต้องหาค่าเฉลี่ยของกลุ่มตัวอย่างในแต่ละกลุ่มก่อน ค่าเฉลี่ยนั้นจะแทนด้วยตัวอักษรกรีกว่า mu หรือ µ ในการหาก็แค่บวกค่าตัวอย่างแต่ละตัวเข้าไปแล้วหารด้วยจำนวนตัวอย่างทั้งหมด [8]
    • ตัวอย่าง ในการหาเกรดเฉลี่ยของกลุ่มที่ได้อ่านหนังสือมาก่อนจะเข้าชั้นเรียน ให้ดูข้อมูลบางตัว เพื่อความเรียบง่ายเราจะใช้ชุดข้อมูล 5 จุดข้อมูล: 90, 91, 85, 83, และ 94
    • บวกค่ากลุ่มตัวอย่างทั้งหมดเข้าด้วยกัน: 90 + 91 + 85 + 83 + 94 = 443
    • หารผลลัพธ์ด้วยจำนวนของกลุ่มตัวอย่าง, N = 5: 443/5 = 88.6
    • เกรดเฉลี่ยสำหรับกลุ่มนี้คือ 88.6
  3. ส่วนถัดไปของการคำนวณจะอยู่ตรงส่วน (x i – µ) ของสูตร คุณจะต้องนำตัวอย่างแต่ละตัวไปลบกับค่าเฉลี่ยที่เพิ่งคำนวณไป จากตัวอย่างของเราคุณจะได้ผลจากการลบห้าจำนวนด้วยกัน
    • (90 – 88.6), (91- 88.6), (85 – 88.6), (83 – 88.6), และ (94 – 88.6)
    • ตัวเลขที่คำนวณมาได้ตอนนี้คือ 1.4, 2.4, -3.6, -5.6, และ 5.4
  4. ยกกำลังสองตัวเลขแต่ละตัวแล้วบวกเข้าด้วยกัน. จำนวนใหม่ที่คุณเพิ่งคิดได้แต่ละตัวจะถูกนำมายกกำลังสอง ขั้นตอนนี้ยังเป็นการดูแลเครื่องหมายลบใดๆ อีกด้วย ถ้าเกิดหลังจากขั้นตอนนี้คุณยังมีเครื่องหมายติดลบหรือตอนท้ายเมื่อคำนวณเสร็จแล้วได้คำตอบติดลบ ก็แสดงว่าคุณอาจลืมขั้นตอนนี้ไป
    • ในตัวอย่างของเรา ตอนนี้เราจะได้จำนวนต่อไปนี้ 1.96, 5.76, 12.96, 31.36, และ 29.16
    • เมื่อรวมเลขที่ยกกำลังสองแล้วเหล่านี้ด้วยกันจะได้: 1.96 + 5.76 + 12.96 + 31.36 + 29.16 = 81.2
  5. สูตรจะหารโดย N – 1 เพราะมันเป็นการแก้ไขข้อเท็จจริงที่ว่าคุณไม่ได้นับประชากรทั้งหมด คุณแค่ใช้กลุ่มตัวอย่างของประชากรนักเรียนทั้งหมดมาทำการประมาณค่า [9]
    • ทำการลบ: N – 1 = 5 – 1 = 4
    • หาร: 81.2/4 = 20.3
  6. พอหารด้วยจำนวนกลุ่มตัวอย่างทั้งหมดลบหนึ่งแล้ว ให้ใส่เครื่องหมายกรณฑ์แก่จำนวนสุดท้ายที่ได้ นี่เป็นขั้นตอนสุดท้ายในการคำนวณส่วนเบี่ยงเบนมาตรฐาน มีโปรแกรมทางสถิติที่จะคำนวณให้คุณได้หลังจากใส่ข้อมูลดิบทั้งหมดลงไป
    • จากตัวอย่างของเรา ส่วนเบี่ยงเบนมาตรฐานของเกรดนักเรียนที่อ่านหนังสือมาก่อนจะเข้าชั้นเรียนคือ: s =√20.3 = 4.51
    โฆษณา
ส่วน 3
ส่วน 3 ของ 3:

พิจารณานัยสำคัญ

ดาวน์โหลดบทความ
  1. คำนวณความแปรปรวนระหว่างกลุ่มตัวอย่างสองกลุ่ม. มาถึงจุดนี้ ตัวอย่างนั้นคิดอยู่แต่กับกลุ่มตัวอย่างเพียงกลุ่มเดียว ถ้าคุณพยายามจะเปรียบเทียบสองกลุ่ม ก็ต้องใช้ข้อมูลจากทั้งสองกลุ่มนั้น คำนวฯส่วนเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่างที่สองและใช้มันเพื่อคำนวณความแปรปรวนระหว่างกลุ่มทดลองทั้งสองกลุ่ม สูตรสำหรับความแปรปรวนคือ s d = √((s 1 /N 1 ) + (s 2 /N 2 )) [10]
    • s d คือความแปรปรวนระหว่างสองกลุ่มตัวอย่าง
    • s 1 คือส่วนเบี่ยงเบนมาตรฐานของกลุ่มที่ 1 และ N 1 คือขนาดกลุ่มตัวอย่างของกลุ่มที่ 1
    • s 2 คือส่วนเบี่ยงเบนมาตรฐานของกลุ่มที่ 2 และ N 2 คือขนาดกลุ่มตัวอย่างของกลุ่มที่ 2
    • สำหรับตัวอย่างของเรา สมมติว่าข้อมูลจากกลุ่มที่ 2 (นักเรียนที่ไม่ได้อ่านหนังสือมาก่อนจะเข้าชั้นเรียน) มีขนาดกลุ่มตัวอย่างเท่ากับ 5 และส่วนเบี่ยงเบนมาตรฐานที่ 5.81 ความแปรปรวนจะเท่ากับ:
      • s d = √((s 1 ) 2 /N 1 ) + ((s 2 ) 2 /N 2 ))
      • s d = √(((4.51) 2 /5) + ((5.81) 2 /5)) = √((20.34/5) + (33.76/5)) = √(4.07 + 6.75) = √10.82 = 3.29
  2. t-score จะช่วยให้คุณแปลงข้อมูลให้อยู่ในรูปแบบที่สามารถใช้นำไปเปรียบเทียบกับข้อมูลอื่น โดย t-score จะช่วยให้คุณทำ t-test ที่จะให้คุณคำนวณความเป็นไปได้ของสองกลุ่มว่ามีความแตกต่างโดยนัยสำคัญระหว่างกันหรือไม่ สูตรสำหรับการหา t-score คือ: t = (µ 1 – µ 2 )/s d [11]
    • µ 1 คือค่าเฉลี่ยของกลุ่มแรก
    • µ 2 คือค่าเฉลี่ยของกลุ่มที่สอง
    • s d คือความแปรปรวนระหว่างกลุ่มตัวอย่าง
    • ใช้ค่าเฉลี่ยที่มากกว่าเป็น µ 1 เพื่อที่จะได้ไม่มีค่า t-value ติดลบ
    • สำหรับตัวอย่างของเรา สมมติว่าค่าเฉลี่ยกลุ่มตัวอย่างที่ 2 (คนที่ไม่ได้อ่าน) คือ 80 t-score คือ: t = (µ 1 – µ 2 )/s d = (88.6 – 80)/3.29 = 2.61
  3. เวลาใช้ t-score จำนวนของระดับความเป็นอิสระของกลุ่มตัวอย่างจะเป็นตัวกำหนดขนาดของกลุ่มตัวอย่าง ให้บวกจำนวนตัวอย่างของกลุ่มตัวอย่างจากแต่ละกลุ่มแล้วลบด้วยสอง สำหรับตัวอย่างของเรา ระดับความเป็นอิสระ (d.f.) คือ 8 เพราะมีห้าตัวอย่างในกลุ่มแรกและห้าตัวอย่างในกลุ่มที่สอง ((5 + 5) – 2 = 8) [12]
  4. ตารางของ t-scores [13] และระดับความเป็นอิสระสามารถหาได้ในหนังสือสถิติทั่วไปหรือในอินเทอร์เน็ตก็ได้ ดูแถวที่มีระดับความเป็นอิสระสำหรับข้อมูลของคุณและหาค่า p-value ที่ตรงกับค่า t-scoreของคุณ
    • ด้วยค่าระดับความเป็นอิสระ 8 d.f. และค่า t-score 2.61, ค่า p-value สำหรับการทดสอบทางเดียวจะอยู่ที่ระหว่าง 0.01 กับ 0.025 เนื่องจากเราตั้งระดับนัยสำคัญน้อยกว่าหรือเท่ากับ 0.05, ข้อมูลของเราจึงมีนัยสำคัญเชิงสถิติ ด้วยข้อมูลที่ได้นี้เราสามารถปัดสมมติฐานหลักตกไปและยอมรับในสมมติฐานรอง: [14] เด็กนักเรียนที่อ่านหนังสือก่อนเข้าชั้นเรียนจะได้เกรดตอนปลายภาคที่สูงกว่า
  5. นักวิจัยหลายคนทำการศุกษาตัวอย่างกลุ่มเล็กที่มีค่าวัดไม่กี่ตัวเป็นตัวช่วยให้เข้าใจว่าจะออกแบบการศึกษาที่ใหญ่ขึ้นได้อย่างไร การทำการศึกษาเพิ่มเติมโดยที่มีตัววัดค่ามากขึ้นจะช่วยเพิ่มคามมั่นใจในข้อสรุปของคุณได้
    โฆษณา

เคล็ดลับ

  • สถิติเป็นวิชาที่มีขอบเขตกว้างขวางและซับซ้อน ลงเรียนวิชาสถิติทั้งในระดับมัธยมและมหาวิทยาลัย (หรือสูงกว่านั้น) เพื่อช่วยให้เข้าใจในนัยสำคัญทางสถิติ
โฆษณา

คำเตือน

  • การวิเคราะห์นี้เจาะจงไปที่ t-test เพื่อทดสอบความแตกต่างระหว่างประชากรที่มีการกระจายตัวปกติสองกลุ่ม คุณอาจจำเป็นต้องใช้การทดสอบทางสถิติที่แตกต่างออกไปขึ้นอยู่กับความซับซ้อนของกลุ่มข้อมูลของคุณ
โฆษณา

เกี่ยวกับวิกิฮาวนี้

มีการเข้าถึงหน้านี้ 69,498 ครั้ง

บทความนี้เป็นประโยชน์กับคุณไหม

โฆษณา