ดาวน์โหลดบทความ
ดาวน์โหลดบทความ
ในทางสถิติ “ฐานนิยม” คือ ค่ากลางของชุดข้อมูลหนึ่ง ซึ่งได้มาจากค่าของสมาชิกที่มีจำนวนมากที่สุดหรือพบบ่อยที่สุดในชุดข้อมูล ทั้งนี้บางชุดข้อมูลอาจมีฐานนิยมมากกว่าหนึ่งค่าก็ได้ โดยถ้าชุดข้อมูลใดประกอบด้วยสมาชิกที่พบบ่อยที่สุดสองค่า (มีฐานนิยมสองค่า) หรือมากกว่า เราจะก็เรียกว่า ทวิฐานนิยม (bimodal) หรือ พหุฐานนิยม (multimodal) ตามลำดับ ซึ่งถ้าคุณอยากรู้ว่าวิธีการหาฐานนิยมเป็นอย่างไร ก็มาเริ่มที่ขั้นตอนแรกกันเลย
ขั้นตอน
-
เขียนสมาชิกแต่ละตัวในชุดข้อมูลลงไป. โดยทั่วไปการหาฐานนิยมมักหาจากชุดของค่าทางสถิติหรือข้อมูลที่เป็นตัวเลข ดังนั้นก่อนหาฐานนิยม คุณต้องมีชุดของข้อมูลอยู่ในมือเสียก่อน โดยชุดข้อมูลมักประกอบด้วยสมาชิกจำนวนมาก ซึ่งยากที่จะคิดหรือจินตนาการในหัว จึงจำเป็นต้องจดข้อมูลเหล่านั้นลงกระดาษหรือพิมพ์ลงคอมพิวเตอร์ก่อน โดยถ้าคุณใช้ปากกากับกระดาษ ก็เขียนชุดข้อมูลนั้นลงไปตามลำดับ แต่ถ้าคุณใช้คอมพิวเตอร์ ก็อาจใช้สเปรดชีต (spreadsheet) ในการจัดการก็ได้
- วิธีการหาฐานนิยมของชุดข้อมูลใดๆ นั้นไม่ยากเลย เพื่อให้ง่ายต่อการเข้าใจ สมมติให้ชุดของข้อมูลประกอบด้วย 18, 21, 11, 21, 15, 19, 17, 21, 17 ซึ่งเดี๋ยวเราจะนำมันมาใช้ในขั้นตอนถัดไป
-
เรียงลำดับสมาชิกในชุดข้อมูลจากน้อยไปมาก. เพื่อให้ง่ายต่อการหาฐานนิยม คุณควรเรียงลำดับสมาชิกในชุดข้อมูลจากน้อยไปมากก่อน ซึ่งจริงๆ ไม่จำเป็นก็ได้ แต่ถ้าคุณเรียงลำดับ การหาฐานนิยมก็จะง่ายยิ่งขึ้น เพราะค่าหรือตัวเลขที่พบบ่อยๆ จะอยู่ติดกัน การเรียงลำดับนี้จำเป็นอย่างยิ่งสำหรับข้อมูลที่มีปริมาณมาก เพราะการดูข้อมูลยาวๆ แล้วหาจำนวนที่ซ้ำไปเรื่อยๆ อาจทำให้เกิดความผิดพลาดได้
- ถ้าคุณใช้กระดาษกับดินสอ การเขียนชุดข้อมูลซ้ำอีกครั้งโดยเรียงลำดับใหม่จากน้อยไปมาก จะช่วยประหยัดเวลาในการหาฐานนิยมไปได้เยอะ โดยเริ่มจากการสแกนหาตัวเลขที่มีค่าน้อยที่สุดในชุดข้อมูล พอเจอแล้วก็ขีดตัวเลขนั้นทิ้ง แล้วนำมาเขียนเป็นเลขตัวแรกในชุดข้อมูลใหม่ ทำแบบนี้ไปเรื่อยๆ จากค่าน้อยสุดไปยังค่ามากสุด จากนั้นเช็คให้แน่ใจว่าเขียนครบทุกตัวแล้ว
- ถ้าคุณใช้คอมพิวเตอร์ก็ยิ่งง่ายใหญ่ เพราะในโปรแกรมสเปรดชีตต่างๆ จะมีฟังก์ชันในการจัดลำดับข้อมูลจากน้อยไปมาก เพียงคลิกแค่ไม่กี่ครั้ง โปรแกรมนี้ก็จะเรียงลำดับข้อมูลให้ใหม่ตามที่คุณต้องการ
- จากชุดข้อมูลที่เราสมมติขึ้นมาเป็นตัวอย่างในขั้นตอนที่แล้ว เมื่อนำมาเรียงลำดับ ก็จะได้ชุดข้อมูลใหม่ดังนี้ 11, 15, 17, 17, 18, 19, 21, 21, 21
-
นับจำนวนของสมาชิกแต่ละตัวในชุดข้อมูล. นับจำนวนหรือความถี่ของสมาชิกแต่ละตัวที่ปรากฏในชุดข้อมูล เสร็จแล้วหาสมาชิกที่มีจำนวนมากที่สุดหรือปรากฏบ่อยครั้งที่สุด ซึ่งถ้าชุดข้อมูลมีจำนวนสมาชิกค่อนข้างน้อย การหาค่าที่ปรากฏบ่อยครั้งที่สุดก็จะทำได้อย่างรวดเร็ว เพราะหลังจากเรียงลำดับ ค่าดังกล่าวจะอยู่ติดกัน ซึ่งสังเกตเห็นได้อย่างชัดเจน
- ถ้าคุณใช้กระดาษกับดินสอ ก็นำดินสอมาวงค่าที่เหมือนกันซึ่งอยู่ติดกัน เพื่อแบ่งเป็นกลุ่มๆ จากนั้นนับจำนวนของค่าที่ปรากฏอยู่ในวง แล้วเขียนจำนวนดังกล่าวไว้เหนือวงนั้น แต่ถ้าคุณใช้โปรแกรมสเปรดชีต ก็นับและพิมพ์จำนวนครั้งที่ปรากฏของแต่ละค่าไว้ในตารางด้านข้าง หรือไม่ก็ใช้ฟังก์ชันหาความถี่ของแต่ละค่าก็ได้
- จากชุดข้อมูลตัวอย่าง 11, 15, 17, 17, 18, 19, 21, 21, 21 จะเห็นได้ว่า 11 มีหนึ่งจำนวน 15 มีหนึ่งจำนวน 17 มีสองจำนวน 18 มีหนึ่งจำนวน 19 มีหนึ่งจำนวน และ 21 มีสามจำนวน ดังนั้น 21 จึงมีจำนวนมากที่สุดในชุดข้อมูลนี้
-
หาค่าที่มีจำนวนมากที่สุดหรือพบบ่อยที่สุด. เมื่อคุณรู้ว่าแต่ละค่ามีจำนวนเท่าไหร่แล้ว ก็หาค่าที่มีจำนวนมากที่สุดหรือมีความถี่มากที่สุด ซึ่งค่าดังกล่าวก็จะเป็น ฐานนิยมในชุดข้อมูลนั้นๆ ทั้งนี้ควรจำไว้ว่า ฐานนิยมในชุดข้อมูลหนึ่งอาจมีมากกว่าหนึ่งค่าก็ได้ โดยถ้ามีสองค่าก็จะเรียกว่า ทวิฐานนิยม (bimodal) หรือถ้ามีสามค่าก็จะเรียกว่า ไตรฐานนิยม (trimodal) ฯลฯ
- จากชุดข้อมูลตัวอย่าง 11, 15, 17, 17, 18, 19, 21, 21, 21 จะเห็นได้ว่า 21 มีจำนวนมากที่สุดหรือพบบ่อยที่สุด ดังนั้น ฐานนิยมของชุดข้อมูลนี้คือ 21
- แต่ถ้ามีค่าอื่นนอกเหนือจาก 21 มีสามจำนวน เหมือนกัน แล้วล่ะก็ (เช่น มี 17 เพิ่มมาอีกจำนวน) 21 กับจำนวนนั้นก็จะเป็นฐานนิยม ทั้งคู่
-
อย่าสับสนระหว่างฐานนิยมกับค่าเฉลี่ยและมัธยฐาน. ค่าเฉลี่ย มัธยฐาน และฐานนิยม มักถูกกล่าวถึงพร้อมกันเสมอ เวลาพูดถึงแนวคิดในการหาค่ากลางทางสถิติ และด้วยเหตุที่เป็นค่ากลางเหมือนกัน อีกทั้งในบางชุดข้อมูล ค่าเฉลี่ย มัธยฐาน หรือฐานนิยม อาจเป็นค่าเดียวกันก็ได้ ดังนั้นจึงทำให้หลายคนสับสน อย่างไรก็ตาม ไม่ว่าฐานนิยมจะมีค่าเท่ากับค่าเฉลี่ยหรือมัธยฐานหรือไม่ เราก็ต้องคำนึงไว้เสมอว่าแนวความคิดเกี่ยวกับค่ากลางในแต่ละแบบนั้นแตกต่างกัน ลองดูรายละเอียดด้านล่าง
- การหา ค่าเฉลี่ย ของชุดข้อมูล เราสามารถหาค่าเฉลี่ยได้โดยการนำผลรวมของสมาชิกทุกตัวในชุดข้อมูล มาหารด้วยจำนวนสมาชิกทั้งหมด เพื่อให้ง่ายต่อการเข้าใจ สมมติให้ชุดข้อมูลประกอบด้วย 11, 15, 17, 17, 18, 19, 21, 21, 21 ดังนั้นค่าเฉลี่ยมีค่าเท่ากับ (11 + 15 + 17 + 17 + 18 + 19 + 21 + 21 + 21) ÷ 9 = 160 ÷ 9 = 17.78 (สาเหตุที่เราหารด้วย 9 ก็เพราะในชุดข้อมูลมีสมาชิกทั้งหมด 9 ตัว)
- การหา มัธยฐาน ของชุดข้อมูล มัธยฐานคือ “ค่าที่อยู่ตรงกลาง” เมื่อเรียงลำดับชุดข้อมูลจากมากไปน้อยหรือน้อยไปมาก โดยจะอยู่ตรงกึ่งกลางระหว่างค่าที่น้อยกว่ากับค่าที่มากกว่า จากชุดข้อมูลที่สมมติขึ้น 11, 15, 17, 17, 18, 19, 21, 21, 21 จะเห็นได้ว่า 18 คือมัธยฐาน เนื่องจากอยู่ตรงกึ่งกลางของชุดข้อมูล คือเป็นจุดกึ่งกลางระหว่างค่าที่น้อยกว่า 4 จำนวน กับค่าที่มากกว่า 4 จำนวน ทั้งนี้ถ้าชุดข้อมูลมีจำนวนสมาชิกเป็นเลขคู่ มัธยฐานก็จะเป็นค่าเฉลี่ยของสองค่าที่อยู่ตรงกลาง
โฆษณา
-
จำไว้ว่า ถ้าทุกค่ามีจำนวนเท่ากัน แสดงว่าชุดข้อมูลนั้นไม่มีฐานนิยม. ถ้าทุกค่าในชุดข้อมูลมีจำนวนหรือความถี่เท่ากัน แสดงว่าชุดข้อมูลนั้นไม่มีฐานนิยม เนื่องจากไม่มีค่าใดที่มีจำนวนมากกว่าหรือปรากฏบ่อยครั้งกว่าค่าอื่น ตัวอย่างเช่นชุดข้อมูลที่ทุกค่ามีแค่จำนวนเดียว หรือทุกค่ามีสองจำนวน หรือสามจำนวน ฯลฯ
- สมมติให้ชุดข้อมูลประกอบด้วย 11, 15, 17, 18, 19, 21 จะเห็นได้ว่าแต่ละค่ามีแค่จำนวนเดียว ดังนั้นจึง ' ไม่มีฐานนิยม และถ้าสมมติให้ชุดข้อมูลประกอบด้วย 11, 11, 15, 15, 17, 17, 18, 18, 19, 19, 21, 21 ก็จะเห็นได้ว่าทุกค่ามีสองจำนวนเท่ากัน ดังนั้นจึงไม่มีฐานนิยมเช่นกัน
-
จำไว้ว่า แม้ชุดข้อมูลจะไม่ได้เป็นตัวเลขหรือจำนวน แต่เราก็ยังสามารถหาฐานนิยมได้. โดยปกติข้อมูลที่ใช้ในทางสถิติมักเป็นข้อมูล quantitative ซึ่งอยู่ในรูปของตัวเลข ถึงกระนั้น ก็มีบางชุดข้อมูลที่ไม่ได้อยู่ในรูปของตัวเลข กล่าวคือฐานนิยมสามารถเป็นอะไรก็ได้ที่มีจำนวนมากที่สุดหรือปรากฏบ่อยครั้งที่สุดในชุดข้อมูล [1] X แหล่งข้อมูลอ้างอิง ดังนั้นบางชุดข้อมูลจึงสามารถหาฐานนิยมได้ ขณะที่ไม่สามารถหาค่าเฉลี่ยหรือมัธยฐานได้เลย
- ตัวอย่างเช่นการสำรวจทางชีวภาพเพื่อตรวจเช็คจำนวนของพันธุ์ไม้แต่ละชนิดในสวนสาธารณะ ซึ่งสามารถเขียนเป็นชุดข้อมูลได้ดังนี้ ซีดาร์, อัลเดอร์, ซีดาร์, ไพน์, ซีดาร์, ซีดาร์, อัลเดอร์, อัลเดอร์, ไพน์, ซีดาร์ (เราเรียกชุดข้อมูลดังกล่าวว่า ข้อมูลระดับนามบัญญัติ (nominal scale) เนื่องจากเป็นข้อมูลที่สามารถแบ่งกลุ่มได้โดยดูจากชื่อ) เราสามารถสรุปได้ว่าชุดข้อมูลนี้มี ซีดาร์ เป็นฐานนิยม เพราะว่ามีจำนวนมากที่สุดคือ 5 ต้น ขณะที่อัลเดอร์มี 3 ต้น และไพน์มี 2 ต้น
- จำไว้ว่า ตัวอย่างที่ยกขึ้นมาด้านบน ไม่สามารคำนวณหาค่าเฉลี่ยและมัธยฐานได้ เนื่องจากเป็นข้อมูลที่ไม่ใช่ตัวเลข
-
จำไว้ว่า ถ้ามีการแจกแจงฐานนิยมเดี่ยวแบบสมมาตร (unimodal symmetric distributions) แล้วล่ะก็ ฐานนิยม ค่าเฉลี่ย และมัธยฐาน จะมีค่าเท่ากัน. จากที่กล่าวไว้ด้านบน ในบางกรณี ค่ากลางทั้งสามแบบอาจมีค่าเท่ากันก็ได้ ตัวอย่างเช่นกรณีที่ความถี่ของข้อมูลสามารถพล็อตลงไปในกราฟ แล้วออกมาอยู่ในรูปเส้นโค้งที่สมมาตร (เช่น เส้นการกระจายตัวแบบโค้งปกติ (Gaussian curve) หรือเส้นโค้งรูประฆัง) ฐานนิยม ค่าเฉลี่ย และมัธยฐาน จะมีค่าเท่ากัน เนื่องจากกราฟที่แสดงฟังก์ชันการแจกแจง (distribution function) มีความสัมพันธ์กับลักษณะของข้อมูล โดยข้อมูลที่มีความถี่น้อยจะอยู่ริมซ้ายและขวา ส่วนข้อมูลที่มีความถี่มากจะอยู่ตรงกลาง ดังนั้นฐานนิยมจึงอยู่ตรงกึ่งกลางของเส้นโค้ง ซึ่งเป็นจุดที่เส้นโค้งสูงสุดด้วย เพราะเป็นค่าที่มีจำนวนหรือความถี่มากที่สุด และด้วยเหตุที่เส้นโค้งมีความสมมาตร จุดที่เป็นฐานนิยมจึงเป็นมัธยฐานเช่นกัน (เพราะอยู่ตรงกึ่งกลางของชุดข้อมูล) นอกจากนี้ยังเป็นค่าเฉลี่ยอีกด้วย (เพราะเมื่อนำชุดข้อมูลมาคำนวณหาค่าเฉลี่ยแล้วก็มีค่าเท่ากับฐานนิยม)
- ตัวอย่าง: สมมติให้ชุดข้อมูลประกอบด้วย 1, 2, 2, 3, 3, 3, 4, 4, 5 ถ้าเรานำข้อมูลนี้ไปพล็อตในกราฟแสดงการแจกแจง เราก็จะได้เส้นโค้งแบบสมมาตรหรือเส้นโค้งรูประฆัง และเนื่องจากแกน x แสดงค่าของข้อมูล แกน y แสดงความถี่ เมื่อ 3 มีจำนวนมากที่สุดคือสามจำนวน ดังนั้นจุดสูงสุดของเส้นโค้งจะอยู่ที่แกน x = 3; y = 3 แล้วลดหลั่นลงมาตามความถี่ของแต่ละค่า (x = 2, x = 4; y = 2 และ x = 1, x = 5; y = 1) เพราะฉะนั้นจึงเห็นได้ว่า 3 คือ ฐานนิยม ของชุดข้อมูลนี้ และเนื่องจาก 3 อยู่ตรงกึ่งกลางระหว่างค่าที่น้อยกว่ากับค่าที่มากกว่า ดังนั้น 3 จึงเป็น มัธยฐาน ด้วย นอกจากนี้เมื่อคิดค่าเฉลี่ยแล้วก็มีค่าเท่ากับ 1 + 2 + 2 + 3 + 3 + 3 + 4 + 4 + 5 = 27 ÷ 9 = 3 ซึ่งจะเห็นได้ว่า 3 ก็เป็น ค่าเฉลี่ย เช่นกัน
- ในกรณีข้างต้น ใช้ไม่ได้กับกรณีที่ฐานนิยมมีมากกว่าหนึ่งค่า เพราะถ้าฐานนิยมมีตั้งแต่สองค่าขึ้นไป ก็ไม่มีทางที่จะเท่ากับค่าเฉลี่ยและมัธยฐานได้เลย เนื่องจากค่าเฉลี่ยกับมัธยฐานมีได้เพียงค่าเดียวเท่านั้น
โฆษณา
เคล็ดลับ
- ฐานนิยมอาจจะมีมากกว่าหนึ่งค่าก็ได้
- ถ้าสมาชิกทุกตัวในชุดข้อมูลมีเพียงหนึ่งจำนวนหรือมีจำนวนเท่ากัน แสดงว่าไม่มีฐานนิยม
โฆษณา
สิ่งของที่ใช้
- กระดาษ
- ดินสอ
- ยางลบ
ข้อมูลอ้างอิง
เกี่ยวกับวิกิฮาวนี้
มีการเข้าถึงหน้านี้ 162,335 ครั้ง
โฆษณา