बॉक्स और व्हिस्कर प्लॉट (box and whisker plot), या बॉक्स प्लॉट, एक रेखा चित्र या डायग्राम है जिसे डेटा के एक सेट की पांच-संख्या का सारांश प्रदर्शित करने के लिए यूज़ किया जाता है। पांच-संख्या के सारांश में न्यूनतम, अधिकतम, मीडियन, और पहला व तीसरा चतुर्थक होता है। इस प्रकार के डायग्राम को स्कूल के ग्रेड या स्कोर के सांख्यिकीय या स्टैटिस्टिकल डेटा, किसी प्रक्रिया के पहले और बाद में होने वाले संख्यात्मक परिवर्तन, या इसी तरह की कुछ स्थितियों में संख्यात्मक डेटा की तुलना के लिए इस्तेमाल किया जाता है। ये डायग्राम डेटा के एक सेट का स्टैटिस्टिकल वितरण दिखाता है। इसे देखकर आप आसानी से जान सकते हैं कि डेटा एक नंबर लाइन पर किस प्रकार वितरित है। आप इसे आसानी से खुद भी बना सकते हैं!
-
डेटा एकत्र करें: मान लीजिये आपके पास 1, 3, 2, 4, और 5 नंबर हैं। हम इन नंबरों को उदाहरण के तौर पर गणना करने के लिए यूज़ करेंगे।
-
डेटा को सबसे कम से सबसे ज्यादा के क्रम में व्यवस्थित करें: अपने सब नंबरों को लें और उनको इस प्रकार क्रम में रखें कि सबसे छोटे नंबर लेफ्ट साइड में हों और सबसे बड़े नंबर राइट साइड में हों। हमारे उदाहरण में नंबरों का क्रम इस प्रकार होगा - 1, 2, 3, 4, और 5। [१] X रिसर्च सोर्स
-
डेटा सेट का बीच का नंबर या मीडियन (median) पता करें: मीडियन क्रमबद्ध डेटा के बीच का नंबर होता है (इसी लिए स्टेप 2 में हम लोगों ने सब नंबरों को एक लाइन में व्यवस्थित करा था)। उदाहरण वाले डेटा सेट में 3 नंबर सब नंबरों के बिल्कुल बीच में है। इसलिए वह इस डेटा सेट का मीडियन है। मीडियन को दूसरा चतुर्थक (second quartile) भी कहते हैं। [२] X रिसर्च सोर्स
- जिस सेट में नंबरों की संख्या विषम या ऑड (odd) होगी उसके मीडियन के एक ओर जितने नंबर होंगे उतने ही दूसरी ओर भी। 1, 2, 3, 4, 5, के डेटा सेट के लिए 3 मीडियन है और उसके पहले और बाद में 2 – 2 नंबर हैं। इस प्रकार हम पक्का बता सकते हैं कि वह सही मीडियन है।
- लेकिन अगर आपको एक ऐसे सेट का मीडियन पता करना हो जिसमें नंबरों की संख्या सम या इवन (even) है, जैसे कि 2, 4, 4, 7, 9, 10, 14, 15 का एक सेट। ऐसे में आपको दो बीच के नंबरों को लेना चाहिए और उनका औसत पता करना चाहिए। इस उदाहरण में आपको 7 और 9 नंबर लेने चाहिए क्योंकि वे दोनों बीच के नंबर हैं। उन दोनों को जोड़ें और 2 से विभाजित करें। 7 को 9 से जोड़ने पर 16 होता है, और 16 को 2 से विभाजित करने पर 8 नंबर मिलता है। इसलिए 8 इस डेटा के सेट का मीडियन है।
-
पहला और तीसरा चतुर्थक (quartile) पता करें: हमने अपने डेटा के सेट का दूसरा चतुर्थक पहले ही पता कर लिया है, वह हमारा मीडियन है। अब हमें डेटा के सेट के कम वाले आधे हिस्से का मीडियन पता करना है। हमने जो उदाहरण लिया है उसमें 3 की लेफ्ट साइड में जो दो नंबर हैं उनका मीडियन होगा। 1 और 2 नंबरों का मीडियन है (1 + 2) / 2 = 1.5। इसी प्रकार आप 3 की राइट साइड में जो दो नंबर हैं उनका मीडियन पता करें, वह है (4 + 5) / 2 = 4.5। [३] X रिसर्च सोर्स
-
प्लॉट लाइन ड्रॉ करें: इस लाइन को इतना लंबा होना चाहिए कि उसमें अपना सारा डेटा फिट करने के बाद भी दोनों ओर थोड़ी जगह बाकी रह जाये। ध्यान रखें कि आप नंबरों को सम (even) अंतरालों या इंटरवल्स पर रखें। अगर डेटा में 4.5 और 1.5, जैसे दशमलव या डेसीमल वाले नंबर हैं तो आप उनको भी ठीक से लेबल करें।
-
प्लॉट लाइन पर पहला, दूसरा, और तीसरा चतुर्थक मार्क करें: अपने पहले, दूसरे, और तीसरे चतुर्थक की वैल्यू को लें और प्लॉट लाइन पर उन नंबरों को मार्क करें। मार्क करने के लिए आपको हर चतुर्थक पर प्लॉट लाइन से हल्का सा ऊपर शुरू होने वाली एक सीधी खड़ी हुई (vertical) लाइन बनानी चाहिए। [४] X रिसर्च सोर्स
-
क्षैतिज (horizontal) लाइन्स ड्रॉ करके चतुर्थकों को जोड़ने वाला एक बॉक्स बनायें: पहले चतुर्थक के टॉप को दूसरे चतुर्थक के टॉप के जरिये जाकर तीसरे चतुर्थक के टॉप से जोड़ें। पहले चतुर्थक के नीचे के हिस्से को तीसरे चतुर्थक के नीचे के हिस्से से जोड़ें। ध्यान रखें कि ऐसा करते समय लाइन दूसरे चतुर्थक के नीचे के हिस्से से होकर जाये। [५] X रिसर्च सोर्स
-
बाहरी संख्याओं या आउटलीयर्स (outliers) को मार्क करें: डेटा के सेट में सबसे छोटा और सबसे बड़ा नंबर खोजें। इन नंबरों को प्लॉट लाइन पर मार्क करें। आपको इन पॉइंट्स को एक डॉट (dot) के रूप में मार्क करना चाहिए। हमारे उदाहरण में 1 न्यूनतम और 5 उच्चतम आउटलीयर है। [६] X रिसर्च सोर्स
-
आउटलीयर्स को एक क्षैतिज लाइन बनाकर उस बॉक्स से कनेक्ट करें: आउटलीयर्स को जोड़ने वाली सीधी लाइन को अनौपचारिक तौर पर बॉक्स एंड व्हिस्कर्स प्लॉट की "व्हिस्कर्स" (whiskers) कहते हैं।
-
आपका काम पूरा हो गया है: किसी भी डेटा के सेट के नंबरों के वितरण को जानने के लिए एक बॉक्स एंड व्हिस्कर्स प्लॉट को देखें। उदाहरण के तौर पर, आप ऊपर के बॉक्स और ऊपर की व्हिस्कर की साइज़ को देखकर आसानी से पता कर सकते हैं कि डेटा के सेट के नंबर ऊपर वाले चतुर्थक में ज्यादा एकत्र होते हैं या नहीं। बॉक्स एंड व्हिस्कर प्लॉट्स को बार ग्राफ्स (bar graphs) और हिस्टोग्राम्स (histograms) की जगह इस्तेमाल किया जा सकता है। [७] X रिसर्च सोर्स
रेफरेन्स
- ↑ https://www.fusioncharts.com/resources/chart-primers/box-and-whisker-chart
- ↑ https://www.mathgoodies.com/lessons/vol8/median
- ↑ http://web.mnstate.edu/peil/MDEV102/U4/S36/S363.html
- ↑ https://www150.statcan.gc.ca/n1/edu/power-pouvoir/ch12/5214889-eng.htm
- ↑ https://asq.org/quality-resources/box-whisker-plot
- ↑ https://www.shmoop.com/basic-statistics-probability/box-whisker-plots.html
- ↑ http://flowingdata.com/2008/02/15/how-to-read-and-use-a-box-and-whisker-plot/