Website can be closed on 12th to 14th Jan 2025 due to server maintainance work.
आँकड़ों में फैलाव (Dispersion in Statistics)
फैलाव (Dispersion) उस सीमा को संदर्भित करता है, जिसके भीतर किसी डेटा सेट के अंक केंद्रीय मान (जैसे, औसत, मध्यिका या मोड) से भिन्न होते हैं या फैलते हैं। फैलाव को समझना महत्वपूर्ण है क्योंकि यह डेटा की विविधता के बारे में जानकारी प्रदान करता है, यह बताता है कि डेटा बिंदु एक-दूसरे से और केंद्रीय प्रवृत्ति से कितने भिन्न हैं। कम फैलाव यह दर्शाता है कि डेटा बिंदु एक-दूसरे के निकट हैं, जबकि उच्च फैलाव यह संकेत करता है कि मानों की एक विस्तृत श्रृंखला है।
फैलाव के मापने का महत्व
- विविधता को समझना: यह डेटा में भिन्नता की डिग्री को समझने में मदद करता है।
- डेटा सेटों की तुलना: विभिन्न डेटा सेटों की भिन्नता के आधार पर तुलना की जा सकती है, जो वित्त, गुणवत्ता नियंत्रण और अनुसंधान जैसे क्षेत्रों में महत्वपूर्ण है।
- आंकड़ों में अनुमान: फैलाव के माप जनसंख्या के डेटा से नमूना डेटा का अनुमान लगाने में महत्वपूर्ण होते हैं।
- निर्णय लेने में: यह डेटा में संभावित भिन्नता को समझने के लिए जोखिम आकलन और निर्णय लेने में मदद करता है।
फैलाव के मापने के तरीके
फैलाव को मापने के कई तरीके हैं, जिनमें निम्नलिखित शामिल हैं:
1. रेंज (Range)
- परिभाषा: रेंज डेटा सेट में उच्चतम और न्यूनतम मान के बीच का अंतर है।
- सूत्र:
रेंज = अधिकतम मान – न्यूनतम मान - उदाहरण:
डेटा सेट: 10, 15, 20, 25, 30
रेंज = 30 – 10 = 20 - लाभ:
- गणना और समझने में आसान।
- नुकसान:
- चरम मानों (आउटलेयर्स) के प्रति संवेदनशील, जो रेंज को प्रभावित कर सकते हैं।
2. विविधता (Variance)
- परिभाषा: विविधता औसत के साथ डेटा बिंदुओं के वर्ग अंतर का माप है। यह यह मापता है कि डेटा बिंदु औसत से कितने भिन्न होते हैं।
- सूत्र: जनसंख्या के लिए: σ² = Σ(X – μ)² / N नमूने के लिए: s² = Σ(X – X̄)² / (n – 1) जहाँ:
- σ² = जनसंख्या की विविधता
- s² = नमूने की विविधता
- X = व्यक्तिगत डेटा बिंदु
- μ = जनसंख्या का औसत
- X̄ = नमूने का औसत
- N = जनसंख्या का आकार
- n = नमूने का आकार
- उदाहरण:
डेटा सेट: 10, 15, 20
औसत = (10 + 15 + 20) / 3 = 15
विविधता = [(10 – 15)² + (15 – 15)² + (20 – 15)²] / 3
= [25 + 0 + 25] / 3 = 16.67 - लाभ:
- सभी डेटा बिंदुओं और उनके अंतर को ध्यान में रखता है।
- नुकसान:
- यह डेटा की मूल इकाइयों में नहीं होता, जिससे व्याख्या करना कठिन होता है।
3. मानक विचलन (Standard Deviation)
- परिभाषा: मानक विचलन विविधता का वर्गमूल है और यह डेटा के मूल इकाइयों में फैलाव का माप प्रदान करता है।
- सूत्र:
जनसंख्या के लिए:
σ = √(σ²)
नमूने के लिए:
s = √(s²) - उदाहरण:
पिछले उदाहरण को जारी रखते हुए,
मानक विचलन = √16.67 ≈ 4.08 - लाभ:
- इसे व्याख्या करना आसान है क्योंकि यह मूल डेटा के समान इकाई में होता है।
- नुकसान:
- यह भी आउटलेयर्स के प्रति संवेदनशील होता है।
4. इंटरक्वार्टाइल रेंज (Interquartile Range – IQR)
- परिभाषा: इंटरक्वार्टाइल रेंज मध्य 50% डेटा का फैलाव मापता है, जो आउटलेयर्स से कम प्रभावित होता है।
- सूत्र: IQR = Q₃ – Q₁ जहाँ:
- Q₁ = पहला क्वार्टाइल (25वां प्रतिशत)
- Q₃ = तीसरा क्वार्टाइल (75वां प्रतिशत)
- उदाहरण:
डेटा सेट: 10, 15, 20, 25, 30
Q₁ = 15 और Q₃ = 25
IQR = 25 – 15 = 10 - लाभ:
- आउटलेयर्स के प्रति मजबूत और विकृत डेटा के लिए बेहतर फैलाव माप प्रदान करता है।
- नुकसान:
- डेटा के पूर्ण रेंज को ध्यान में नहीं रखता।
5. मीन एब्सोल्यूट डेविएशन (Mean Absolute Deviation – MAD)
- परिभाषा: मीन एब्सोल्यूट डेविएशन प्रत्येक डेटा बिंदु और औसत के बीच के औसत मूल्य का माप है।
- सूत्र:
MAD = Σ|X – X̄| / n - उदाहरण:
डेटा सेट: 10, 15, 20
औसत = 15
MAD = (|10 – 15| + |15 – 15| + |20 – 15|) / 3
= (5 + 0 + 5) / 3 = 3.33 - लाभ:
- डेटा के समान इकाई में फैलाव को स्पष्ट रूप से समझने में मदद करता है।
- नुकसान:
- मानक विचलन और विविधता की तुलना में कम सामान्य रूप से उपयोग किया जाता है।
फैलाव के मापों की तुलना
माप | विवरण | आउटलेयर्स के प्रति संवेदनशीलता | उपयोगिता |
---|---|---|---|
रेंज | उच्चतम और न्यूनतम मान के बीच का अंतर | उच्च | फैलाव का त्वरित सारांश |
विविधता | औसत से वर्ग अंतर का औसत | उच्च | डेटा की भिन्नता को समझना |
मानक विचलन | विविधता का वर्गमूल | उच्च | फैलाव का व्याख्यात्मक माप |
इंटरक्वार्टाइल रेंज (IQR) | मध्य 50% डेटा का फैलाव | निम्न | विकृत वितरणों के लिए मजबूत माप |
मीन एब्सोल्यूट डेविएशन (MAD) | औसत से न्यूनतम भिन्नताओं का औसत | मध्यम | औसत भिन्नता का सहज माप |
निष्कर्ष
फैलाव सांख्यिकी में एक महत्वपूर्ण अवधारणा है जो डेटा की भिन्नता को समझने में मदद करती है। विभिन्न तरीकों जैसे रेंज, विविधता, मानक विचलन, इंटरक्वार्टाइल रेंज, और मीन एब्सोल्यूट डेविएशन के माध्यम से फैलाव को मापकर, सांख्यिकीविद डेटा बिंदुओं के वितरण और फैलाव के बारे में जानकारियाँ प्राप्त कर सकते हैं। प्रत्येक माप के अपने फायदे और नुकसान हैं, और किस माप का उपयोग करना है, यह डेटा सेट की प्रकृति और विश्लेषण की विशिष्ट आवश्यकताओं पर निर्भर करता है।
संदर्भ
- गुप्ता, एस. सी., & कपूर, वी. के. (2014). फंडामेंटल्स ऑफ मैथेमैटिकल स्टैटिस्टिक्स. सुल्तान चंद एंड संस।
- स्पीगल, एम. आर., & स्टीफंस, एल. जे. (2018). स्टैटिस्टिक्स. मैकग्रा-हिल एजुकेशन।
- वॉलीस, डब्ल्यू. ए., & रॉबर्ट्स, आर. सी. (2020). स्टैटिस्टिकल एनालिसिस एंड डेटा डिस्प्ले. स्प्रिंगर।