الإحصاء — تقدير المعالم
نادرًا ما نستطيع قياس مجتمع بأكمله، لذا نُقدِّر معالمه من عينة. لكن ليس كل مُقدِّر جيدًا بالقدر ذاته: نريد مُقدِّرًا غير متحيز وذا تباين صغير قدر الإمكان. في هذه الصفحة سنتعلم ما هو المُقدِّر غير المتحيز وما الكفاءة، ونحسب متوسط مربعات الخطأ (MSE) وخطأ معيار المتوسط، ونرى كيف يؤثر حجم العينة في الدقة.
الخلفية والتعريفات الأساسية
المعلم (Parameter) هو قيمة عددية تصف المجتمع (كالمتوسط \(\mu\) أو التباين \(\sigma^2\))، بينما المُقدِّر (Estimator) هو صيغة تُحسَب من العينة وتُستخدم لتخمين المعلم (كمتوسط العينة \(\bar{x}\)). القيمة العددية الناتجة تُسمى التقدير النقطي.
خصائص المُقدِّر الجيد:
- عدم التحيز (Unbiased): في المتوسط عبر عينات كثيرة يُصيب المُقدِّر المعلم، أي \( E(\hat{\theta}) = \theta \). التحيز هو \( \text{Bias} = E(\hat{\theta}) - \theta \).
- الكفاءة (Efficiency): بين مُقدِّرَين غير متحيزَين، الأكفأ هو ذو التباين الأصغر — يتشتت أقل حول المعلم.
متوسط مربعات الخطأ (MSE) يقيس جودة المُقدِّر الكلية:
\[ \text{MSE}(\hat{\theta}) = \text{Var}(\hat{\theta}) + \big(\text{Bias}(\hat{\theta})\big)^2 \]للمُقدِّر غير المتحيز التحيز صفر، وبالتالي \( \text{MSE}(\hat{\theta}) = \text{Var}(\hat{\theta}) \).
متوسط العينة هو أفضل تقدير نقطي لـ\(\mu\) وهو غير متحيز: \( E(\bar{x}) = \mu \). يُقاس تشتته بـخطأ معيار المتوسط:
\[ \text{SE}(\bar{x}) = \frac{\sigma}{\sqrt{n}} \]يُقدَّر تباين المجتمع غير المتحيز بتباين العينة مع القسمة على \((n-1)\):
\[ s^2 = \frac{\sum (x_i - \bar{x})^2}{n-1} \]خطوات الحل
- الخطوة 1 — حدِّد المعلم المُقدَّر (\(\mu\), \(\sigma^2\), \(p\)) والمُقدِّر المناسب.
- الخطوة 2 — للتحقق من عدم التحيز: احسب \( E(\hat{\theta}) \) وقارنه بالمعلم؛ التساوي \(\Rightarrow\) غير متحيز.
- الخطوة 3 — لمقارنة الكفاءة بين مُقدِّرَين غير متحيزَين، اختر ذا التباين الأصغر.
- الخطوة 4 — لحساب MSE استخدم \( \text{Var} + \text{Bias}^2 \)؛ إن كان غير متحيز فـ\( \text{MSE} = \text{Var} \).
- الخطوة 5 — لخطأ معيار المتوسط اقسم \(\sigma\) على الجذر التربيعي لـ\(n\): \( \text{SE} = \frac{\sigma}{\sqrt{n}} \).
- الخطوة 6 — لحجم العينة المطلوب استخرج \(n\) من معادلة SE: \( n = \left(\frac{\sigma}{\text{SE}}\right)^2 \).
أمثلة محلولة
مثال 1: خطأ معيار المتوسط
السؤال: في مجتمع ما الانحراف المعياري \( \sigma = 20 \). نسحب عينة حجمها \( n = 25 \). ما خطأ معيار متوسط العينة؟
الحل:
- نستخدم الصيغة \( \text{SE}(\bar{x}) = \frac{\sigma}{\sqrt{n}} \).
- نعوّض: \( \text{SE} = \frac{20}{\sqrt{25}} = \frac{20}{5} \).
- نحسب: \( \frac{20}{5} = 4 \).
- ملاحظة: كلما زاد حجم العينة قلّ خطأ المعيار، لأن \(\sqrt{n}\) في المقام يكبر.
الإجابة: خطأ المعيار هو \( 4 \).
مثال 2: حجم العينة المطلوب
السؤال: نريد خطأ معيار للمتوسط لا يتجاوز \( 2 \). الانحراف المعياري للمجتمع \( \sigma = 16 \). ما حجم العينة المطلوب؟
الحل:
- ننطلق من \( \text{SE} = \frac{\sigma}{\sqrt{n}} \) ونستخرج \(n\).
- نستخرج الجذر: \( \sqrt{n} = \frac{\sigma}{\text{SE}} = \frac{16}{2} = 8 \).
- نربّع: \( n = 8^2 = 64 \).
- تحقق: \( \frac{16}{\sqrt{64}} = \frac{16}{8} = 2 \) — بالضبط المطلوب.
الإجابة: العينة المطلوبة حجمها \( n = 64 \).
مثال 3: تباين العينة من المشاهدات
السؤال: عينة من أربع مشاهدات: \( 4, 7, 9, 12 \). احسب تباين العينة غير المتحيز \( s^2 \).
الحل:
- أولًا المتوسط: \( \bar{x} = \frac{4+7+9+12}{4} = \frac{32}{4} = 8 \).
- الانحرافات عن المتوسط: \( -4, -1, 1, 4 \)؛ مربعاتها: \( 16, 1, 1, 16 \).
- مجموع مربعات الانحرافات: \( 16 + 1 + 1 + 16 = 34 \).
- نقسم على \( (n-1) = 3 \): \( s^2 = \frac{34}{3} \approx 11.33 \).
الإجابة: \( s^2 = \frac{34}{3} \approx 11.33 \).
مثال 4: MSE لمُقدِّر غير متحيز
السؤال: متوسط العينة \( \bar{x} \) مُقدِّر غير متحيز لـ\(\mu\). المعطى \( \sigma = 12 \) و\( n = 9 \). ما \( \text{MSE}(\bar{x}) \)؟
الحل:
- بما أن \( \bar{x} \) غير متحيز، التحيز صفر، وبالتالي \( \text{MSE}(\bar{x}) = \text{Var}(\bar{x}) \).
- تباين متوسط العينة هو \( \text{Var}(\bar{x}) = \frac{\sigma^2}{n} \).
- نعوّض: \( \frac{12^2}{9} = \frac{144}{9} \).
- نحسب: \( \frac{144}{9} = 16 \) (لاحظ أنه \( \text{SE}^2 = 4^2 \) أيضًا).
الإجابة: \( \text{MSE}(\bar{x}) = 16 \).
مثال 5: اختيار المُقدِّر الأكفأ
السؤال: مُقدِّران غير متحيزَين لـ\(\theta\): للمُقدِّر \(A\) تباين \( \text{Var}(A) = 9 \)، وللمُقدِّر \(B\) تباين \( \text{Var}(B) = 4 \). أيهما أفضل؟
الحل:
- كلا المُقدِّرَين غير متحيزَين، أي \( E(A) = E(B) = \theta \) — لا فرق في التحيز.
- في هذه الحالة المعيار هو الكفاءة: يُفضَّل المُقدِّر ذو التباين الأصغر.
- بما أن \( \text{Var}(B) = 4 \lt 9 = \text{Var}(A) \)، المُقدِّر \(B\) أكفأ.
- للمُقدِّرات غير المتحيزة MSE يساوي التباين، فـ\(B\) له MSE أصغر أيضًا.
الإجابة: المُقدِّر \(B\) أفضل (أكفأ، تباينه أصغر).
أخطاء شائعة
✗ خطأ شائع: حساب تباين العينة بالقسمة على \(n\) بدلًا من \((n-1)\).
✓ الطريقة الصحيحة: القسمة على \(n\) تعطي مُقدِّرًا متحيزًا نحو الأسفل (أصغر من اللازم). المُقدِّر غير المتحيز لتباين المجتمع يستخدم \((n-1)\): \( s^2 = \frac{\sum (x_i - \bar{x})^2}{n-1} \).
✗ خطأ شائع: الخلط بين الانحراف المعياري للعينة \(s\) وخطأ معيار المتوسط \(\text{SE}\).
✓ الطريقة الصحيحة: \(s\) يصف تشتت المشاهدات الفردية، بينما \( \text{SE} = \frac{\sigma}{\sqrt{n}} \) يصف تشتت المتوسط بين العينات. SE دائمًا أصغر ويتناقص بزيادة \(n\).
✗ خطأ شائع: نسيان إخراج الجذر من \(n\) وحساب \( \text{SE} = \frac{\sigma}{n} \).
✓ الطريقة الصحيحة: في المقام يقع \(\sqrt{n}\) لا \(n\). لذا مضاعفة حجم العينة أربع مرات يُقلّل خطأ المعيار مرتين فقط، لأن \( \sqrt{4} = 2 \).
نصائح للتمرين
- تلميح — لتخفيض خطأ المعيار إلى النصف يجب مضاعفة حجم العينة أربع مرات، لأن \(n\) يقع تحت الجذر.
- تلميح — المُقدِّر الجيد = غير متحيز + كفؤ. تحقق أولًا من عدم التحيز، ثم قارن التباينات لاختيار الأكفأ.
- تلميح — لتذكر MSE: \( \text{MSE} = \text{Var} + \text{Bias}^2 \). إن كان المُقدِّر غير متحيز، يُختزل MSE إلى التباين فقط.
- تلميح — لحساب حجم العينة استخدم مباشرةً \( n = \left(\frac{\sigma}{\text{SE}}\right)^2 \) وقرّب للأعلى لأقرب عدد صحيح.
ملخّص وصيغ أساسية
- مُقدِّر غير متحيز: \( E(\hat{\theta}) = \theta \).
- الكفاءة: من بين غير المتحيزَين، الأكفأ = ذو التباين الأصغر.
- MSE \( = \text{Var}(\hat{\theta}) + \text{Bias}^2 \)؛ لغير المتحيز \( \text{MSE} = \text{Var} \).
- خطأ معيار المتوسط: \( \text{SE} = \frac{\sigma}{\sqrt{n}} \).
- حجم العينة: \( n = \left(\frac{\sigma}{\text{SE}}\right)^2 \).
- تباين العينة: \( s^2 = \frac{\sum (x_i-\bar{x})^2}{n-1} \).