الإحصاء — تدريب مقاييس الارتباط
الإحصاء — تدريب مقاييس الارتباط. أسئلة تدريبية لتعميق الفهم في مقاييس الارتباط الإحصائي. تدريب إحصاء أونلاين مع حلول كاملة وشروحات مفصلة خطوة بخطوة.
تدريب مقاييس الارتباط — معامل ارتباط بيرسون، معامل التحديد R²، الارتباط والسببية، النقاط الشاذة.
ماذا يحدث للتوزيع الطبيعي عندما يزداد σ؟
تأثير زيادة σ:
• يزداد التشتت
• يصبح المنحنى أوسع
• تنخفض القمة
• المتوسط لا يتغير
💡 σ يتحكم في التشتت وليس في الموقع.
📊 ما هو المجال الممكن لمعامل ارتباط بيرسون (r)؟
📊 مجال معامل ارتباط بيرسون:
تتراوح قيم r بين -1 و +1:
• r = +1: علاقة خطية موجبة كاملة، أي كل النقاط تقع على خط مستقيم صاعد
• r = -1: علاقة خطية سالبة كاملة، أي كل النقاط تقع على خط مستقيم هابط
• r = 0: لا توجد علاقة خطية
💡 الإشارة تدل على الاتجاه، والقيمة المطلقة تدل على القوة.
📐 ما هي صيغة مقياس لامدا (λ)؟
📐 صيغة مقياس لامدا:
λ = (E₁ − E₂) / E₁
حيث:
• E₁ = أخطاء التنبؤ دون معرفة X = n − أكبر هامش لـ Y
• E₂ = أخطاء التنبؤ مع معرفة X = Σ(مجموع العمود − أكبر قيمة في العمود)
💡 التفسير: λ يقيس نسبة تقليل أخطاء التنبؤ عند معرفة X.
📈 إذا كان r = 0.9، فما هو معامل التحديد R²؟
📈 معامل التحديد R²:
R² = r²
إذا كان r = 0.9:
R² = (0.9)² = 0.81
💡 التفسير: 81% من التباين في Y يفسَّر بواسطة العلاقة الخطية مع X.
أما 19% المتبقية فتفسَّر بعوامل أخرى.
📊 في جدول 2×2، ما مقياس الارتباط الاسمي الأنسب؟
📊 معامل فاي (φ) — حالة خاصة من كرامر:
معامل فاي مناسب فقط لجدول 2×2:
φ = √(χ² / n)
في الحقيقة، فاي هو كرامر عندما k = min(عدد الصفوف، عدد الأعمدة) = 2:
كرامر: V = √(χ² / (n·(k−1)))
عندما k = 2: V = √(χ² / n) = φ
💡 للجداول الأكبر نستخدم كرامر (V).
🔢 ما هي صيغة سبيرمان؟
🔢 صيغة معامل ارتباط سبيرمان:
rₛ = 1 − (6·Σdᵢ²) / (n·(n²−1))
حيث:
• dᵢ = فرق الرتب للمشاهدة i
• n = عدد المشاهدات
💡 خطوات الحساب:
1. رتّب X ورتّب Y
2. احسب d = رتبة X − رتبة Y
3. احسب d²
4. عوّض في الصيغة
📊 معطى: r = 0.7، sᵧ = 10. ما هو تباين القيم المتوقعة (s²ŷ)؟
📊 تباين القيم المتوقعة:
s²ŷ = r² · sᵧ²
المعطيات:
• r = 0.7
• sᵧ = 10 → sᵧ² = 100
الحساب:
s²ŷ = (0.7)² × 100 = 0.49 × 100 = 49
💡 هذا الجزء من التباين المفسَّر بواسطة X.
📈 ما هي معادلة خط الانحدار (التنبؤ)؟
📈 معادلة خط الانحدار:
ŷ = a + bx
حيث:
• b = الميل = r · (sᵧ / sₓ)
• a = الجزء المقطوع = ȳ − b·x̄
• ŷ = القيمة المتوقعة لـ Y
💡 الخط يمر دائمًا بالنقطة (x̄, ȳ).
🔗 ماذا يعني r = 0؟
🔗 تفسير r = 0:
يعني عدم وجود علاقة خطية بين المتغيرات.
⚠️ قد توجد علاقة غير خطية قوية.
💡 معامل بيرسون يقيس فقط العلاقة الخطية.
📐 معطى: x̄ = 50، ȳ = 80، b = 0.6. ما هو a؟
📐 حساب الجزء المقطوع:
a = ȳ − b·x̄
a = 80 − (0.6 × 50) = 80 − 30 = 50
💡 معادلة الانحدار: ŷ = 50 + 0.6x
📊 ما العلاقة بين تباين القيم المتوقعة وتباين الأخطاء؟
📊 تفكيك التباين:
sᵧ² = s²ŷ + s²ₑ
التباين المفسَّر + غير المفسَّر.
💡 هذا يفسر لماذا R² = r².
🔢 في سبيرمان، كيف يتم التعامل مع القيم المتساوية؟
🔢 القيم المتساوية:
تحصل على متوسط الرتب.
📈 معطى: r = -0.8. ماذا نستنتج؟
📈 التفسير:
الإشارة سالبة → علاقة سلبية
|r| = 0.8 → قوية
💡 علاقة خطية سلبية قوية.
📊 ما الفرق بين سبيرمان وبيرسون؟
📊 الفرق بين سبيرمان وبيرسون:
سبيرمان (rₛ):
• يقيس علاقة رتيبة، أي علاقة تصاعدية أو تنازلية وليست بالضرورة خطية
• يعتمد على الرتب
• مناسب للمتغيرات الرتبية
• أكثر مقاومة للقيم المتطرفة
بيرسون (r):
• يقيس فقط علاقة خطية
• يعتمد على القيم الأصلية
• مناسب للمتغيرات الفئوية/النسبية
📐 معطى: r = 0.5، sₓ = 4، sᵧ = 8. ما ميل خط الانحدار (b)؟
📐 حساب ميل خط الانحدار:
الصيغة: b = r · (sᵧ / sₓ)
المعطيات:
• r = 0.5
• sₓ = 4
• sᵧ = 8
الحساب:
b = 0.5 × (8 / 4)
b = 0.5 × 2 = 1
💡 كل زيادة بمقدار وحدة واحدة في X تتنبأ بزيادة وحدة واحدة في Y.
🔗 معطى: E₁ = 40، E₂ = 20. ما هو مقياس لامدا؟
🔗 حساب مقياس لامدا:
الصيغة: λ = (E₁ − E₂) / E₁
المعطيات:
• E₁ = 40، أخطاء دون معرفة X
• E₂ = 20، أخطاء مع معرفة X
الحساب:
λ = (40 − 20) / 40
λ = 20 / 40 = 0.5
💡 التفسير: معرفة X تقلل أخطاء التنبؤ بـ Y بنسبة 50%.
📊 متى نفضّل استخدام سبيرمان بدل بيرسون؟
📊 متى نستخدم سبيرمان؟
يكون سبيرمان أفضل من بيرسون عندما:
• توجد قيم متطرفة — سبيرمان أكثر مقاومة لها
• البيانات لا تتوزع توزيعًا طبيعيًا
• المتغيرات رتبية وليست فئوية/نسبية
• العلاقة رتيبة لكنها ليست خطية
💡 سبيرمان يعتمد على الرتب، لذلك هو أقل حساسية للقيم المتطرفة.
📈 ما العلاقة بين r و b، أي ميل خط الانحدار؟
📈 العلاقة بين r و b:
b = r · (sᵧ / sₓ)
بما أن sᵧ و sₓ هما دائمًا موجبان لأنهما انحرافان معياريان:
• إذا كان r > 0 → b > 0، ميل موجب
• إذا كان r < 0 → b < 0، ميل سالب
• إذا كان r = 0 → b = 0، خط أفقي
💡 r و b لهما دائمًا نفس الإشارة.
🔗 ما الصحيح بخصوص الارتباط والسببية؟
🔗 الارتباط ≠ السببية:
العلاقة الإحصائية القوية لا تثبت أن متغيرًا واحدًا يسبب الآخر.
أسباب ممكنة للارتباط:
• X يسبب Y
• Y يسبب X
• عامل ثالث Z يسبب كليهما
• المصادفة
💡 مثال كلاسيكي: مبيعات المثلجات وحوادث الغرق مترابطتان، لكن المثلجات لا تسبب الغرق. كلاهما يرتفع بسبب حرارة الصيف.
📐 إذا كان r² = 0.64، فما تباين الأخطاء كنسبة من التباين الكلي؟
📐 حساب تباين الأخطاء:
R² = r² يمثل نسبة التباين المفسَّر.
إذا كان R² = 0.64:
• التباين المفسَّر: 64%
• تباين الأخطاء، أي التباين غير المفسَّر: 1 − 0.64 = 36%
الصيغة:
s²ₑ = (1 − r²) · sᵧ²
💡 36% من التباين في Y ناتج عن عوامل أخرى غير X.