Practice Pearson's Correlation Coefficient

Explication étape par étape, exemples résolus et pratique illimitée.

📖 Statistique : le coefficient de corrélation de Pearson et la régression

📈 Le coefficient de Pearson et la régression

Le coefficient de corrélation de Pearson (r) mesure l'intensité et la direction de l'association linéaire entre deux variables d'intervalle ou de rapport.

Plage de valeurs : −1 ≤ r ≤ +1

association linéaire positive r ≈ +1 association linéaire négative r ≈ -1 pas d'association linéaire r ≈ 0

📐 La covariance (Covariance)

sₓᵧ = Σ(xᵢ − x̄)(yᵢ − ȳ) / (n−1)

ou avec la formule abrégée :
sₓᵧ = [Σxᵢyᵢ − (Σxᵢ·Σyᵢ)/n] / (n−1)

La covariance mesure la direction de l'association :

  • sₓᵧ > 0 → association positive
  • sₓᵧ < 0 → association négative
  • sₓᵧ = 0 → pas d'association linéaire

r La formule de Pearson

r = sₓᵧ / (sₓ · sᵧ)

où sₓ et sᵧ sont les écarts-types de X et de Y

📏 La droite de régression

La droite de régression (droite de prédiction) est la droite qui décrit le mieux l'association linéaire entre X et Y.

Équation de la droite : ŷ = a + bx

Pente de la droite : b = r · (sᵧ / sₓ)

Ordonnée à l'origine : a = ȳ − b·x̄
X Y ŷ = a + bx (la droite de régression) erreur (e)

📊 Le coefficient de détermination (R²)

R² = r²

R² représente le pourcentage de la variance de Y expliqué par X
Exemple : si r = 0.8, alors R² = 0.64
Interprétation : 64 % de la variance des notes Y est expliqué par l'association avec X.
les 36 % restants sont expliqués par d'autres facteurs.

🔢 La variance des prédictions et la variance des erreurs

variance totale = variance des prédictions + variance des erreurs

sᵧ² = s²ŷ + s²ₑ
Composante Formule Signification
variance des prédictions s²ŷ = r² · sᵧ² la partie expliquée par X
variance des erreurs s²ₑ = (1 − r²) · sᵧ² la partie non expliquée

⚠️ Points importants

  • Corrélation ≠ causalité : une association forte ne prouve pas que X cause Y !
  • r ne mesure que l'association linéaire : une association non linéaire forte peut exister avec r=0
  • Sensible aux valeurs extrêmes : les valeurs aberrantes (Outliers) peuvent changer r de façon notable
  • Loi normale : le test de significativité nécessite une loi normale

📋 Comparaison des mesures d'association

Mesure Type de variables Type d'association Plage
Lambda (λ) nominales générale 0 à 1
Cramer (V) nominales générale 0 à 1
Spearman (rₛ) ordinales monotone -1 à +1
Pearson (r) intervalle / rapport linéaire -1 à +1

OpenBook © 2025 © רוית הלפנבאום 

Pratiquer Maintenant

Essaie un problème — questions illimitées, retour instantané.

Clique sur Générer un Problème pour commencer.