Practice Pearson's Correlation Coefficient
Explication étape par étape, exemples résolus et pratique illimitée.
📖 Statistique : le coefficient de corrélation de Pearson et la régression
📈 Le coefficient de Pearson et la régression
Le coefficient de corrélation de Pearson (r) mesure l'intensité et la direction de l'association linéaire entre deux variables d'intervalle ou de rapport.
Plage de valeurs : −1 ≤ r ≤ +1
📐 La covariance (Covariance)
sₓᵧ = Σ(xᵢ − x̄)(yᵢ − ȳ) / (n−1)
ou avec la formule abrégée :
sₓᵧ = [Σxᵢyᵢ − (Σxᵢ·Σyᵢ)/n] / (n−1)
ou avec la formule abrégée :
sₓᵧ = [Σxᵢyᵢ − (Σxᵢ·Σyᵢ)/n] / (n−1)
La covariance mesure la direction de l'association :
- sₓᵧ > 0 → association positive
- sₓᵧ < 0 → association négative
- sₓᵧ = 0 → pas d'association linéaire
r La formule de Pearson
r = sₓᵧ / (sₓ · sᵧ)
où sₓ et sᵧ sont les écarts-types de X et de Y
où sₓ et sᵧ sont les écarts-types de X et de Y
📏 La droite de régression
La droite de régression (droite de prédiction) est la droite qui décrit le mieux l'association linéaire entre X et Y.
Équation de la droite : ŷ = a + bx
Pente de la droite : b = r · (sᵧ / sₓ)
Ordonnée à l'origine : a = ȳ − b·x̄
Ordonnée à l'origine : a = ȳ − b·x̄
📊 Le coefficient de détermination (R²)
R² = r²
R² représente le pourcentage de la variance de Y expliqué par X
R² représente le pourcentage de la variance de Y expliqué par X
Exemple : si r = 0.8, alors R² = 0.64
Interprétation : 64 % de la variance des notes Y est expliqué par l'association avec X.
les 36 % restants sont expliqués par d'autres facteurs.
Interprétation : 64 % de la variance des notes Y est expliqué par l'association avec X.
les 36 % restants sont expliqués par d'autres facteurs.
🔢 La variance des prédictions et la variance des erreurs
variance totale = variance des prédictions + variance des erreurs
sᵧ² = s²ŷ + s²ₑ
sᵧ² = s²ŷ + s²ₑ
| Composante | Formule | Signification |
|---|---|---|
| variance des prédictions | s²ŷ = r² · sᵧ² | la partie expliquée par X |
| variance des erreurs | s²ₑ = (1 − r²) · sᵧ² | la partie non expliquée |
⚠️ Points importants
- Corrélation ≠ causalité : une association forte ne prouve pas que X cause Y !
- r ne mesure que l'association linéaire : une association non linéaire forte peut exister avec r=0
- Sensible aux valeurs extrêmes : les valeurs aberrantes (Outliers) peuvent changer r de façon notable
- Loi normale : le test de significativité nécessite une loi normale
📋 Comparaison des mesures d'association
| Mesure | Type de variables | Type d'association | Plage |
|---|---|---|---|
| Lambda (λ) | nominales | générale | 0 à 1 |
| Cramer (V) | nominales | générale | 0 à 1 |
| Spearman (rₛ) | ordinales | monotone | -1 à +1 |
| Pearson (r) | intervalle / rapport | linéaire | -1 à +1 |
OpenBook © 2025 © רוית הלפנבאום
Pratiquer Maintenant
Essaie un problème — questions illimitées, retour instantané.
Clique sur Générer un Problème pour commencer.