Practice Pearson's Correlation Coefficient
Explicación paso a paso, ejemplos resueltos y práctica ilimitada.
📖 Estadística: el coeficiente de correlación de Pearson y la regresión
📈 El coeficiente de Pearson y la regresión
El coeficiente de correlación de Pearson (r) mide la intensidad y la dirección de la asociación lineal entre dos variables de intervalo o de razón.
Rango de valores: −1 ≤ r ≤ +1
📐 La covarianza (Covariance)
sₓᵧ = Σ(xᵢ − x̄)(yᵢ − ȳ) / (n−1)
o con la fórmula abreviada:
sₓᵧ = [Σxᵢyᵢ − (Σxᵢ·Σyᵢ)/n] / (n−1)
o con la fórmula abreviada:
sₓᵧ = [Σxᵢyᵢ − (Σxᵢ·Σyᵢ)/n] / (n−1)
La covarianza mide la dirección de la asociación:
- sₓᵧ > 0 → asociación positiva
- sₓᵧ < 0 → asociación negativa
- sₓᵧ = 0 → no hay asociación lineal
r La fórmula de Pearson
r = sₓᵧ / (sₓ · sᵧ)
donde sₓ y sᵧ son las desviaciones típicas de X y de Y
donde sₓ y sᵧ son las desviaciones típicas de X y de Y
📏 La recta de regresión
La recta de regresión (recta de predicción) es la recta que mejor describe la asociación lineal entre X y Y.
Ecuación de la recta: ŷ = a + bx
Pendiente de la recta: b = r · (sᵧ / sₓ)
Ordenada en el origen: a = ȳ − b·x̄
Ordenada en el origen: a = ȳ − b·x̄
📊 El coeficiente de determinación (R²)
R² = r²
R² representa el porcentaje de la varianza de Y explicado por X
R² representa el porcentaje de la varianza de Y explicado por X
Ejemplo: si r = 0.8, entonces R² = 0.64
Interpretación: el 64% de la varianza de las notas Y queda explicado por la asociación con X.
el 36% restante queda explicado por otros factores.
Interpretación: el 64% de la varianza de las notas Y queda explicado por la asociación con X.
el 36% restante queda explicado por otros factores.
🔢 La varianza de las predicciones y la varianza de los errores
varianza total = varianza de las predicciones + varianza de los errores
sᵧ² = s²ŷ + s²ₑ
sᵧ² = s²ŷ + s²ₑ
| Componente | Fórmula | Significado |
|---|---|---|
| varianza de las predicciones | s²ŷ = r² · sᵧ² | la parte explicada por X |
| varianza de los errores | s²ₑ = (1 − r²) · sᵧ² | la parte no explicada |
⚠️ Puntos importantes
- Correlación ≠ causalidad: ¡una asociación fuerte no demuestra que X cause Y!
- r mide solo la asociación lineal: puede existir una asociación no lineal fuerte con r=0
- Sensible a los valores extremos: los valores atípicos (Outliers) pueden cambiar r de forma considerable
- Distribución normal: el contraste de significación requiere una distribución normal
📋 Comparación de las medidas de asociación
| Medida | Tipo de variables | Tipo de asociación | Rango |
|---|---|---|---|
| Lambda (λ) | nominales | general | 0 a 1 |
| Cramer (V) | nominales | general | 0 a 1 |
| Spearman (rₛ) | ordinales | monótona | -1 a +1 |
| Pearson (r) | intervalo / razón | lineal | -1 a +1 |
OpenBook © 2025 © רוית הלפנבאום
Practicar Ahora
Prueba un problema — preguntas ilimitadas, retroalimentación instantánea.
Haz clic en Generar Problema para empezar.