Practice Pearson's Correlation Coefficient

Explicación paso a paso, ejemplos resueltos y práctica ilimitada.

📖 Estadística: el coeficiente de correlación de Pearson y la regresión

📈 El coeficiente de Pearson y la regresión

El coeficiente de correlación de Pearson (r) mide la intensidad y la dirección de la asociación lineal entre dos variables de intervalo o de razón.

Rango de valores: −1 ≤ r ≤ +1

asociación lineal positiva r ≈ +1 asociación lineal negativa r ≈ -1 sin asociación lineal r ≈ 0

📐 La covarianza (Covariance)

sₓᵧ = Σ(xᵢ − x̄)(yᵢ − ȳ) / (n−1)

o con la fórmula abreviada:
sₓᵧ = [Σxᵢyᵢ − (Σxᵢ·Σyᵢ)/n] / (n−1)

La covarianza mide la dirección de la asociación:

  • sₓᵧ > 0 → asociación positiva
  • sₓᵧ < 0 → asociación negativa
  • sₓᵧ = 0 → no hay asociación lineal

r La fórmula de Pearson

r = sₓᵧ / (sₓ · sᵧ)

donde sₓ y sᵧ son las desviaciones típicas de X y de Y

📏 La recta de regresión

La recta de regresión (recta de predicción) es la recta que mejor describe la asociación lineal entre X y Y.

Ecuación de la recta: ŷ = a + bx

Pendiente de la recta: b = r · (sᵧ / sₓ)

Ordenada en el origen: a = ȳ − b·x̄
X Y ŷ = a + bx (la recta de regresión) error (e)

📊 El coeficiente de determinación (R²)

R² = r²

R² representa el porcentaje de la varianza de Y explicado por X
Ejemplo: si r = 0.8, entonces R² = 0.64
Interpretación: el 64% de la varianza de las notas Y queda explicado por la asociación con X.
el 36% restante queda explicado por otros factores.

🔢 La varianza de las predicciones y la varianza de los errores

varianza total = varianza de las predicciones + varianza de los errores

sᵧ² = s²ŷ + s²ₑ
Componente Fórmula Significado
varianza de las predicciones s²ŷ = r² · sᵧ² la parte explicada por X
varianza de los errores s²ₑ = (1 − r²) · sᵧ² la parte no explicada

⚠️ Puntos importantes

  • Correlación ≠ causalidad: ¡una asociación fuerte no demuestra que X cause Y!
  • r mide solo la asociación lineal: puede existir una asociación no lineal fuerte con r=0
  • Sensible a los valores extremos: los valores atípicos (Outliers) pueden cambiar r de forma considerable
  • Distribución normal: el contraste de significación requiere una distribución normal

📋 Comparación de las medidas de asociación

Medida Tipo de variables Tipo de asociación Rango
Lambda (λ) nominales general 0 a 1
Cramer (V) nominales general 0 a 1
Spearman (rₛ) ordinales monótona -1 a +1
Pearson (r) intervalo / razón lineal -1 a +1

OpenBook © 2025 © רוית הלפנבאום 

Practicar Ahora

Prueba un problema — preguntas ilimitadas, retroalimentación instantánea.

Haz clic en Generar Problema para empezar.