Estadística: variables y escalas de medición

Estadística: variables y escalas de medición

Antes de analizar datos hay que entender exactamente qué medimos. En estadística, cada característica que medimos se llama variable, y cada variable tiene un tipo y una escala de medición que determinan qué operaciones y cálculos están permitidos. En esta página aprenderemos a distinguir las cuatro escalas de medición, entre variable discreta y continua, y entre variable dependiente, independiente y relación causal.

Contexto y definiciones básicas

Variable es una característica que puede tomar distintos valores entre diferentes sujetos — por ejemplo, estatura, sexo, calificación o color de ojos. Lo que no varía (constante para todos) se llama constante.

Las cuatro escalas de medición, de la más simple a la más compleja:

  • Nominal — categorías sin orden: sexo, país de nacimiento, color. Solo se puede distinguir igual/diferente y contar frecuencias.
  • Ordinal — categorías ordenadas, pero las distancias entre los rangos no son iguales: clasificación de satisfacción (baja–media–alta), posición en una competencia.
  • De intervalo — hay orden y distancias iguales, pero el cero es arbitrario: temperatura en Celsius, año del calendario. La razón carece de sentido (\(20^\circ\) no es «el doble de caliente» que \(10^\circ\)).
  • De razón — como la de intervalo, pero con un cero absoluto y real: estatura, peso, tiempo, ingresos. Aquí la razón tiene significado (\(8\) kg es el doble que \(4\) kg).

Discreta vs. continua: una variable discreta toma valores separados que se cuentan (número de hijos, número de autos), y una continua puede tomar cualquier valor dentro de un rango, se mide (estatura, tiempo).

Rol de la variable en la investigación: la variable independiente es el factor que el investigador modifica o examina (la variable «explicativa»), y la variable dependiente es el resultado que se mide. Una relación causal significa que el cambio en una variable provoca el cambio en la otra — a diferencia de una correlación, que puede deberse a una tercera variable de confusión.

Pasos de resolución

  1. Paso 1 — Pregunta qué mide exactamente la variable: ¿una categoría (cualitativa) o una cantidad (cuantitativa)?
  2. Paso 2 — Si es cualitativa: ¿existe un orden entre las categorías? Sin orden → nominal; con orden → ordinal.
  3. Paso 3 — Si es cuantitativa: ¿existe un cero absoluto que signifique «nada»? No → de intervalo; sí → de razón.
  4. Paso 4 — Para clasificar discreta/continua pregunta: ¿se cuentan valores separados (discreta) o se mide en un continuo (continua)?
  5. Paso 5 — Para identificar el rol: el «factor» que se manipula es la independiente; el «resultado» que se mide es la dependiente.
  6. Paso 6 — Antes de afirmar causalidad, verifica que no haya una variable de confusión que explique la relación.

Ejemplos resueltos

Ejemplo 1: Identificar la escala de medición

Enunciado: Un investigador registró para cada participante: (a) número de teléfono, (b) grado de cinturón en judo (blanco, amarillo, negro), (c) temperatura corporal en grados Celsius, (d) peso en kg. Clasifica cada uno según la escala de medición.

Solución:

  1. (a) El número de teléfono es una etiqueta identificadora sin orden ni cantidad — escala nominal.
  2. (b) Los grados de cinturón están ordenados claramente, pero sin distancia cuantitativa igual entre ellos — escala ordinal.
  3. (c) La temperatura en Celsius: hay distancias iguales, pero el cero es arbitrario (\(0^\circ\) no significa «ausencia de calor») — escala de intervalo.
  4. (d) El peso: existe un cero absoluto (\(0\) kg = ausencia de masa) y la razón tiene significado — escala de razón.

Respuesta: Nominal, ordinal, de intervalo, de razón — respectivamente.

Ejemplo 2: Discreta o continua

Enunciado: Clasifica cada variable como discreta o continua: (a) número de mensajes que una persona envía al día, (b) tiempo de carrera de 100 metros en segundos, (c) número de pasajeros en un autobús.

Solución:

  1. (a) El número de mensajes es un valor entero contable, no existen «3,5 mensajes» — discreta.
  2. (b) El tiempo de carrera puede medirse con cualquier precisión (\(11.43\) s, \(11.431\) s) — continua.
  3. (c) El número de pasajeros se cuenta, siempre es un entero — discreta.

Respuesta: Discreta, continua, discreta — respectivamente.

Ejemplo 3: Variable dependiente e independiente

Enunciado: Una investigación examina si el número de horas de sueño nocturno influye en la calificación del examen al día siguiente. ¿Cuál es la variable independiente y cuál la dependiente?

Solución:

  1. Preguntamos quién es el factor que sospechamos que influye y quién es el resultado medido.
  2. Las horas de sueño son el factor influyente — por tanto, son la variable independiente.
  3. La calificación del examen es el resultado medido en función del sueño — por tanto, es la variable dependiente.
  4. Regla mnemotécnica: la dependiente «depende» de la independiente, igual que la calificación depende de las horas de sueño.

Respuesta: Independiente: horas de sueño. Dependiente: calificación del examen.

Ejemplo 4: Relación causal o variable de confusión

Enunciado: Se encontró que los niños con zapatos más grandes leen mejor. ¿El tamaño del pie causa mejor lectura? ¿Cuál es la explicación más plausible?

Solución:

  1. Aparentemente existe una correlación positiva entre talla de zapato y habilidad lectora, pero esto no implica causalidad.
  2. Buscamos una variable de confusión que explique ambas variables simultáneamente.
  3. La edad es la variable de confusión: los niños mayores calzan zapatos más grandes y también leen mejor.
  4. Conclusión: existe aquí una correlación espuria, no una relación causal entre la talla de zapato y la lectura.

Respuesta: No es una relación causal; la edad es la variable de confusión que explica la correlación.

Ejemplo 5: Operaciones permitidas según la escala

Enunciado: Un alumno calculó el «promedio» del color de ojos asignando números (azul=1, verde=2, café=3) y obtuvo 2,1. ¿Es válido ese cálculo?

Solución:

  1. El color de ojos es una variable de escala nominal — los números son solo etiquetas identificadoras.
  2. En la escala nominal, la única operación válida es contar frecuencias (y determinar la moda), no realizar cálculos aritméticos.
  3. El promedio requiere al menos una escala de intervalo, donde las distancias entre valores son iguales y significativas.
  4. Por tanto, el valor \(2.1\) carece de sentido — no existe un «color promedio».

Respuesta: El cálculo no es válido; en una escala nominal no se puede calcular un promedio.

Errores comunes

✗ Error común: Se deduce una relación causal a partir de una correlación («X está relacionado con Y, por lo tanto X causa Y»).

✓ La forma correcta: Correlación no implica causalidad. Para afirmar causalidad hay que descartar variables de confusión, preferiblemente mediante un experimento controlado en el que solo se modifica la variable independiente.

✗ Error común: Se confunde la escala de intervalo con la de razón y se calculan razones en temperaturas Celsius («\(30^\circ\) es el triple de caliente que \(10^\circ\)").

✓ La forma correcta: Las razones solo están permitidas en la escala de razón, que tiene un cero absoluto. En la escala de intervalo (Celsius, año) el cero es arbitrario; por tanto, solo las diferencias tienen significado, no las razones.

✗ Error común: Se clasifica el número de hijos como continua porque aparece un número, o la estatura como discreta porque se registra como número entero.

✓ La forma correcta: La clave es si se cuenta (discreta) o se mide en un continuo (continua), no si aparece un número. El número de hijos se cuenta y es discreta; la estatura se mide en un continuo y es continua, aunque se haya redondeado.

Consejos de práctica

  • Consejo — el orden de las escalas de la más débil a la más fuerte: nominal \(\to\) ordinal \(\to\) de intervalo \(\to\) de razón. Cada escala superior incluye las capacidades de las inferiores.
  • Consejo — siempre se puede convertir de una escala superior a una inferior (por ejemplo, clasificar estaturas en «baja/media/alta»), pero no al revés — al bajar de escala se pierde información.
  • Consejo — para identificar discreta/continua pregunta: «¿puede existir un valor intermedio?». \(2.5\) hermanos es imposible (discreta); \(2.5\) kg es posible (continua).
  • Consejo — en un experimento el investigador controla la variable independiente y mide la dependiente; una variable moderadora modifica la intensidad de la relación entre ellas.

Resumen y fórmulas clave

Escalas de medición:

EscalaCaracterísticaEjemplo
NominalCategorías sin ordenSexo, color
OrdinalOrden sin distancia igualClasificación, posición
De intervaloDistancia igual, cero arbitrarioCelsius
De razónCero absoluto, razón significativaPeso, tiempo
  • Discreta = se cuenta; continua = se mide.
  • Independiente = el factor; dependiente = el resultado.
  • Correlación \(\ne\) causalidad — cuidado con la variable de confusión.