Estadística: tablas de frecuencias y gráficos
Cuando recopilamos datos —calificaciones, estaturas, número de hermanos— obtenemos una lista larga y difícil de leer. La estadística descriptiva nos ayuda a organizar los datos de manera que cuenten una historia: cuántas veces aparece cada valor, dónde se concentran los datos y cuáles son los valores atípicos. En esta página aprenderemos a construir una tabla de frecuencias y a elegir el gráfico adecuado.
Contexto y definiciones básicas
Comenzamos con los conceptos clave:
- Frecuencia — el número de veces que un valor determinado aparece en los datos.
- Frecuencia relativa — la frecuencia dividida entre el total de observaciones, \( \frac{f_i}{n} \). Indica qué proporción de los datos corresponde a cada valor, y generalmente se expresa como fracción decimal o porcentaje.
- Distribución de frecuencias — la tabla completa que muestra cada valor (o intervalo) junto a su frecuencia.
El tipo de datos determina el gráfico:
- Datos discretos — valores enteros contables (número de hermanos, número de libros). Se representan con un diagrama de barras separadas, ya que entre los valores no existe significado intermedio (no hay 2,5 hermanos).
- Datos continuos — valores dentro de un rango, que se miden (estatura, tiempo, peso). Se representan con un histograma de barras contiguas, porque los datos fluyen de forma continua.
Cuando hay muchos valores distintos se agrupan en clases (intervalos), como 60–69 o 70–79. En el histograma, la altura de cada barra representa la frecuencia del intervalo correspondiente.
Pasos de resolución
- Paso 1 — Anota todos los valores posibles (o los intervalos) en una columna, de menor a mayor.
- Paso 2 — Recorre los datos y marca una cuenta (tally) junto a cada valor; cuenta para obtener la frecuencia.
- Paso 3 — Comprueba: la suma de todas las frecuencias debe ser igual al número total de observaciones \( n \).
- Paso 4 — Si se requiere, calcula la frecuencia relativa: \( \frac{f_i}{n} \) para cada fila.
- Paso 5 — Decide el tipo de datos: discretos → diagrama de barras; continuos → histograma.
- Paso 6 — Dibuja el gráfico: la altura de cada barra es igual a la frecuencia; etiqueta los ejes con claridad.
Ejemplos resueltos
Ejemplo 1: Construir frecuencias a partir de una lista
Enunciado: Se registró el número de mascotas de 10 estudiantes: 0, 1, 1, 2, 0, 3, 1, 2, 1, 0. ¿Cuál es la frecuencia del valor 1?
Solución:
- Marcamos y contamos cuántas veces aparece cada valor.
- El valor 1 aparece en los estudiantes: 1, 1, 1, 1 — en total cuatro veces.
- Por lo tanto, la frecuencia del valor 1 es 4.
Respuesta: La frecuencia de 1 es \( 4 \).
Ejemplo 2: Tabla de frecuencias completa y verificación de la suma
Enunciado: En una clase se preguntó a los alumnos cuántos hermanos tienen. Se obtuvieron los datos: 0, 2, 1, 1, 3, 2, 0, 1, 2, 1, 4, 1. Construye la tabla de frecuencias y verifícala.
Solución:
- Valores posibles: 0, 1, 2, 3, 4. Contamos cada uno.
- El 0 aparece dos veces; el 1 aparece cinco veces; el 2 aparece tres veces; el 3 aparece una vez; el 4 aparece una vez.
Número de hermanos Frecuencia 0 2 1 5 2 3 3 1 4 1 - Verificación: \( 2 + 5 + 3 + 1 + 1 = 12 \), que es exactamente el número de alumnos — la tabla es correcta.
- El número de hermanos más frecuente es 1 (frecuencia 5).
Respuesta: La tabla es correcta (suma de frecuencias 12) y el valor más frecuente es \( 1 \).
Ejemplo 3: Identificar el valor modal en una tabla dada
Enunciado: Se da una tabla de frecuencias de calificaciones: 50→4, 60→6, 70→11, 80→5. ¿Qué calificación es la más frecuente y cuántos alumnos fueron evaluados?
Solución:
- El valor más frecuente es aquel con la frecuencia más alta.
- Las frecuencias son 4, 6, 11, 5 — la más alta es 11, correspondiente a la calificación 70.
- El número de alumnos es la suma de las frecuencias: \( 4 + 6 + 11 + 5 = 26 \).
Respuesta: La calificación más frecuente es \( 70 \) y fueron evaluados \( 26 \) alumnos.
Ejemplo 4: Frecuencia relativa
Enunciado: En una muestra de 40 familias, en 10 de ellas hay un solo automóvil. ¿Cuál es la frecuencia relativa de «un automóvil»?
Solución:
- La frecuencia relativa es la frecuencia dividida entre el total de observaciones: \( \frac{f}{n} = \frac{10}{40} \).
- \( \frac{10}{40} = \frac{1}{4} = 0.25 \).
- En porcentaje: \( 0.25 \times 100 = 25\% \).
Respuesta: La frecuencia relativa es \( 0.25 \), es decir, \( 25\% \).
Ejemplo 5: Elegir el gráfico adecuado
Enunciado: Una profesora registró los tiempos de carrera (en segundos) de 50 alumnos en los 100 metros. ¿Es mejor representarlos con un diagrama de barras o con un histograma, y por qué?
Solución:
- Identificamos el tipo de dato: el tiempo es una magnitud que se mide y puede tomar cualquier valor dentro de un rango (12,3 s, 12,31 s...).
- Por tanto, se trata de datos continuos, no de valores discretos que se cuentan.
- Los datos continuos se agrupan en intervalos (por ejemplo, 12–13 s, 13–14 s) y se representan en un histograma, donde las barras son contiguas para reflejar la continuidad.
- El diagrama de barras, en cambio, es adecuado para datos discretos, donde existen gaps entre los valores.
Respuesta: Es preferible el histograma, porque el tiempo de carrera es un dato continuo.
Errores comunes
✗ Error común: Se confunde el valor con su frecuencia — cuando se pregunta «¿cuál es el más frecuente?» se responde con la frecuencia más alta en lugar del valor.
✓ La forma correcta: «El más frecuente» es el valor que aparece más veces, no el número de veces. Si 70 aparece 11 veces, la respuesta es 70, no 11.
✗ Error común: Se dibuja un histograma para datos discretos (como el número de hermanos) con barras contiguas.
✓ La forma correcta: Para datos discretos se usa un diagrama de barras separadas. El espacio entre las barras enfatiza que no existen valores intermedios — 2,5 hermanos no tiene sentido.
✗ Error común: Se definen intervalos solapados, por ejemplo 60–70 y 70–80, sin quedar claro a cuál pertenece el valor 70.
✓ La forma correcta: Define intervalos sin solapamiento, por ejemplo 60–69 y 70–79, o establece una regla clara («el límite superior pertenece al siguiente intervalo»). Cada observación debe caer en exactamente un intervalo.
Consejos de práctica
- Consejo — comprueba siempre que la suma de las frecuencias sea igual al número de observaciones \( n \). Si no lo es, hubo un error de conteo o se omitió un dato.
- Consejo — para recordar la diferencia: «contamos» → discreto → barras separadas; «medimos» → continuo → histograma.
- Consejo — el histograma es excelente para detectar valores extremos: una barra aislada en el extremo del gráfico indica un alumno con un valor inusualmente alto o bajo.
- Consejo — al agrupar en intervalos, mantén un ancho uniforme (todos de 10 unidades, por ejemplo). Intervalos de distinto ancho distorsionan la imagen visual.
Resumen y fórmulas clave
- Frecuencia = número de apariciones de un valor; frecuencia relativa \( = \frac{f_i}{n} \).
- La suma de todas las frecuencias es siempre igual al número de observaciones \( n \).
- Discreto (contamos) → diagrama de barras (barras separadas).
- Continuo (medimos) → histograma (barras contiguas).
- La altura de cada barra = la frecuencia de ese valor o intervalo.