Estadística: agrupación de datos en tablas

Estadística

Página 2: agrupación de datos en tablas

❓ ¿Por qué hay que agrupar los datos?

Datos brutos (Raw Data):

72, 85, 91, 78, 85, 63, 72, 85, 91, 78, 85, 72, 91, 85, 78, 63, 85, 72, 78, 91, 85, 85, 72, 78, 91...

¡Es difícil ver la imagen general! 😵

La tabla de frecuencias organiza los datos de forma clara y fácil de analizar.

📊 Tabla de frecuencias - variable discreta

Ejemplo: número de hermanos de 30 estudiantes de una clase

0, 1, 2, 1, 3, 2, 1, 1, 2, 0, 1, 2, 3, 1, 2, 1, 0, 2, 1, 2, 4, 1, 2, 1, 3, 2, 1, 1, 2, 1

Tabla de frecuencias:

Número de hermanos (x) Frecuencia (f)
0 3
1 12
2 10
3 4
4 1
Total n = 30

💡 Nota:

  • Suma de frecuencias = n (número de datos)
  • Cada valor aparece por separado en su fila
  • Apropiada para variables discretas con pocos valores

📊 Tabla de frecuencias agrupada - variable continua

Cuando hay muchos valores diferentes (variable continua), se agrupan los datos en clases/grupos.

Ejemplo: notas de 40 estudiantes en un examen

52, 67, 73, 81, 95, 63, 78, 84, 71, 89, 58, 76, 82, 91, 65, 74, 88, 69, 77, 93, 55, 72, 86, 61, 79, 83, 96, 68, 75, 87, 59, 71, 85, 92, 66, 78, 84, 70, 80, 94

Tabla de frecuencias agrupada:

Clase de notas Límites Marca de clase (xᵢ) Frecuencia (fᵢ)
50-59 49.5-59.5 54.5 4
60-69 59.5-69.5 64.5 8
70-79 69.5-79.5 74.5 12
80-89 79.5-89.5 84.5 10
90-100 89.5-100.5 95 6
Total n = 40

📚 Conceptos en la tabla agrupada

Concepto Explicación Ejemplo (clase 70-79)
Clase/grupo Rango de valores agrupados 70-79
Límite inferior El valor más pequeño de la clase 70
Límite superior El valor más grande de la clase 79
Límites reales Los límites "reales" (±0.5) 69.5 - 79.5
Amplitud La diferencia entre los límites reales 79.5 - 69.5 = 10
Marca de clase Promedio de los límites (representa la clase) (70+79)/2 = 74.5

💡 Fórmulas:

Marca de clase:

\(x_i = \frac{\text{límite inferior} + \text{límite superior}}{2}\)

Amplitud:

\(h = \text{límite superior real} - \text{límite inferior real}\)

📐 Reglas para construir una tabla agrupada

  1. Número de clases: normalmente 5-15 clases

    Regla empírica: \(\sqrt{n}\) clases

  2. Amplitud uniforme: todas las clases tienen la misma amplitud (excepto quizá la última)
  3. Sin solapamiento: cada dato pertenece a una sola clase
  4. Sin huecos: las clases son consecutivas, sin "agujeros"
  5. Cobertura total: todos los datos entran en alguna clase

✏️ Ejemplo de cálculo de amplitud:

Datos: notas de 45 a 98, se quieren 6 clases

Rango = 98 - 45 = 53

Amplitud = 53 ÷ 6 ≈ 8.8 → redondeamos a 10

Clases: 45-54, 55-64, 65-74, 75-84, 85-94, 95-104

⚖️ ¿Cuándo se usa cada tipo de tabla?

  Tabla normal (discreta) Tabla agrupada
Tipo de variable Discreta con pocos valores Continua / discreta con muchos valores
Ejemplos Número de hijos, notas 1-5 Altura, peso, notas 0-100
Qué se registra Cada valor por separado Grupos de valores
Precisión Completa Se pierde algo de información

💡 Consejos para el examen

Marca de clase: (inferior + superior) ÷ 2

Límites reales: ±0.5

Verificación: suma de f = n

📝 Resumen de la página 2

La tabla de frecuencias organiza los datos brutos

Discreta = valores individuales | continua = clases

La marca de clase representa todos los datos de la clase