Estadística
Página 2: agrupación de datos en tablas
❓ ¿Por qué hay que agrupar los datos?
Datos brutos (Raw Data):
72, 85, 91, 78, 85, 63, 72, 85, 91, 78, 85, 72, 91, 85, 78, 63, 85, 72, 78, 91, 85, 85, 72, 78, 91...
¡Es difícil ver la imagen general! 😵
La tabla de frecuencias organiza los datos de forma clara y fácil de analizar.
📊 Tabla de frecuencias - variable discreta
Ejemplo: número de hermanos de 30 estudiantes de una clase
0, 1, 2, 1, 3, 2, 1, 1, 2, 0, 1, 2, 3, 1, 2, 1, 0, 2, 1, 2, 4, 1, 2, 1, 3, 2, 1, 1, 2, 1
Tabla de frecuencias:
| Número de hermanos (x) | Frecuencia (f) |
|---|---|
| 0 | 3 |
| 1 | 12 |
| 2 | 10 |
| 3 | 4 |
| 4 | 1 |
| Total | n = 30 |
💡 Nota:
- Suma de frecuencias = n (número de datos)
- Cada valor aparece por separado en su fila
- Apropiada para variables discretas con pocos valores
📊 Tabla de frecuencias agrupada - variable continua
Cuando hay muchos valores diferentes (variable continua), se agrupan los datos en clases/grupos.
Ejemplo: notas de 40 estudiantes en un examen
52, 67, 73, 81, 95, 63, 78, 84, 71, 89, 58, 76, 82, 91, 65, 74, 88, 69, 77, 93, 55, 72, 86, 61, 79, 83, 96, 68, 75, 87, 59, 71, 85, 92, 66, 78, 84, 70, 80, 94
Tabla de frecuencias agrupada:
| Clase de notas | Límites | Marca de clase (xᵢ) | Frecuencia (fᵢ) |
|---|---|---|---|
| 50-59 | 49.5-59.5 | 54.5 | 4 |
| 60-69 | 59.5-69.5 | 64.5 | 8 |
| 70-79 | 69.5-79.5 | 74.5 | 12 |
| 80-89 | 79.5-89.5 | 84.5 | 10 |
| 90-100 | 89.5-100.5 | 95 | 6 |
| Total | n = 40 | ||
📚 Conceptos en la tabla agrupada
| Concepto | Explicación | Ejemplo (clase 70-79) |
|---|---|---|
| Clase/grupo | Rango de valores agrupados | 70-79 |
| Límite inferior | El valor más pequeño de la clase | 70 |
| Límite superior | El valor más grande de la clase | 79 |
| Límites reales | Los límites "reales" (±0.5) | 69.5 - 79.5 |
| Amplitud | La diferencia entre los límites reales | 79.5 - 69.5 = 10 |
| Marca de clase | Promedio de los límites (representa la clase) | (70+79)/2 = 74.5 |
💡 Fórmulas:
Marca de clase:
\(x_i = \frac{\text{límite inferior} + \text{límite superior}}{2}\)
Amplitud:
\(h = \text{límite superior real} - \text{límite inferior real}\)
📐 Reglas para construir una tabla agrupada
- Número de clases: normalmente 5-15 clases
Regla empírica: \(\sqrt{n}\) clases
- Amplitud uniforme: todas las clases tienen la misma amplitud (excepto quizá la última)
- Sin solapamiento: cada dato pertenece a una sola clase
- Sin huecos: las clases son consecutivas, sin "agujeros"
- Cobertura total: todos los datos entran en alguna clase
✏️ Ejemplo de cálculo de amplitud:
Datos: notas de 45 a 98, se quieren 6 clases
Rango = 98 - 45 = 53
Amplitud = 53 ÷ 6 ≈ 8.8 → redondeamos a 10
Clases: 45-54, 55-64, 65-74, 75-84, 85-94, 95-104
⚖️ ¿Cuándo se usa cada tipo de tabla?
| Tabla normal (discreta) | Tabla agrupada | |
|---|---|---|
| Tipo de variable | Discreta con pocos valores | Continua / discreta con muchos valores |
| Ejemplos | Número de hijos, notas 1-5 | Altura, peso, notas 0-100 |
| Qué se registra | Cada valor por separado | Grupos de valores |
| Precisión | Completa | Se pierde algo de información |
💡 Consejos para el examen
Marca de clase: (inferior + superior) ÷ 2
Límites reales: ±0.5
Verificación: suma de f = n
📝 Resumen de la página 2
La tabla de frecuencias organiza los datos brutos
Discreta = valores individuales | continua = clases
La marca de clase representa todos los datos de la clase