lunes, 13 de julio de 2009

Introducción al agrupamiento de datos

Organización de datos
Se obtienen los siguientes datos al investigar acerca de las notas obtenidas en Física por los 35 estudiantes de 2° año de Ciencias: 12, 06, 18, 10, 11, 11, 17, 09, 07, 10, 09, 15, 13, 03, 16, 12, 16, 10, 08, 05, 10, 13, 18, 11, 12, 03, 07, 09, 20, 14, 16, 10, 04, 09, 18. Un primer paso a tomar para la organización de esta información, de manera que se facilite su estudio, es el siguiente: se construye una tabla estadística, llamada tabla de frecuencias, en la cual se apreciará el número de estudiantes que obtuvo cada nota, desde 0 hasta 20.
A partir de esta tabla se pueden obtener representaciones gráficas del fenómeno estudiado, como por ejemplo un histograma, que se construirá más adelante. Sin embargo, hay varios aspectos del rendimiento académico del curso observado, que se hacen evidentes al organizar los datos como en la tabla anterior. Por ejemplo, el número de alumnos que tienen una nota inferior a 07 es 5 (2 sacaron 03, 1 sacó 04, 1 sacó 05 y 1 sacó 06). De estos 5 alumnos se puede decir que no aprendieron lo que se esperaba durante el curso.

Se puede considerar a los estudiantes con notas entre 07 y 11 como el grupo que logró aprender una parte de lo que se dio en el curso de Física, pero una parte importante de lo que debió aprender, no está entre sus conocimientos. En un nivel que podría llamarse satisfactorio, estarían los 11 estudiantes con notas entre 12 y 17, y el nivel de excelencia, lo alcanzaron sólo 4 estudiantes, con notas entre 18 y 20. Estas observaciones sugieren que también sería útil organizar la tabla de frecuencias de la manera siguiente:
Este tipo de tabla suele llamarse una distribución de frecuencias. En la columna de la izquierda se colocan intervalos de números que agrupan las notas que pueden ser obtenidas por los estudiantes. Los intervalos indican que los números a considerar en esa categoría son: el extremo inferior y todos los mayores que él y menores que el extremo superior. Por ejemplo, en el intervalo 0-07, se incluyen: 00, 01, 02, 03, 04, 05, 06. En el intervalo 12-18, se incluyen: 12, 13, 14, 15, 16, 17. Los intervalos son determinados por el criterio de quien hace el estudio estadístico. Se podrían escoger de distintas maneras, por ejemplo:
Las distintas maneras de distribuir las frecuencias de ocurrencia de las variables (en este caso, las notas) permiten observar el fenómeno desde distintos puntos de vista. El punto de vista que interesaba en la primera distribución, era el de la clasificación del grupo en 4 categorías: deficiente, regular, satisfactorio y excelente. En este último ejemplo, la distribución de frecuencias con intervalos de longitud igual a 3 es necesaria para obtener una clasificación más detallada de los estudiantes. Se observa, por ejemplo, que el intervalo (también llamado 'clase') donde hay un mayor número de estudiantes es el 09-12, esto es, el que incluye las notas 09, 10 y 11
Frecuencia Relativa:En las tablas de frecuencia construidas, se observa que la columna de las frecuencias se denomina 'Frecuencia absoluta'. El término 'absoluta' se refiere a que se trata simplemente de la frecuencia con que las variables estadísticas toman el valor o los valores indicados. La frecuencia relativa, por otra parte, se refiere a la proporción de datos que caen en el intervalo dado con respecto al total de datos. Por ejemplo, tomando el caso de la última tabla de frecuencias, el intervalo 09-12 tiene una frecuencia absoluta de 12; su frecuencia relativa es, entonces, igual a 12/35, pues el total de datos (notas de estudiantes) es 35. Así, se tiene:

No hay comentarios:

Publicar un comentario