Organización y Presentación de Datos Continuos


En esta parte de nuestro estudio nos enfocaremos en la organización de datos continuos, para ello recordemos que una de las características de los datos continuos es que se obtienen de mediciones, lo que determina que pueden tomar cualquier valor. Organicemos los siguientes datos obtenidos de la estatura de un grupo de niños de educación básica:

 1.25 1.20  1.28  1.29  1.20  1.24 
 1.27 1.21  1.32  1.27  1.18  1.29 
 1.20 1.23  1.25  1.28  1.24  1.28 
 1.27 1.25  1.24  1.25  1.27  1.28 
 1.29 1.18  1.21  1.24  1.20  1.23 
 1.25 1.27  1.28  1.24  1.29  1.21 
La característica mencionada de que una variable continua puede tomar cualquier valor, no nos permite hacer un ordenamiento "directo" (ver Organización y Presentación de Datos Discretos), por ello recurriremos a una metodología que incluye algunos cálculos pequeños:
1.- Determinemos el intervalo de valores en los que se encuentran los datos, llamaremos a este intervalo, Amplitud, como nos referimos a una muestra, entonces será la Amplitud de la muestra. Para ello podemos observar que el valor más pequeño de los datos es 1.18, también es observable que el valor mayor es 1.32, no dejaremos de observar que el tamaño de la muestra es determinado por el número de datos que la conforman en este caso es de 36. y que su amplitud está dada por 0.14 (1.32 - 1.18).
2.- Determinemos el número de clases que "queremos" utilizar (normalmente se define a este valor, como k), en este sentido existen varias recomendaciones, a) este se recomienda que sea impar, b) no se recomienda un numero mayor a 15, c) se pueden utilizar varios algoritmos que nos pueden definir este valor, el más utilizado es obtener la raíz de n. Para nuestro ejemplo este valor sería 6 y buscando cumplir con las recomendaciones definiremos al numero de clases como 5.
3.- Determinemos el intervalo de valores que serán cubiertos por cada clase, para ello dividiremos el valor de la amplitud de la muestra entre el valor de k (5, en este ejemplo) para obtener la amplitud de la clase que en nuestro caso sería Ac = 0.14 / 5 = 0.028, 
4.- Por simple observación, notaremos que en nuestro ejemplo el valor mínimo que puede haber entre dos datos de variables discretas sería 0.01 (suponiendo que existen valores continuos) a este valor se le denomina unidad de variación. 
5.- Nombremos las clases (en este ejemplo y para hacerlo de manera rápida las nombramos con los primero número romanos) como I, II, III, IV, V.
6.- Posteriormente estableceremos el rango en el cual se encontrarán los datos dentro de cada clase, para ello iniciemos con lo que llamaremos el límite inferior de la clase, el cual calcularemos a partir del valor Inicial  menos la unidad de variación, ésta última entre 2,  lo que nos daría (1.18 - (0.01/2)): 1.175
7.- Los valores de la siguientes clases, se calcularían agregándole al limite anterior la amplitud de la clase, lo que resultaría para cada una: 1.213, 1.251, 1.289 y 1.327, (veamos como se calculó el limite inferior para la clase II: 1.175 + 0.028 + 0.01 = 1.213, este procedimiento se repite para las siguientes clases).
8.- Ahora calculemos los limites superiores de las clases, sumando a cada limite inferior solo la amplitud de la clase, así obtendríamos los siguientes valores: 1.203, 1.241, 1.279, 1.317, 1.355 (veamos el cálculo del limite superior de la clase para la clase I: 1.175 + 0.028 = 1.203, lo que se repite para las clases siguientes).
Con estos valores construiremos la tabla:
 Clase Inferior  Superior 
 I 1.175  1.203 
 II 1.213  1.241 
 III 1.251  1.279 
 IV 1.289  1.317 
 V 1.327  1.355 
En esta podemos ver que apenas hemos definido la identificación de las clases y los rangos que corresponden a cada una. Antes de continuar describamos un concepto nuevo, La marca de clase, la cual se calcula sumando los limites de cada clase y dividiendo entre 2 al resultado lo que nos complementa la tabla que estamos construyendo:
 Clase Inferior  Superior   Marca de Clase
 I 1.175  1.203   1.189
 II 1.213  1.241   1.227
 III 1.251  1.279   1.265
 IV 1.289  1.317   1.303
 V 1.327  1.355   1.341
Estamos ya en la etapa de organización de los datos a partir de la identificación de las clases que los van a agrupar, y entonces recurrimos a los datos originales, para determinar por observación cuantos de los datos originales se encuentran en cada clase, lo que complementa nuestra tabla:
 Clase Inferior  Superior   Marca de Clase Frecuencia 
 I 1.175  1.203   1.189  6
 II 1.213  1.241   1.227  10
 III 1.251  1.279   1.265  10
 IV 1.289  1.317   1.303  9
 V 1.327  1.355   1.341  1
Nuestra tabla se encuentra ahora casi completa, calculemos la frecuencia acumulada y la frecuencia complementaria como lo realizamos cuando organizamos y presentamos los datos discretos, quedando nuestra tabla :
 Clase Inferior  Superior   Marca de Clase Frecuencia Frecuencia Acumulada Frecuencia Complementaria 
 I 1.175  1.203   1.189  6  6 30 
 II 1.213  1.241   1.227  10  16 20 
 III 1.251  1.279   1.265  10  26 10 
 IV 1.289  1.317   1.303  9  35
 V 1.327  1.355   1.341  1  36
Complementemos nuestra tabla, con los cálculos relativos, como lo realizamos en la organización de datos discretos:
 Clase Inferior  Superior   Marca de Clase Frecuencia Frecuencia Acumulada Frecuencia Complementaria Frecuencia Relativa Frecuencia Relativa Acumulada Frecuencia Relativa Complementaria
 I 1.175  1.203   1.189  6  6 30   16.67% 16.67%  83.33% 
 II 1.213  1.241   1.227  10  16 20   27.78% 44.44%  55.56% 
 III 1.251  1.279   1.265  10  26 10   27.78% 72.22%  27.78% 
 IV 1.289  1.317   1.303  9  35  25.00% 97.22%  2.78% 
 V 1.327  1.355   1.341  1  36  2.78% 100%  0% 
Nuestra tabla está completa, en cuanto a datos necesarios para hacer algunas observaciones de ellos, por ejemplo podemos decir que aproximadamente el 54% de ellos se encuentran entre la clase II y III o que aproximadamente el 54% de los datos se encuentran entre 1.213 y 1.265 metros de estatura. Recuerden parte del análisis que se hizo en los datos discretos.