Organización y Presentación de Datos Continuos

En esta parte de nuestro estudio nos enfocaremos en la organización de datos continuos, para ello recordemos que una de las características de los datos continuos es que se obtienen de mediciones, lo que determina que pueden tomar cualquier valor. Organicemos los siguientes datos obtenidos de la estatura de un grupo de niños de educación básica:

1.25	1.20	1.28	1.29	1.20	1.24
1.27	1.21	1.32	1.27	1.18	1.29
1.20	1.23	1.25	1.28	1.24	1.28
1.27	1.25	1.24	1.25	1.27	1.28
1.29	1.18	1.21	1.24	1.20	1.23
1.25	1.27	1.28	1.24	1.29	1.21

La característica mencionada de que una variable continua puede tomar cualquier valor, no nos permite hacer un ordenamiento "directo" (ver Organización y Presentación de Datos Discretos), por ello recurriremos a una metodología que incluye algunos cálculos pequeños:

1.- Determinemos el intervalo de valores en los que se encuentran los datos, llamaremos a este intervalo, Amplitud, como nos referimos a una muestra, entonces será la Amplitud de la muestra. Para ello podemos observar que el valor más pequeño de los datos es 1.18, también es observable que el valor mayor es 1.32, no dejaremos de observar que el tamaño de la muestra es determinado por el número de datos que la conforman en este caso es de 36. y que su amplitud está dada por 0.14 (1.32 - 1.18).

2.- Determinemos el número de clases que "queremos" utilizar (normalmente se define a este valor, como k), en este sentido existen varias recomendaciones, a) este se recomienda que sea impar, b) no se recomienda un numero mayor a 15, c) se pueden utilizar varios algoritmos que nos pueden definir este valor, el más utilizado es obtener la raíz de n. Para nuestro ejemplo este valor sería 6 y buscando cumplir con las recomendaciones definiremos al numero de clases como 5.

3.- Determinemos el intervalo de valores que serán cubiertos por cada clase, para ello dividiremos el valor de la amplitud de la muestra entre el valor de k (5, en este ejemplo) para obtener la amplitud de la clase que en nuestro caso sería Ac = 0.14 / 5 = 0.028,

4.- Por simple observación, notaremos que en nuestro ejemplo el valor mínimo que puede haber entre dos datos de variables discretas sería 0.01 (suponiendo que existen valores continuos) a este valor se le denomina unidad de variación.

5.- Nombremos las clases (en este ejemplo y para hacerlo de manera rápida las nombramos con los primero número romanos) como I, II, III, IV, V.

6.- Posteriormente estableceremos el rango en el cual se encontrarán los datos dentro de cada clase, para ello iniciemos con lo que llamaremos el límite inferior de la clase, el cual calcularemos a partir del valor Inicial menos la unidad de variación, ésta última entre 2, lo que nos daría (1.18 - (0.01/2)): 1.175

7.- Los valores de la siguientes clases, se calcularían agregándole al limite anterior la amplitud de la clase, lo que resultaría para cada una: 1.213, 1.251, 1.289 y 1.327, (veamos como se calculó el limite inferior para la clase II: 1.175 + 0.028 + 0.01 = 1.213, este procedimiento se repite para las siguientes clases).

8.- Ahora calculemos los limites superiores de las clases, sumando a cada limite inferior solo la amplitud de la clase, así obtendríamos los siguientes valores: 1.203, 1.241, 1.279, 1.317, 1.355 (veamos el cálculo del limite superior de la clase para la clase I: 1.175 + 0.028 = 1.203, lo que se repite para las clases siguientes).

Con estos valores construiremos la tabla:

Clase	Inferior	Superior
I	1.175	1.203
II	1.213	1.241
III	1.251	1.279
IV	1.289	1.317
V	1.327	1.355

En esta podemos ver que apenas hemos definido la identificación de las clases y los rangos que corresponden a cada una. Antes de continuar describamos un concepto nuevo, La marca de clase, la cual se calcula sumando los limites de cada clase y dividiendo entre 2 al resultado lo que nos complementa la tabla que estamos construyendo:

Clase	Inferior	Superior	Marca de Clase
I	1.175	1.203	1.189
II	1.213	1.241	1.227
III	1.251	1.279	1.265
IV	1.289	1.317	1.303
V	1.327	1.355	1.341

Estamos ya en la etapa de organización de los datos a partir de la identificación de las clases que los van a agrupar, y entonces recurrimos a los datos originales, para determinar por observación cuantos de los datos originales se encuentran en cada clase, lo que complementa nuestra tabla:

Clase	Inferior	Superior	Marca de Clase	Frecuencia
I	1.175	1.203	1.189	6
II	1.213	1.241	1.227	10
III	1.251	1.279	1.265	10
IV	1.289	1.317	1.303	9
V	1.327	1.355	1.341	1

Nuestra tabla se encuentra ahora casi completa, calculemos la frecuencia acumulada y la frecuencia complementaria como lo realizamos cuando organizamos y presentamos los datos discretos, quedando nuestra tabla :

Clase	Inferior	Superior	Marca de Clase	Frecuencia	Frecuencia Acumulada	Frecuencia Complementaria
I	1.175	1.203	1.189	6	6	30
II	1.213	1.241	1.227	10	16	20
III	1.251	1.279	1.265	10	26	10
IV	1.289	1.317	1.303	9	35	1
V	1.327	1.355	1.341	1	36	0

Complementemos nuestra tabla, con los cálculos relativos, como lo realizamos en la organización de datos discretos:

Clase	Inferior	Superior	Marca de Clase	Frecuencia	Frecuencia Acumulada	Frecuencia Complementaria	Frecuencia Relativa	Frecuencia Relativa Acumulada	Frecuencia Relativa Complementaria
I	1.175	1.203	1.189	6	6	30	16.67%	16.67%	83.33%
II	1.213	1.241	1.227	10	16	20	27.78%	44.44%	55.56%
III	1.251	1.279	1.265	10	26	10	27.78%	72.22%	27.78%
IV	1.289	1.317	1.303	9	35	1	25.00%	97.22%	2.78%
V	1.327	1.355	1.341	1	36	0	2.78%	100%	0%

Nuestra tabla está completa, en cuanto a datos necesarios para hacer algunas observaciones de ellos, por ejemplo podemos decir que aproximadamente el 54% de ellos se encuentran entre la clase II y III o que aproximadamente el 54% de los datos se encuentran entre 1.213 y 1.265 metros de estatura. Recuerden parte del análisis que se hizo en los datos discretos.