En esta parte de nuestro estudio nos enfocaremos en la organización de
datos continuos, para ello recordemos que una de las características de los datos continuos es que se obtienen de mediciones, lo que determina que pueden tomar cualquier valor. Organicemos
los siguientes datos obtenidos de la estatura de un grupo de niños de educación básica:
1.25
|
1.20
|
1.28
|
1.29
|
1.20
|
1.24
|
1.27
|
1.21
|
1.32
|
1.27
|
1.18
|
1.29
|
1.20
|
1.23
|
1.25
|
1.28
|
1.24
|
1.28
|
1.27
|
1.25
|
1.24
|
1.25
|
1.27
|
1.28
|
1.29
|
1.18
|
1.21
|
1.24
|
1.20
|
1.23
|
1.25
|
1.27
|
1.28
|
1.24
|
1.29
|
1.21
|
La característica mencionada de que una variable continua puede tomar cualquier valor, no nos permite hacer un ordenamiento "directo" (ver Organización y
Presentación de Datos Discretos), por ello recurriremos a una metodología que incluye algunos cálculos pequeños:
1.- Determinemos el intervalo de valores en los que se encuentran los datos, llamaremos a este intervalo, Amplitud, como nos referimos a una muestra, entonces será
la Amplitud de la muestra. Para ello podemos observar que el valor más pequeño de los datos es 1.18, también es observable que el valor mayor es 1.32, no dejaremos de observar que el tamaño de la
muestra es determinado por el número de datos que la conforman en este caso es de 36. y que su amplitud está dada por 0.14 (1.32 - 1.18).
2.- Determinemos el número de clases que "queremos" utilizar (normalmente se define a este valor, como k), en este sentido existen varias recomendaciones, a) este
se recomienda que sea impar, b) no se recomienda un numero mayor a 15, c) se pueden utilizar varios algoritmos que nos pueden definir este valor, el más utilizado es obtener la raíz de n. Para
nuestro ejemplo este valor sería 6 y buscando cumplir con las recomendaciones definiremos al numero de clases como 5.
3.- Determinemos el intervalo de valores que serán cubiertos por cada clase, para ello dividiremos el valor de la amplitud de la muestra entre el valor de k (5, en
este ejemplo) para obtener la amplitud de la clase que en nuestro caso sería Ac = 0.14 / 5 = 0.028,
4.- Por simple observación, notaremos que en nuestro ejemplo el valor mínimo que puede haber entre dos datos de variables discretas sería 0.01 (suponiendo que
existen valores continuos) a este valor se le denomina unidad de variación.
5.- Nombremos las clases (en este ejemplo y para hacerlo de manera rápida las nombramos con los primero número romanos) como I, II, III, IV, V.
6.- Posteriormente estableceremos el rango en el cual se encontrarán los datos dentro de cada clase, para ello iniciemos con lo que llamaremos el límite inferior de
la clase, el cual calcularemos a partir del valor Inicial menos la unidad de variación, ésta última entre 2, lo que nos daría (1.18 - (0.01/2)): 1.175
7.- Los valores de la siguientes clases, se calcularían agregándole al limite anterior la amplitud de la clase, lo que resultaría para cada una: 1.213, 1.251, 1.289
y 1.327, (veamos como se calculó el limite inferior para la clase II: 1.175 + 0.028 + 0.01 = 1.213, este procedimiento se repite para las siguientes clases).
8.- Ahora calculemos los limites superiores de las clases, sumando a cada limite inferior solo la amplitud de la clase, así obtendríamos los siguientes valores:
1.203, 1.241, 1.279, 1.317, 1.355 (veamos el cálculo del limite superior de la clase para la clase I: 1.175 + 0.028 = 1.203, lo que se repite para las clases siguientes).
Con estos valores construiremos la tabla:
Clase
|
Inferior
|
Superior
|
I
|
1.175
|
1.203
|
II
|
1.213
|
1.241
|
III
|
1.251
|
1.279
|
IV
|
1.289
|
1.317
|
V
|
1.327
|
1.355
|
En esta podemos ver que apenas hemos definido la identificación de las clases y los rangos que corresponden a cada una. Antes de continuar describamos un concepto
nuevo, La marca de clase, la cual se calcula sumando los limites de cada clase y dividiendo entre 2 al resultado lo que nos complementa la tabla que estamos construyendo:
Clase
|
Inferior
|
Superior
|
Marca de Clase
|
I
|
1.175
|
1.203
|
1.189
|
II
|
1.213
|
1.241
|
1.227
|
III
|
1.251
|
1.279
|
1.265
|
IV
|
1.289
|
1.317
|
1.303
|
V
|
1.327
|
1.355
|
1.341
|
Estamos ya en la etapa de organización de los datos a partir de la identificación de las clases que los van a agrupar, y entonces recurrimos a los datos originales,
para determinar por observación cuantos de los datos originales se encuentran en cada clase, lo que complementa nuestra tabla:
Clase
|
Inferior
|
Superior
|
Marca de Clase
|
Frecuencia
|
I
|
1.175
|
1.203
|
1.189
|
6
|
II
|
1.213
|
1.241
|
1.227
|
10
|
III
|
1.251
|
1.279
|
1.265
|
10
|
IV
|
1.289
|
1.317
|
1.303
|
9
|
V
|
1.327
|
1.355
|
1.341
|
1
|
Nuestra tabla se encuentra ahora casi completa, calculemos la frecuencia acumulada y la frecuencia complementaria como lo realizamos cuando organizamos y
presentamos los datos discretos, quedando nuestra tabla :
Clase
|
Inferior
|
Superior
|
Marca de Clase
|
Frecuencia
|
Frecuencia Acumulada
|
Frecuencia Complementaria
|
I
|
1.175
|
1.203
|
1.189
|
6
|
6
|
30
|
II
|
1.213
|
1.241
|
1.227
|
10
|
16
|
20
|
III
|
1.251
|
1.279
|
1.265
|
10
|
26
|
10
|
IV
|
1.289
|
1.317
|
1.303
|
9
|
35
|
1
|
V
|
1.327
|
1.355
|
1.341
|
1
|
36
|
0
|
Complementemos nuestra tabla, con los cálculos relativos, como lo realizamos en la organización de datos discretos:
Clase
|
Inferior
|
Superior
|
Marca de Clase
|
Frecuencia
|
Frecuencia Acumulada
|
Frecuencia Complementaria
|
Frecuencia Relativa
|
Frecuencia Relativa Acumulada
|
Frecuencia Relativa Complementaria
|
I
|
1.175
|
1.203
|
1.189
|
6
|
6
|
30
|
16.67%
|
16.67%
|
83.33%
|
II
|
1.213
|
1.241
|
1.227
|
10
|
16
|
20
|
27.78%
|
44.44%
|
55.56%
|
III
|
1.251
|
1.279
|
1.265
|
10
|
26
|
10
|
27.78%
|
72.22%
|
27.78%
|
IV
|
1.289
|
1.317
|
1.303
|
9
|
35
|
1
|
25.00%
|
97.22%
|
2.78%
|
V
|
1.327
|
1.355
|
1.341
|
1
|
36
|
0
|
2.78%
|
100%
|
0%
|
Nuestra tabla está completa, en cuanto a datos necesarios para hacer algunas observaciones de ellos, por ejemplo podemos decir que aproximadamente el 54% de ellos
se encuentran entre la clase II y III o que aproximadamente el 54% de los datos se encuentran entre 1.213 y 1.265 metros de estatura. Recuerden parte del análisis que se hizo en los datos
discretos.