Organización y Presentación de Datos Discretos


Recordemos que los datos discretos son aquellos que surgen de un conteo, de manera general aunque no restrictiva, los datos discretos no tienen decimales.
Pongamos el siguiente ejemplo:
Se realizó una encuesta, en una muestra de 30 personas a las que entre otra información se le solicitó la edad, que se muestra a continuación:
12 15  14  15  16 
 18 19  14  15  17 
 15 17  18  16  19 
 16 17  15  15  17 
 16 18  17  19  17  
 23 16  17  18  19 

 

Si puedes encontrar algún tipo de organización en este grupo de datos es pura coincidencia, el propósito de este ejemplo es mostrar precisamente una desorganización  en la recolección, nota también que no existe el ordenamiento, no hay secuencia.
Ahora procedemos a organizarlos y  ordenarlos, podemos "agruparlos", es decir juntar a todos en un orden de repetición por "clase" de edades, de esta manera, de manera:
Se puede observar que los valores extremos de los datos recolectados son 12 y 23, por lo tanto, en aras del ordenamiento y la organización construimos la siguiente tabla:
 Clase Repeticiones
 12
 13  0
 14  2
 15  6
 16  5
 17  7
 18  4
 19  4
 20  0
 21  0
 22  0
 23  1
Una observación rápida a la tabla nos permite observar una presencia mayoritaria de personas de 17 años, con minoritaria para 12 y 23 años, también se puede observar que la suma de todos las repeticiones es igual al numero de datos que se recolectaron, reconstruyendo la tabla y eliminando aquellas "clases" que no cuentan con elementos dentro de los datos recolectados se obtiene:
 Clase Repeticiones
 12
 14  2
 15  6
 16  5
 17  7
 18  4
 19  4
 23  1
 Total 30 

 

Es interesante observar que a partir de esta organización y ordenamiento, se puede obtener algunos elementos curiosos, como la suma de todas las edades de la muestra, de la siguiente manera:
 Clase Repeticiones  Total de Años de la clase 
 12  12
 14  2  28
 15  6  90
 16  5  80
 17  7  119
 18  4  72
 19  4  68
 23  1  23
 Total 30   500
Si "Graficamos" los datos organizados y ordenados, muy rápido (sin pensarlo mucho, en cuanto a ejes y valores) podemos obtener una figura donde de manera horizontal coloquemos las clases y sobre ellas los puntos correspondientes a las repeticiones, y obtendríamos lo siguiente:
         0      
       0      
         
     0  
    0   
   0  0 0   
 0  0  0  0
 12 14  15  16  17  18  19  23 
Esta "Gráfica" se llama de puntos y en ella se puede observar el "peso" o predominancia de cada clase dentro de la muestra, de esta manera si los pudieramos "calificar diriamos que "hay preponderancia de los de 17, seguidos por los de 15, 16 y a su vez por los de 18 y 19, quedando en último "posicionamiento" los del 12 y 23.
Si hacemos un "acumulativo" de las repeticiones (frecuencias) obtendríamos lo que se conoce como frecuencia acumulada, de tal manea que nuestra tabla quedaría:
 Clase Frecuencias Frecuencia Acumulada 
 12  1
 14  2  3
 15  6  9
 16  5  14
 17  7  21
 18  4  25
 19  4  29
 23  1  30
 Total 30   
En esta columna podemos observar que la frecuencia acumulada para la última clase es el total de datos con los que se cuenta, ahora calculemos las frecuencias complementarias que se obtienen a partir de la resta del total de elementos en la muestra menos la frecuencia acumulada, lo que nos daría:
 Clase Frecuencias Frecuencia Acumulada  Frecuencia Complementaria 
 12  1  29
 14  2  3  27
 15  6  9  21
 16  5  14  16
 17  7  21  9
 18  4  25  5
 19  4  29  1
 23  1  30  0
 Total 30     
De la tabla anterior podernos realizar algunos productos gráficos, por ejemplo podemos hacer la siguiente gráfica:
Análisis
Pongamos más análisis a la tabla, si observamos la tabla, podríamos determinar "¿cuál es el peso específico de cada "clase", dentro de la muestra?", es decir porcentualmente ¿cuál es el comportamiento de las clases?, de esta manera obtenemos la siguiente tabla:
 Clase Frecuencia  Frecuencia Relativa  
 12 1/30   3.33%
 14  2  2/30 6.67% 
 15  6  6/30 20.00% 
 16  5  5/30 16.67% 
 17  7  7/30 23.33%
 18  4  4/30 13.33% 
 19  4  4/30 13.33% 
 23  1  1/30 3.33% 
 Total 30   30/30  100.00%
En esta tabla hemos agregado dos columnas, en la primera colocamos la referencia del cálculo de la frecuencia relativa (se ha cambiado el título de "repeticiones" por el nombre de "frecuencia" que es la nomenclatura estadística) y en la siguiente se coloca el resultado de la división en formato de tanto por ciento.
El análisis de esta tabla, nos muestra que el 23% (aproximadamente, ya que realmente es el 23.33) de los datos se encuentran en la clase de los 17 años, también podemos observar que el 6.66% de los datos se encuentra en los 12 y los 23 años, por lo que el 93.37% está entre los 14 y los 19 años. Se hace notorio que las edades de 12 y 23 años se salen del "comportamiento aglomerante" de los datos, se dice entonces que estos datos son atípicos.
Siguiendo con el análisis, se puede observar que aproximadamente el 27% de los datos están entre 18 y 19 años, que el 60% de los datos están entre 15 y 17 años.
Podemos seguir haciendo análisis de esta tabla, pero agreguemos una columna más que nos permitirá "describir" el comportamiento de este dato en la muestra:
 Clase Frecuencia  Frecuencia Relativa    Frecuencia Relativa Acumulada.  
 12 1/30   3.33%  1/30 3.33% 
 14  2  2/30 6.67%   3/30 10.00% 
 15  6  6/30 20.00%   9/30 30.00% 
 16  5  5/30 16.67%   14/30 46.67% 
 17  7  7/30 23.33%  21/30 70.00% 
 18  4  4/30 13.33%   25/30 83.33% 
 19  4  4/30 13.33%  29/30  96.67% 
 23  1  1/30 3.33%   30/30 100% 
 Total 30   30/30  100.00%

   
En estas nuevas columnas hemos realizado un ejercicio de acumulación de las frecuencias (en este caso relativas, aun cuando se puede hacer el mismo procedimiento de acumulación para las frecuencias o repeticiones que se calcularon primero, también llamadas frecuencias absolutas) y en el podemos observar una acumulación porcentual que nos permite describir que el 30% de los datos se encuentran entre 12 y 15 años, que el 70% de los mismos se encuentran entre 12 y 17 años, que el 27% de ellos está entre 18 y 23 años.
Continuemos nuestro ordenamiento y organización de los datos ahora con nuevas columnas:
 Clase_         Frecuencia  Frecuencia Relativa    Frecuencia Relativa Acumulada    Frecuencia Relativa Complementaria   
 12 1/30   3.33%  1/30 3.33%  29/30  96.67% 
 14  2  2/30 6.67%   3/30 10.00%   27/30  90.00%
 15  6  6/30 20.00%   9/30 30.00%   21/30 70.00% 
 16  5  5/30 16.67%   14/30 46.67%   16/30 53.33% 
 17  7  7/30 23.33%  21/30 70.00%   9/30 30.00% 
 18  4  4/30 13.33%   25/30 83.33%   5/30 16.33% 
 19  4  4/30 13.33%  29/30  96.67%   1/30 3.33% 
 23  1  1/30 3.33%   30/30 100%   0/30 0% 
 Total 30   30/30  100.00%        
Esta nueva columna la hemos calculado a partir del total de datos (100%), al cual le restamos la frecuencia acumulada ahora se ha complementado nuestro análisis y podemos hacer descripciones como:  el 70% de los datos se encuentra arriba de los 15 años, el 90% de los datos se encuentra arriba de los 14 años, etc.
Si se realiza una gráfica de los datos originales utilizando el diseño de pastel (pie) podemos observar lo siguiente:
Observemos que los porcentajes mostrados por la gráfica corresponden a la frecuencia relativa, lo que nos permite expresar que la frecuencia relativa corresponde al peso especifico de cada clase con relación al total de elementos en la muestra.
Hagamos ahora una gráfica de estos datos, para ello utilizaremos la frecuencia relativa acumulada y la complementaria
En esta gráfica podemos ver un "comportamiento" de los datos acumulados y complementarios (con referencia a las frecuencias) y se observa como el acumulado, representado por la línea azul va "levantando" mientras que el complementario, representado por la línea roja, se ve disminuyendo.
Es notorio observar un "cruce" entre estas dos línea, y en términos porcentuales, se puede ver que el cruce se da aproximadamente al 50% de los datos y que estos se encuentran entre las clases 16 y 17, lo que nos podría llevar a concluir que el 50% de las edades está entre 12 y en un valor arriba de los 16 años. 
A estas gráficas se les conoce como OJIVAS y dependiendo de los valores que se grafiquen, se tendrá la ojiva acumulada o la ojiva complementaria o ambas.