La forma de los datos

Featured

Un dato aislado por si solo no puede transmitirnos información suficiente acerca de algún hecho, pero un conjunto de datos entorno al hecho si puede hacerlo.  Los datos agrupados y ordenados pueden representarse gráficamente y tomar diferentes formas, tales como curvas o histogramas, por ejemplo.  La información reflejada de esta manera puede mostrarnos patrones identificables a simple vista que van desde la identificación de lotes de productos defectuosos hasta el comportamiento de los ciclos de nuestro modelo de negocio.

Un conjunto suficientemente grande de datos tiende a estar normalmente distribuido siempre y cuando los datos medidos no presenten cambios muy dispersos.  La forma que adoptan estos datos es la de una curva de distribución normal.

Distribución normal

La forma que adoptan los datos nos ayuda a explorarlos, a orientar el análisis de estos y a conocer las características generales que presenta el fenómeno registrado.  Por ejemplo a primera vista la gráfica de distribución normal nos indica que los datos que se encuentran en los extremos son datos sobresalientes ya que nos pueden indicar comportamientos fuera de serie sobre el hecho que estamos revisando y volverse particularmente interesantes.  Así mismo los datos localizados bajo la parte central de la curva nos habla de cual es el comportamiento considerado normal, para un hecho dado, y las condiciones que deben prevalecer para que ocurra con frecuencia.

Existen otras formas que toman los datos y que nos dicen diferentes cosas acerca de los acontecimientos registrados como por ejemplo los diferentes tipos de histogramas:

Tipos de histogramas

Otro manera en la que la forma de los datos nos ayuda es, identificando patrones.  Por ejemplo en lo que se conoce como “patrones de computo en la nube” para identificar los tipos de carga de trabajo que ocurren en un modelo de negocio determinado para saber como utilizará sus recursos de computo a la nube.

Patrones de computo en la nube

Espero que esta reflexión acerca de la forma de los datos sirva como un primer acercamiento a los métodos estadísticos que nos son útiles cuando revisamos un conjunto de datos (de cualquier tamaño) de primera instancia y con el mínimo de información acerca de ellos.

Hasta la próxima y mientras tanto déjense guiar por los datos. 8)