Tomar mejores decisiones con el Big Data

Tomar mejores decisiones con el Big Data Tomar mejores decisiones con el Big Data

La Library of Congress de Washington está considerada como la mayor biblioteca del mundo. Si se digitalizara todo su fondo bibliográfico, que supera los veinte millones de libros, toda la información cabría en apenas 235 terabytes. Una cifra no muy alta, teniendo en cuenta que, según la consultoría McKinsey1, una empresa de mil trabajadores genera anualmente el mismo volumen de datos. Al agregar los datos generados por todas la empresas medianas, ya estaríamos hablando de exabytes o de millones de terabytes. Para hacernos una idea de las unidades de almacenamiento, quinientos terabytes eran los datos que se añadían a las bases de datos de Facebook cada día en 2012, y un exabyte es el volumen de información que se generaba ese mismo año en Internet. De hecho, para imprimir un exabyte en papel serían necesarios quinientos mil millones de árboles, muchos más de los que tiene el planeta (ver figura 1 en la página siguiente).

Hoy en día, empresas como la cadena de supermercados americana Walmart están generando un millón de transacciones de clientes cada hora, lo que equivale a alimentar sus bases de datos con 2,5 petabytes2, o el equivalente a 167 veces el volumen de datos de la Library of Congress cada hora.

Durante años, Walmart ha construido sofisticados sistemas de información para sacar partido de este volumen de datos. Por ejemplo, cuando se produce la alerta de la llegada de un huracán, los supermercados de la zona afectada no tan solo abastecen las estanterías con linternas, pilas, conservas, agua, tablones, etc., sino que se multiplica por siete el stock normal de Pop Tart de la marca Kellogg's de sabor de fresa. Mientras los primeros productos son los que nos marca el sentido común, en el segundo caso se trata de un comportamiento del consumidor que solo se hace evidente cuando analizamos el histórico transaccional de muchos supermercados de Walmart que han estado en zonas de alerta de huracanes.

En el caso de Walmart, los datos que se analizan son los que posee la empresa, derivados de las transacciones que realizan en su actividad comercial. Este tipo de datos son estructurados, y las empresas los almacenan en las bases de datos relacionales (ERP, CRM, etc.) para analizarlos y obtener business intelligence.

Sin embargo, cuando hablamos  de Big Data, no nos referimos solo a que el volumen de datos es muy elevado, como sería el caso de  Walmart, sino a la naturaleza de dichos datos, que ex...