Número 37 (octubre de 2014)
Big Data se escribe con V
Eva Ortoll

¿Puede una profesión considerarse “sexy”? Esto parece. Algunos expertos consideran el analista de datos como una de las ocupaciones más “sexys” del siglo XXI. El atractivo recae en la necesidad que las organizaciones tienen (o deberían tener) de contar con profesionales que sepan gestionar grandes volúmenes de datos. El big data ha llegado para quedarse y nos ha seducido. Ahora bien, ¿estamos preparados para afrontar esta relación? ¿La entendemos? ¿Podemos hacer que sea una relación enriquecedora? 

Según un estudio internacional de la compañía Gartner un 64% de grandes empresas tienen previsto implementar un proyecto de big data (macrodatos) durante el año 2014. El mismo estudio apunta que se prevé un alto índice de fracaso (alrededor del 85%) de estas iniciativas. Parte del problema es cómo se entiende el big data, la formación de especialistas y el nivel de madurez de las organizaciones respecto a la gestión de información.

 

La idea de utilizar y analizar datos para tomar decisiones, ser más competitivos o innovar no es nueva. El business analytics (análisis de negocios), centrado en la explotación de los datos internos de una empresa, nace aproximadamente hacía 1950; la inteligencia competitiva, focalizada en la explotación de información del entorno, coge impulso a partir de 1960. Así pues, ¿qué diferencia el big data de los datos tradicionales?

 

El big data nace de los adelantos tecnológicos y, también, del cambio de hábitos en las interacciones sociales (en parte provocadas por estos adelantos). Los macrodatos están por todas partes, cada vez hay más, y nosotros, curiosamente, somos responsables de su incremento. Podríamos decir que los generamos a cada exhalación que hacemos (trazas en Internet, llamadas de móviles, interacciones en las redes sociales, transacciones de comercio electrónico...). Para entender la fuerza de su seducción debemos indagar en su esencia. Tradicionalmente el big data se ha explicado a partir de las tres V (volumen, velocidad y variedad) a las que añadimos veracidad, valor y visualización. Veámoslo.

 

Volumen, probablemente la característica principal con la que todo el mundo asocia el big data. De acuerdo con McAfee y Brynjolfsonn (2012), la producción de datos se dobla cada 40 meses, esto quiere decir que se generan más datos en un día que los que han existido en los últimos 20 años.

 

Velocidad, en su creación y análisis. Los datos se generan de forma continuada. Por poner un ejemplo sencillo, cuando hacemos un “me gusta” en una red social estamos creando nuevos datos, cuando empleamos el GPS, cuando compramos un billete de avión, cuando pedimos hora al médico. Producimos datos de forma constante. Este dinamismo permite disponer de información en tiempo real y provoca el reto de hacer análisis bastante detallados y complejos que a menudo se integran en los procesos de trabajo y sistemas.

 

Variedad, de formatos y tipologías. Los datos provienen de diferentes recursos que hay que combinar e integrar. Una reciente editorial (2014) del Academy of Management Journal identifica cinco tipos clave de macrodatos y los recursos de donde derivan:

 

Datos públicos: datos que tienen los gobiernos, ayuntamientos, comunidades locales, (por ejemplo, datos sobre transporte, uso de energía, sanidad, etc.).

 

Datos privados: datos fruto de transacciones comerciales, de la navegación web a un lugar determinado, del uso de la telefonía móvil.

 

Data exhaust: datos ambientales que se recogen de forma pasiva. Estos datos no tienen utilidad para aquellos quien las captan pero que combinadas con otros datos pueden aportar valor.

 

Datos comunitarios: datos producidos principalmente en las redes sociales, contenidos generados por el usuario, etc.

 

Self-quantifiaction data: datos proporcionados por los individuos al cuantificar sus comportamientos y acciones. Por ejemplo, los datos monitorizados sobre las pulsaciones durante la realización de ejercicio físico que son recogidos por dispositivos móviles.

 

Dado que parece que estamos destinados a que cualquier actividad humana pueda ser traducida en “dato”, debemos ser cautos al tomar decisiones en base a datos. Estos deberían ser fiables, íntegros y auténticos. Nos hace falta, pues, asegurarnos de la Veracidad de los datos (y aquí entra en juego la cuarta V). ¿Y cómo sabemos si los datos son válidos? ¿Hay que saberlo? En la mayoría de casos las organizaciones necesitan decidir con qué tipo de datos quieren trabajar; de qué fuentes o recursos los obtendrán, cómo los almacenarán y cómo todo ello condicionará su procesamiento y análisis. Una política clara en este sentido puede suponer una característica diferencial y competitiva al explotar el big data. La preparación de datos para analizar consume mucho tiempo, hace falta, pues, prestar atención al proceso.

 

¿Y cómo lo hacemos para digerir toda esta amalgama de inputs? ¿Qué debemos hacer ante tanta exuberancia? ¿Cómo mantenemos el atractivo? Siempre se ha dicho que una imagen vale más que mil palabras. Nuestro idilio con el big data pasa por ponernos guapos. Y en este momento tan importante en la carta de presentación, las técnicas de Visualización de información tienen mucho que decir. La quinta V, la visualización, es un aliado imprescindible para explicar resultados complejos de forma sencilla. Ponernos nuestro mejor traje de noche será imprescindible pero no suficiente. Algunos expertos apuntan además la tendencia de la visualización interactiva que permita a los usuarios personalizar e interactuar con los resultados. Estas representaciones visuales algunas veces tendrán que ir acompañadas de una breve narrativa para proporcionar contexto y sentido.

 

Una vez resueltas (a grandes rasgos) las cuestiones relativas a la captura y procesamiento técnico, la discusión se debe enfocar sobre los ouputs. ¿Qué insights obtenemos, o querríamos conseguir, del tratamiento de estos grandes volúmenes de datos? ¿Cómo dar una utilidad práctica al big data? ¿Qué nos aporta? ¿Nos sirve para mejorar? Más allá de las modas, estos grandes volúmenes de datos, todos estos esfuerzos, todas estas V nos tienen que aportar algo. Y aquí añadimos la sexta V, el Valor. Trabajar con big data tiene que servir para crear valor a los individuos, los negocios, la ciencia, la sociedad y los gobiernos. Procesar toda esta información (perdón, estos datos) tiene que ayudar a fomentar la innoVación, la competitiVidad, y promover una mejor calidad de Vida.

 

Tal como apunta DaVenport en varios de sus escritos, la gestión de datos tiene que ir acompañada y alineada con la estrategia de negocio. Se deben repensar los modelos y enfoques de gestión, las competencias clave, los roles de los trabajadores y la introducción de nuevos perfiles profesionales. Es necesario, en definitiva, que las organizaciones adopten una política organizativa y una Visión claras para actuar ante el big data.

 

Las organizaciones de nuestro entorno quieren mantener el sex-appeal que les da trabajar con big data. La pregunta es, ¿tienen estas organizaciones la madurez, y la formación, que requiere la implementación del big data? ¿Existe una estrategia para que el big data sea útil y efectivo? Comentábamos al inicio que el big data ha llegado para quedarse, abrámosle la puerta, pero miremos que no se convierta en un big caos.

 

Para saber más:

 

López Borrull, A. (2013). “’Smart Researchers’ o datocracia?”, COMeIN, n.º 27.

 

Davenport, T. H.; Barth, P.; Bean, R. (2012). “How ‘Big Data’ is different”, Sloan Management Review, p. 43-46.

 

George, G.; Maas, M.R.; Pentland, A. (2014). “Big Data and Management, Academy of Management Journal, vol. 57, n.º 2, p. 321-326.

 

McAfee, A.; Brynjolfsson, E. (2012), “Big Data: the management revolution”, Harvard Business Review, vol. 90, n.º 10, p. 61-68.

 

Comparte
??? addThis.titol.compartir ???