Número 37 (octubre de 2014)
Big data s’escriu amb V
Eva Ortoll

Pot una professió considerar-se “sexy”? Això sembla. Alguns experts consideren l’analista de dades com una de les ocupacions més “sexys” del segle XXI. L’atractiu recau en la necessitat que les organitzacions tenen (o haurien de tenir) de comptar amb professionals que sàpiguen gestionar grans volums de dades. El big data ha arribat per quedar-se, i ens ha seduït. Ara bé, estem preparats per a afrontar aquesta relació? L’entenem? Podem fer que sigui una relació enriquidora? 

Segons un estudi internacional de la companyia Gartner un 64% de grans empreses tenen previst implementar un projecte de big data (dades massives) durant l’any 2014. El mateix estudi apunta que es preveu un alt índex de fracàs (entorn del 85%) d’aquestes iniciatives. Part del problema té a veure en la manera com s’entén el big data, la formació d’especialistes i el nivell de maduresa de les organitzacions respecte a la gestió d’informació.

 

La idea d’utilitzar i analitzar dades per a prendre decisions, ser més competitius o innovar no és nova. El business analytics (anàlisi de negocis), centrat en l’explotació de dades internes d’una empresa, neix aproximadament cap a 1950; la intel·ligència competitiva, focalitzada en l’explotació d’informació de l’entorn, agafa embranzida a partir de 1960. Així, doncs, què diferencia el big data de les dades tradicionals?

 

El big data neix dels avenços tecnològics i, també, del canvi d’hàbits en les interaccions socials (en part provocades per aquests avenços). Les dades massives són pertot arreu, cada cop n’hi ha més, i nosaltres, curiosament, som responsables del seu increment. Podríem dir que les generem en cada exhalació que fem (traces a Internet, trucades de mòbils, interaccions en les xarxes socials, transaccions de comerç electrònic...). Per tal d’entendre la força de la seva seducció cal indagar en la seva essència. Tradicionalment el big data s’ha explicat a partir de les tres V (volum, velocitat i varietat) a les quals afegim veracitat, valor i visualització. Vegem-ho.

 

Volum, probablement la característica principal amb la qual tothom associa el big data. D’acord amb McAfee i Brynjolfsonn (2012), la producció de dades es dobla cada 40 mesos, això vol dir que es generen més dades en un dia que les que han existit en els darrers 20 anys.

 

Velocitat, en la seva creació i anàlisi. Les dades es generen de forma continuada i instantània. Per posar un exemple senzill, quan fem un “m’agrada” a una xarxa social produïm noves dades, quan emprem el GPS, quan comprem un bitllet d’avió, quan demanem hora al metge... Produïm dades de forma constant. Aquest dinamisme permet disposar d’informació en temps real i provoca el repte de fer anàlisis força detallades i complexes que sovint s’integren en els processos de treball i sistemes.

 

Varietat, de formats i tipologies. Les dades provenen de diferents recursos que cal combinar i integrar. Una recent editorial (2014) de l’Academy of Management Journal identifica cinc tipus clau de dades massives i els recursos d’on deriven:

 

Dades públiques: dades que tenen els governs, ajuntaments, comunitats locals (per exemple, dades sobre transport, ús d’energia, sanitat, etc.).

 

Dades privades: dades fruit de les transaccions comercials, de la navegació web a un lloc determinat, de l’ús de la telefonia mòbil.

 

Data exhaust: dades ambientals que es recullen de forma passiva. Aquestes dades no tenen utilitat per a aquells qui les capten però que combinades amb altres dades poden aportar valor.

 

Dades comunitàries: dades produïdes principalment a les xarxes socials, continguts generats per l’usuari, etc.

 

Self-quantifiaction data: dades proporcionades pels individus en quantificar els seus comportaments i accions. Per exemple, les dades monitoritzades sobre les pulsacions durant la realització d’exercici físic que són recollides per dispositius mòbils.

 

Atès que sembla que estem destinats al fet que qualsevol activitat humana pugui ser traduïda en “dada”, cal anar amb cautela en prendre decisions sobre la base de les dades. Aquestes haurien de ser fiables, íntegres i autèntiques. Ens cal, doncs, assegurar-nos de la Veracitat de les dades (i aquí entra en joc la quarta V). I com podem saber si les dades són vàlides? Ens cal saber-ho? En la majoria de casos les organitzacions necessiten decidir amb quin tipus de dades volen treballar; de quines fonts o recursos les obtindran, com les emmagatzemaran i com tot plegat condicionarà el seu processament i anàlisi. Una política clara en aquest sentit pot representar un tret diferencial i competitiu a l’hora d’explotar el big data. La preparació de dades per analitzar consumeix molt de temps; cal, doncs, prestar-hi atenció.

 

I com ho fem per a digerir tota aquesta amalgama d’inputs? Què fem davant tanta exuberància? Com mantenim l’atractiu? Sempre s’ha dit que una imatge val més que mil paraules. El nostre idil·li amb el big data passa per posar-nos guapos. I en aquest moment tan important en la carta de presentació, les tècniques de Visualització d’informació hi tenen molt a dir. La cinquena V, la visualització, és un aliat imprescindible per a explicar resultats complexos de forma senzilla. Posar-nos el nostre millor vestit de nit serà imprescindible però no suficient. Alguns experts apunten a més la tendència de la visualització interactiva que permeti als usuaris personalitzar i interactuar amb els resultats. Aquestes representacions visuals alguns cops hauran d’anar acompanyades d’una breu narratiVa per a proporcionar context, i sentit, a tot plegat.

 

Un cop resoltes (a grans trets) les qüestions relatives a la captura i processament tècnic, la discussió s’ha d’enfocar sobre els ouputs. Quins insights obtenim, o voldríem aconseguir, del tractament d’aquests grans volums de dades? Com podem donar una utilitat pràctica al big data? Què ens aporta? Ens serveix per a millorar? Més enllà de les modes, aquests grans volums de dades, tots aquests esforços, totes aquestes V ens han d’aportar quelcom. I aquí hi afegim la sisena V, el Valor. Treballar amb big data ha de servir per a crear valor als individus, els negocis, la ciència, la societat i els governs. Processar tota aquesta informació (perdó, aquestes dades) ha d’ajudar a fomentar la innoVació, la competitiVitat, i promoure una millor qualitat de Vida.

 

 

Tal com apunta DaVenport en diversos dels seus escrits, la gestió de dades ha d’anar acompanyada i alineada amb l’estratègia de negoci. S’han de repensar els models i enfocaments de gestió, les competències clau, els rols dels treballadors i la introducció de nous perfils professionals. Cal, en definitiva, que les organitzacions adoptin una política organitzativa i una Visió clares per a actuar davant el big data.

 

Les organitzacions del nostre entorn volen mantenir el sex-appeal que els dóna treballar amb big data. La pregunta és, tenen aquestes organitzacions la maduresa, i la formació, que requereix la implementació del big data? Existeix una estratègia perquè el big data sigui útil? Dèiem en començar que el big data ha arribat per quedar-se, obrim-li la porta, però mirem que no esdevingui un big caos.

 

Per a saber-ne més:

López Borrull, A. (2013). “Smart Researchers ‘ o dadacràcia?, COMeIN, núm. 27

 

Davenport, T. H.; Barth, P.; Bean, R. (2012). “How ‘Big Data’ is different”, Sloan Management Review, pàg. 43‐46.

 

George, G; Maas, M.R.; Pentland, A. (2014). ”Big Data and Management”, Academy of Management Journal, vol. 57, núm. 2, pàg. 321-326.

 

McAfee, A.; Brynjolfsson, E. (2012), “Big Data: the management revolution”. Harvard Business Review, vol. 90, núm. 10, pàg. 61-68.

 

intel·ligència competitiva;  gestió de la informació;  mitjans socials; 
Comparteix
??? addThis.titol.compartir ???