Estem envoltats, o millor dit, submergits en un món de dades. Com a ciutadans, pacients, treballadors, consumidors, estudiants, acadèmics i investigadors no parem de generar noves dades i de reutilitzar-ne. Què entenem per dada?
El diccionari de la llengua catalana defineix dada amb quatre significats principals: “qualsevol informació que facilita la formació d’una idea, d’un judici, d’una conclusió”, “informació representada d’una manera convencional que en permet la interpretació, el processament, etc.”, “una investigació matemàtica, cadascun dels elements coneguts (magnituds, figures, relacions) a partir dels quals han d’ésser deduïts els elements desconeguts” o “cadascun dels grups d’operadors o factors que consisteixen en un conjunt de xifres, caràcters alfabètics o símbols que no denoten cap condició, valor o estat”.
Dades de recerca? Dades per a la recerca? Què en sabem de les dades?
Conceptes com
big data o dades massives,
data science i accés obert —i tot allò que tingui una relació directa, com per exemple periodisme de dades— han tingut cabuda en la
International Open Data Conference (IODC) que ha tingut lloc a Madrid el dies 6 i 7 d’octubre amb més de 1.500 assistents.
El congrés també dóna visibilitat als actes previs, com el del dia 5 d’octubre organitzat per la
Red Española sobre Datos de Investigación en Abierto, coneguda com a
Maredata, i integrada per set universitats, entre elles la UOC (la Universitat d’Alacant; la Universitat de Barcelona; la Universidad Carlos III de Madrid; la Universitat Politècnica de València; IATA-CSIC; Ingenio-CSIC i la Universitat Oberta de Catalunya). Una sessió intensa, amb representants de diferents empreses, projectes i grups de recerca que treballen amb dades i, sobretot, amb perspectives i punts de vista molt diferents.
La xerrada d’obertura va anar a càrrec del Dr. Ernest Abadal, coordinador de la xarxa, i duia per títol “Datos abiertos de investigación: algunas preposiciones”. En resum, Abadal feia un repàs del context des de la preposició ante, és a dir, davant les dades en accés obert quin context tenim -l’obligatorietat que marca l’H2020 de difondre les dades d’investigació i la importància de la seva reutilització passant pel marc de la Ciència Oberta. Seguida amb el para, les polítiques existents per a les dades com per exemple la LERU Roadmap for research data; anava més enllà amb sobre, esmentant que les dades han de ser FAIR (Findable, Accessible, Interoperable, Re-usable). Una altra de les preposicions recollides va ser según, que enllaçà amb els usuaris i esmentà estudis per a conèixer l’ús, els hàbits i les opinions dels investigadors. La nova preposició vía va ser l’enllaç directe per a parlar de la importància i el paper central que tenen els repositoris o portals per tal de dipositar i consultar aquestes dades; seguidament amb tras o darrere, va posar el focus en les metadades associades a les dades i la importància que des de la disciplina hi donem. Per tancar el repàs d’algunes preposicions, Abadal ho va fer amb el con, és a dir, les biblioteques i el suport que poden donar en la gestió de les dades; i la darrera va ser y com a excusa per a parlar de què queda per fer i enllaçar-ho amb el naixement de la xarxa Maredata.
L’objectiu principal d’aquesta xarxa, que té finançament per dos anys, és “aglutinar i consolidar la col·laboració entre grups de recerca espanyols centrats en l'estudi de les dades científiques i també establir relació amb aquells sectors i disciplines interessats en aquesta temàtica”. Maredata vol teixir una xarxa multidimensional on la producció científica dels seus membres sigui compartida i coneguda i, com a objectius específics, vol:
o Coordinar les actuacions i línies d'investigació dels diferents grups.
o Identificar i contactar amb els grups de recerca que generen dades d'investigació en programes H2020.
o Detectar agents interessats en el tractament i difusió de les dades de recerca.
o Facilitar la generació de noves línies d'investigació al voltant de Open Data i Open Science.
o Facilitar i fomentar la internacionalització dels grups participants.
o Elaborar recomanacions sobre gestió de les dades de recerca.
El programa de la sessió va comptar amb una segona xerrada a càrrec de Jesualdo Tomás Fernández Breis, de la Universitat de Múrcia, titulada “Datos abiertos para mejorar la gestión de la investigación” (
Proyecto Hércules, CRUE-TIC). Seguidament hi va haver temps per a presentar la secció dels punts de vista, en què van disposar de tres minuts per a explicar la idea del projecte: Alberto Abella,
Meloda; Nancy Gómez, alumna de doctorat de la UC3M; María Pereda, Grupo Interdisciplinar de Sistemas Complejos. UC3M; Makx Dekkers, consultor independent; Antonio Sánchez Padial, Ministerio de Agricultura; Martín Álvarez Espinar, Oficina W3C-España, i Rosa Arias, de F-Iniciativas. Seguidament els assistents van participar en un taller i espai de debat amb el nom “Relaxing cup of café con leche”.
La segona part de la sessió va ser una taula rodona amb els agents implicats de les dades de recerca i per a la recerca, amb Cecilia Cabello de la FECYT, Alfonso Valencia: Grupo de Biología Computacional Estructural, CNIO i Roberto Magro Pedroviejo dels Servicios Interactivos del Ayuntamiento de Alcobendas, moderada pel Alexandre López-Borrull, professor dels Estudis. Per tancar l’acte es van presentar les conclusions del projecte
Datasea, vinculat a la xarxa, i del
workshop.
Citació recomanada
OLLÉ, Candela. Un mar de dades. COMeIN [en línia], octubre 2016, núm. 59. ISSN: 1696-3296. DOI: https://doi.org/10.7238/c.n59.1668