Creació del Pla de Gestió de Dades

Els Plans de Gestió de Dades (PGD) són elements imprescindibles per a assegurar una correcta gestió de les dades d'investigació. A més, també s'està convertint en un requisit per a optar a finançament de projectes d'investigació, per exemple:

  • L'Horitzó Europa (2021-2027) obliga a redactar i mantindre un PGD, seguint amb l'establert en l'anterior pla, l'H2020 que ja obligava a realitzar un PGD que actualitzable al llarg del projecte

  • S'ha de redactar un PGD en els Projectes I+D+i corresponents a la convocatòria de l'any 2021 d'ajudes del Pla Estatal d'Investigació Científica, Tècnica i d'Innovació 2021-2023 siguiendo el marcat a l'anterior Pla Estatal d'Investigació Científica i Tècnica i d'Innovació 2017-2020

 

Un PGD descriu el cicle de vida de la gestió de les dades en la utilització, processament i generació per a aconseguir que les dades d'investigació siguen localitzables, accessibles, interoperables i reutilitzables; és a dir, que siguen FAIR (Findable, Accessible, Interoperable and Reusable).

 

Un PGD ha d'incloure informació sobre:

  • Determinar els requisits de l'entitat finançadora

  • Identificar les dades que s'utilitzaran: tipologia, procedència, formats, etc.

  • Definir com s'organitzaran i gestionaran les dades: control de versions, nom de fitxers, etc.

  • Explicar com es documentaran les dades

  • Descriure com s'assegura la qualitat de les dades

  • Preparar una estratègia d'emmagatzematge i preservació de les dades

  • Definir les polítiques de dades del projecte: propietat intel·lectual, tractament de dades sensibles i personals, etc.

  • Descriure com es difondran les dades: on, quins i quan es difondran, etc.

  • Assignar rols i responsabilitats

  • Preparar un pressupost realista per a la gestió de les dades

 

Creació PGD

Font: REBIUN10 passos per elaborar un Plan de Gestió de Dades 

 

En les pestanyes de la part superior hi ha plantilles, eines i exemples per a facilitar la creació d'un PGD, com ara la guia per a l'elaboració d'un PGD en el context de la UPV i les Recomanacions per a les teues dades d'investigació.

El Digital Curation Center (DCC) ha publicat el Checklist for a Data Management Plan que facilita la realització d'un Pla de Gestió de Dades (PGD)

 

D'altra banda, Science Europe ha publicat la Practical Guide to the International Alignment of Research Data que proporciona una guia per a redactar un PGD. A més a més, té un capítol dedicat a l'avaluació del PGD, que pot ser utilitzat tant per revisors com pels propis investigadors com una ferramenta per a l'autoavaluació del PGD

 

De manera més específica, s'ha desenvolupat una guia per a l'elaboració d'un PGD en el context de la UPV. Aquesta guia, basada en la realitzada per Science Europe, pretén:

  • Mostrar els diferents aspectes que ha de tenir un PGD

  • Ajudar a entendre i facilitar la resposta a les qüestions que es plantegen

  • Fer conèixer els diferents serveis que ofereix la UPV que estan relacionats amb la gestió de les dades d'investigació

 

També hi ha diverses recomanacions i guies per a la creació d'un PGD enfocat al mandat del H2020.

Comptem així mateix amb una plantilla disponible per al programa  Horizon Europe: Data Management Plan Template HORIZON EUROPE.

Argos és una eina online desenvolupada per OpenAIRE per a la creació, gestió, difusió i enllaç d'un PGD, que fa èmfasi en l'aplicació dels principis FAIR i en les millors pràctiques per a fomentar l'accessibilitat a les dades d'investigació. Aquestes són algunes de les seues característiques:

  • Assistent per a la creació del PGD en funció del finançador.

  • Assistent per a la descripció de les dades d'investigació, de manera que permet reutilitzar-los en diferents PGDs.

  • Assignació d'un DOI per al PGD si es publica, per la qual cosa es facilita la visibilitat i citació del propi PGD.

  • Exportació del PGD en formats comprensibles per màquines (xml, json) i per persones.

  • Servei inclòs en l'European Open Science Cloud (EOSC), iniciativa promoguda per la Comissió Europea.

  • Recomanada per BUVAL, consorci que agrupa a les cinc biblioteques universitàries públiques de la Comunitat Valenciana.

 

Es pot trobar més informació sobre Argos consultant la GUIA D'US elaborada per la biblioteca o les FAQs

 

DMPonline és una eina online desenvolupada pel Digital Curation Centre que facilita la creació, revisió i difusió del PGD. Aquestes són algunes de les seues característiques:

  • Permet treballar en el PGD de manera col·laborativa entre diversos investigadors

  • Creació de PGD a partir de plantilles específiques per a diferents agències de finançament (H2020, Wellcome Trust, etc.)

  • Es proporciona informació que ajuda a emplenar cadascun dels apartats del PGD

  • Descàrrega del PGD en format PDF per a poder adjuntar-ho en propostes de finançament

 

A continuació es mostren diversos exemples de PGD:

  • Digital Curation Center (DCC): exemples de PGD seguint les indicacions de diferents agències de finançament (H2020, Wellcome Trust, etc.)

  • DMPonline: exemples de PGD públics dipositats en l'eina DMPonline

  • DMP Catalogue: exemples de DMP organitzats per temàtiques. Cada DMP ha sigut revisat per un grup de treball de LIBER per a indicar les fortaleses i febleses de cada PGD

Pujar

Treballar amb les dades

Cada vegada hi ha més polítiques i mandats d'agències de finançament, institucions i revistes que obliguen o recomanen el dipòsit en accés obert de les dades d'investigació en repositoris de dades. La localització i reutilització d'aquestes dades presenta múltiples beneficis

 

Hi ha diferents eines per a trobar dades d'investigació que poden ser reutilitzades:

  • Dimensions: conté més de 8 milions de datasets de Figshare, Dryad, Zenodo, Pangaea, Mendeley i més de 900 repositoris de DataCite

  • DataCite: proporciona una interfície on és possible cercar, filtrar i extraure informació sobre milers de dades d'investigació.

  • Scholexplorer: recull informació sobre dades d'investigació a partir de diverses fonts, com ara CrossRef, DataCite i OpenAIRE. En molts casos enllaça les dades d'investigació amb les publicacions científiques que han usat aquestes dades.

  • Google Dataset Search: ofereix dades d'investigació de diferents fonts. És possible filtrar els resultats per drets d'ús, format de descàrrega, etc.

  • Directoris de repositoris de dades: permeten localitzar repositoris de dades temàtiques o multidisciplinàries. Per exemple, re3data.org i Fairsharing.org.

  • EUDAT B2FIND: eina de descobriment que dona accés a les dades d'investigació dipositats, entre d’altres, en EUDAT B2SHARE.

  • Mendeley Data: proporciona accés a dades d'investigació publicades en repositoris de dades com són Dryad o Zenodo i també en publicacions de l'editorial Elsevier.

El nom i l'estructura dels fitxers que contenen les dades d'investigació faciliten la comprensió i futur ús de les dades. Per això, es poden seguir les recomanacions següents:

  • Realitzar una estructura jeràrquica senzilla de comprendre, amb directoris que agrupen els fitxers de dades

  • Utilitzar un sistema descriptiu i consistent que se seguirà per a nomenar tots els fitxers

  • No utilitzar noms de fitxers massa llargs, ja que hi poden haver problemes amb determinats programes

  • Evitar l'ús de caràcters especials ~ ¡ ! @ # $ % ^ & * ( ) ` ; < > ¿ ? , [ ] { } ' " |

  • Evitar l'ús de l'espai en blanc, en el seu lloc és millor usar el guió baix _

  • Per a registres que tenen diverses versions, és aconsellable marcar al final del nom el número de versió, per exemple, v01, v02, etc. Per a la versió final es pot finalitzar el nom del fitxer amb el text FINAL

 

Hi ha eines que permeten canviar de nom en bloc múltiples fitxers:

És recomanable utilitzar formats oberts en els fitxers que contenen les dades d'investigació per a així assegurar que la majoria del programari siga capaç d'interpretar les dades contingudes. De totes maneres, cal no oblidar que hi ha disciplines que utilitzen certs formats propietaris de manera generalitzada

 

A continuació, es mostren una sèrie de formats de fitxers recomanats en funció del tipus de dades que conté:

  • Bases de dades: XML, CSV

  • Text: TXT, ODT, RTF, XML

  • Estadístiques: ASCII, DTA, POR, SAS, SAV

  • Dades tabulades: CSV, TSV

  • Geoespacials: SHP, DBF, GeoTIFF, NetCDF

  • Vídeo: OGG, MP4

  • So: FLAC, WAV, AIFF, MP3

  • Imatges: TIFF, BMP

  • Fitxers comprimits: no es recomana l'ús de fitxers comprimits

 

Per a més informació sobre formats recomanats en fitxers que contenen dades d'investigació es pot consultar el UK Data Service

 

Com que els formats de fitxers amb tabulats (CSV, TSV, XLS, XLSX, etc.) són uns dels més habituals que contenen dades d'investigació, la Iniciativa de dades obertes del Govern d'Espanya (datos.gob.es) ha elaborat una Guia pràctica per a la publicació de dades tabulars en arxius CSV.


Font: Secretaria d'Estat de Digitalitzacióo i Inteligència Artificial del Ministeri d'Assumptes Econòmics i Transformació Digital. https://datos.gob.es/sites/default/files/doc/file/cheat_sheet_csv_vf.pdf


El format dels fitxers que contenen les dades d'investigació resulta fonamental per a la seua futura reutilització. Tim Berners-Lee, el creador del web, va proposar un esquema de 5 estrelles per a classificar els formats dels fitxers en funció del grau d'obertura, que dona a més un seguit de beneficis que s'aconsegueixen en cadascuna de les estrelles:

1 estrella: publica les teues dades al web (amb qualsevol format) i sota una llicència oberta

2 estrelles: les publica com a dades estructurades, per exemple, Excel en comptes d'una imatge d'una taula escanejada

3 estrelles: usa formats no propietaris, per exemple, CSV en comptes d'Excel

4 estrelles: usa URIs per a identificar coses, així la gent hi pot apuntar, una manera de representar les dades és utilitzar RDF

5 estrelles: enllaça les teues dades a altres dades per a proveir-les de context, per a facilitar la reutilització i optimar les cerques


Font: https://5stardata.info/es/

Per a una correcta compressió i utilització de les dades d'investigació, es recomana que es cree un fitxer anomenat “README” en format txt. Aquest fitxer està situat juntament amb la resta de fitxers que contenen les dades d'investigació i conté la informació següent (en anglès):

  • Informació general:

    • Títol del dataset

    • Nom, afiliació, adreça i a/e de l'investigador principal i els coautors

    • Data de creació i localització de les dades

    • Informació sobre fonts de finançament

    • Breu descripció del conjunt de dades

    • Paraules clau

  • Llicències i restriccions d'ús de les dades

  • Informació sobre els arxius: nom i descripció dels arxius, versió, grandària del conjunt de dades, etc.

  • Informació sobre la metodologia: descripció de la metodologia per a la creació i processament de les dades

  • Informació específica sobre les dades:

    • Llista de variables: noms complets i encapçalaments en les columnes per a dades tabulades

    • Unitats de mesura

    • Definició de codis o símbols usats per a registrar dades que falten

 

Per a facilitar la creació del fitxer README s'ha creat una plantilla a partir de la realitzada per la Universitat Cornell

Les dades d'investigació han de complir amb els principis FAIR (Findable, Accessible, Interoperable, Reusable), per la qual cosa resulta imprescindible adjuntar a les dades d'investigació les metadades que les descriuen d'una manera completa i normalitzada.

 

Normalment cada disciplina acadèmica té iniciatives on es descriuen els esquemes de metadades que han de ser utilitzades per a una correcta descripció, interpretació i reutilització de les dades d'investigació. En el cas que no hi haja esquemes de metadades específiques per a una disciplina, també es poden usar altres esquemes genèrics de dades d'investigació.

 

A més dels esquemes de metadades, en molts casos s'han desenvolupat eines que faciliten la creació i/o captura de metadades per a cada esquema de metadades.

 

El Digital Curation Center (DCC) disposa d'un directori sobre metadades per a dades d'investigació amb les característiques següents:

  • Esquemes de metadades per disciplina acadèmica: biologia, ciències de la terra, ciències socials i humanitats, física i multidisciplinàries.

  • Perfils i extensions: esquemes que han sigut adaptats per a l'ús de tipus de dades específiques o per a l'ús en determinats tipus de repositoris.

  • Casos d'ús: especificacions de les metadades que s’han de dipositar en determinats repositoris de dades.

  • Eines: programes desenvolupats per a la captura o emmagatzematge de metadades d'un determinat esquema.

Al llarg de qualsevol investigació es van generant documents que es creen i modifiquen per una o diverses persones. Això fa que es generen diferents versions d'un mateix document. Si les versions no es gestionen correctament, es poden produir situacions negatives: pèrdua de dades, replicació de treballs, pèrdua de temps, etc.

 

Per a afrontar aquests problemes, seguint les recomanacions d'OpenAIRE, hi ha diverses solucions que van des d'un nom normalitzat dels fitxers fins a la utilització de sistemes de control de versions.

 

Els sistemes de control de versions, especialment utilitzats en el desenvolupament de programari, presenten diverses característiques:

  • Treballar amb versions en desenvolupament

  • Mantenir versions estables

  • Participació de diferents persones de manera concurrent

  • Detectar canvis realitzats en les diferents versions, així com qui i quan es van realitzar

  • Documentació en les versions

 

El funcionament bàsic d'aquests sistemes és:

  • Codi estable situat en un repositori

  • Creació d'una còpia del codi des del repositori fins a l'equip local

  • Desenvolupament i testatge del nou codi en l'equip local

  • Pujada al repositori des de l'equip local del nou codi estable

  • Fusió en el repositori de la versió original del codi i la nova versió estable, que registre els canvis produïts

 

Hi ha diferents eines per al control de versions, entre les quals destaquen:

  • Subversion (SVN): sistema centralitzat en què tots els fitxers i les dades històriques són emmagatzemades en un repositori central i en què els desenvolupadors pugen els canvis a aquest servidor.

  • GIT: sistema distribuït en què hi ha un repositori central i còpies d'aquest repositori en els diferents equips locals dels desenvolupadors.

Per a més informació sobre la utilització de sistemes de control de versions es recomana contactar amb l'ASIC.

Durant el procés d'investigació es recopilen, generen i tracten múltiples dades fonamentals per a la investigació. Un emmagatzematge incorrecte d'aquestes dades pot provocar que es perden de manera permanent, fet que implica múltiples conseqüències negatives.

 

Seguint les recomanacions d'OpenAIRE, la UPV ofereix a la seua comunitat universitària dos serveis gratuïts per a emmagatzemar les dades d'investigació de manera segura:


Discos per a grups

  • Possibilitat que diversos investigadors compartisquen el mateix disc virtual

  • Emmagatzematge de 2 GB per persona, ampliable fins a 30 GB després de la sol·licitud prèvia en la intranet (Eines > Utilitats > Gestió de quotes). Si es necessita una capacitat d'emmagatzematge superior a 30 GB s’ha de sol·licitar via Gregal

  • Accés al disc virtual des d'un dispositiu situat:

    • Dins de la UPV: es connecta com una unitat de xarxa amb la ruta \\nasupv.upv.es\grups

    • Fora de la UPV: s'accedeix via VPN i posteriorment es connecta com una unitat de xarxa amb la ruta \\nasupv.upv.es\grups

  • Sol·licitud/Modificació de grup de treball: s’ha d'usar l'aplicació Gregal i indicar el grup (si ja es coneix) o unes inicials que el puguen identificar, una lleugera descripció del grup (si es vol crear un de nou) i els usuaris que s’han d'afegir o eliminar del grup

  • Còpia de seguretat automàtica que permet recuperar els últims canvis realitzats en els fitxers

  • Tant les dades com la còpia de seguretat estan en discos situats en diferents edificis de la UPV

  • Compliment amb la normativa espanyola de protecció de dades (LOPD) i seguretat en els serveis (ENS)

  • Possibilitat de creació de llistes de distribució per a la comunicació dins del grup


OneDrive

  • Possibilitat que diversos investigadors creen un grup per a compartir informació

  • Servei de Microsoft subscrit per la UPV

  • 1 TB d'emmagatzematge per persona, encara que no accepta arxius superiors a 15 GB

  • Accés des del portal Office 365

  • És necessari, en la primera ocasió, sol·licitar l'accés a Office 365 per la intranet (Eines > Office 365 > Alta del servei). Una vegada acceptades les condicions i sol·licitat l'accés s'activa el servei després d'un breu lapse de temps, que està actiu mentre continue la relació contractual (professors, investigadors i PAS) o la matrícula oficial (estudiants de grau, màster oficial o doctorat)

  • Es poden seleccionar les carpetes de l'equip local que es volen sincronitzar en OneDrive

  • Emmagatzematge en el núvol en servidors europeus

  • Compliment amb la normativa espanyola de protecció de dades (LOPD) i seguretat en els serveis (ENS)

 

Pots consultar més informació sobre els serveis d'emmagatzematge de dades en la wiki que manté l'ASIC.

Abans de la finalització del projecte d'investigació és molt probable que hi haja tres tipus de dades:

  • Dades en brut: dades obtingudes i/o creades durant la investigació

  • Dades processades: dades extretes o derivades de les dades en brut

  • Dades referenciades: subconjunt de les dades processades que es treballen per a realitzar l'anàlisi i extraure conclusions

 

Seguint les recomanacions de la Universitat d'Utrecht, l'elecció de les dades a preservar depèn principalment de la finalitat que es perseguisca:

  • Verificació dels resultats: les dades s'utilitzen per a facilitar la transparència i la replicació de la investigació. En aquest cas, es recomana preservar tant les dades processades com les referenciades.

  • Reutilització de les dades: les dades es poden utilitzar en futures investigacions, tant pel mateix investigador com per diferents investigadors. En aquest cas, es recomana preservar les dades en brut.

 

En tots dos casos, la documentació que acompanya les dades ha de ser prou clara per a complir amb els criteris anteriors.

 

El Digital Curation Center té un checklist per a ajudar els investigadors a decidir quines dades s’han de preservar, en què es descriuen cinc passos a seguir per a facilitar la presa de decisió. Es recomana que l'emmagatzematge de les dades per a assegurar la preservació es realitze:

  • Durant la investigació: en els serveis d'emmagatzematge que ofereix la UPV

  • Investigació finalitzada: en el repositori de dades adequat a la investigació

Durant el procés d'investigació és possible que s'haja de treballar amb dades de caràcter personal. En aquests casos hi ha diverses normes bàsiques que s'han de tenir en compte:

 

Alguns dels principis que regeixen aquestes normes són:

  • Licitud, lleialtat i transparència: les dades han de ser tractades de manera lícita, lleial i transparent amb relació a l'interessat.

  • Limitació de la finalitat: les dades han de ser recollides amb finalitats determinades, explícites i legítimes.

  • Minimització de dades: les dades han de ser adequades, pertinents i limitades al necessari amb relació a les finalitats per a les quals són tractades.

  • Integritat i confidencialitat: s'ha de garantir una seguretat adequada de les dades personals, inclosa la protecció contra el tractament no autoritzat o il·lícit i contra la seua pèrdua, destrucció o mal accidental.

  • Responsabilitat proactiva: el responsable del tractament de les dades és el responsable de complir amb el que estableix la legislació i ser capaç de demostrar-ho.

 

Tenint en compte aquests principis, la protecció de les dades personals ha de planificar-se des del disseny i per defecte. De fet, és un dels apartats que consta en el Pla de Gestió de Dades.

 

A continuació es mostra una presentació, realitzada dins del seminari web (webinar) sobre informació legal organitzat per OpenAIRE, amb consells pràctics sobre la utilització de dades personals en la investigació en el context del GDPR:

 

Font: OpenAIRE. OpenAIRE Legal Policy Webinar: GDPR and Sharing Data  

En la normativa nacional i europea sobre dades personals es nomena explícitament la pseudonimització per a tractar dades personals amb finalitats d'investigació.

 

El Reglament (UE) 2016/679 defineix la pseudonimització com el tractament de dades personals de manera tal que ja no es puguen atribuir a un interessat sense utilitzar informació addicional, sempre que aquesta informació addicional figure per separat i estiga subjecta a mesures tècniques i organitzatives destinades a garantir que les dades personals no s'atribuïsquen a una persona física identificada o identificable.

 

Cal assenyalar les diferències entre pseudonimització i l'anonimització:

  • la pseudonimització està relacionada amb l'existència d'una associació entre identificadors personals i pseudònims, mentre que en l'anonimització aquesta associació no hauria d'estar disponible en cap cas,

  • la pseudonimització permet, si calguera, la reidentificació de les persones pel responsable de les dades, mentre que en l'anonimització no és possible,

  • en la pseudonimització es gestionen dos tipus de dades: les pseudonimitzades i la informació addicional que permet la reidentificació de les persones,

  • les dades pseudonimitzades han de ser considerades encara com dades personals mentre que les dades anonimitzades no es consideren dades personals.

 

Alguns beneficis de la pseudonimització són:

  • Oculta la identitat de les persones i millora la seguretat i la protecció de la privacitat.

  • Gestiona separadament les dades pseudonimitzades i la informació addicional que permet la reidentificació de les persones i millora l'exactitud de les dades.

  • Facilita la minimització de la informació emmagatzemada durant el tractament de les dades.

 

En diferents guies s'ofereixen tècniques per a la pseudonimització de les dades:

 

També hi ha diferents tècniques per a l'anonimització de les dades:

  • Orientaciones y garantías en los procedimientos de anonimización de datos personales. Editat per l'Agència Espanyola de Protecció de Dades

  • Amnesia: eina finançada per OpenAIRE per a l'anonimització de dades. Utilitzant k-anonimització i km anonimització, permet eliminar els identificadors directes (nom, DNI, etc.) i transforma els identificadors secundaris (data de naixement, codi postal, etc.) de manera que les persones no puguen ser identificades. Per a més informació sobre Amnesia, es pot consultar la presentació i el vídeo d'un seminari web organitzat per OpenAIRE al juny 2020

Fases del procés d'anonimització
 

El xifratge fa que les dades personals siguen inintel·ligibles per a qualsevol persona que no estiga autoritzada a accedir-hi.

Es recomana que l'emmagatzematge de les dades personals es realitze en qualssevol dels serveis d'emmagatzematge per a dades que ofereix la UPV. Aquests serveis proporcionen control d'accés a les dades, còpies de seguretat, etc.

  • Delegació de Protecció de Dades (DPD_UPV): és la unitat que té encomanades la supervisió del compliment del Reglament General de Protecció de Dades i de la Llei orgànica de Protecció de Dades Personals i garantia dels drets digitals en l'àmbit de la Universitat Politècnica de València

  • Comitè d'Ètica en Investigació de la UPV: qualsevol activitat duta a terme a la UPV bé a iniciativa d'algun membre d'un departament, institut, centre, bé sota subcontractació o fins i tot liderada per altres institucions, però amb participació de la UPV i l'experimentació de la qual estiga afectada per alguna normativa, per incloure aspectes amb implicacions ètiques o de bioseguretat, ha de ser prèviament autoritzada pel Comitè d'Ètica en Investigació de la UPV. Per a això, l'investigador principal ha de seguir el procediment i emplenar el formulari corresponent per a sol·licitar l'avaluació del comitè

Pujar

Difondre les dades

Moltes agències de finançament, institucions i revistes acadèmiques tenen mandats i polítiques sobre la publicació en accés obert de les dades d'investigació. El compliment d'aquests mandats i polítiques se sol realitzar a través del dipòsit de les dades d'investigació en un repositori de dades.

 

A l'hora de triar un repositori cal tenir en compte alguns aspectes:

  • Àrea temàtica

  • Capacitat d'emmagatzematge

  • Facilitat de recuperació de dades

  • Assignació d'un identificador únic i persistent per a cada conjunt de dades (DOI)

  • Establiment d'un període d'embargament per a les dades

  • Selecció de la llicència d'ús de les dades

  • Preservació a llarg termini de les dades

  • Compliment amb la certificació CoreTrustSeal

 

Science Europe ha publicat la Practical Guide to the International Alignment of Research Data a on s'expliquen fàcilment els criteris per a seleccionar un repositori de dades

 

Segons l'OpenAIRE Research Data Management Briefing Paper, les dades s’han de dipositar en un repositori de dades segons l’ordre de preferència següent:

  1. Repositori temàtic de dades consolidat per a aquesta disciplina

  2. Repositori institucional de dades

  3. Repositori multidisciplinari de dades

  4. Altres repositoris de dades

 

El Consorci de Serveis Universitaris de Catalunya (CSUC) va publicar unes Recomanacions per a seleccionar un repositori on dipositar dades d'investigació, amb una taula comparativa de repositoris.

A continuació, es mostren diversos repositoris temàtics de dades per a algunes disciplines:

  • Agricultura:

    • Ag Data Commons: àmplia varietat de dades obertes pertinents per a la investigació agrícola

  • Biologia:

    • BioModels: models matemàtics de sistemes biològics i biomèdics

    • GenBank: seqüències de nucleòtids a la disposició del públic per a quasi 260.000 espècies formalment descrites

    • UniProt: recopilació d'informació funcional sobre les proteïnes, amb una anotació precisa, consistent i completa

    • Worldwide Protein Data Bank: estructures tridimensionals de macromolècules biològiques determinades experimentalment

  • Ciències ambientals i de la terra:

    • EarthChem: centrat en la preservació, el descobriment, l'accés i l'anàlisi de les dades geoquímiques

    • Environmental Data Initiative Repository: dades que proporcionen un context per a avaluar la naturalesa i el ritme del canvi ecològic, interpretar-ne els efectes i preveure respostes biològiques futures al canvi

    • NERC Earth Observation Data Centre: adquisició, arxivament i accés a les dades de teledetecció de la superfície de la Terra adquirides per satèl·lit i sensors aerotransportats

    • PANGAEA: arxivament, publicació i distribució de dades georeferenciades del sistema terrestre

  • Física:

    • HEPData: repositori per a la difusió de dades de la física experimental de partícules

  • Materials:

  • Química:

    • Cambridge Structural Database (CSD): repositori per a xicotetes molècules orgàniques i estructures de cristalls metal-orgànics oferint una representació en 3D

    • PubChem: estructures químiques, identificadors, propietats químiques i físiques, activitats biològiques, patents, salut, seguretat, dades de toxicitat, etc.

    • Strenda DB: dades d'enzims funcionals

En Riunet, el repositori institucional de la UPV, hi ha la col·lecció Dataset on es permet el dipòsit de dades d'investigació provinents d'entitats i/o serveis de la UPV, així com projectes en què participen investigadors de la UPV.

 

La redacció d'un Pla de Gestió de Dades permet planificar les activitats relatives a les dades d'investigació durant totes les etapes del seu cicle de vida. Una d'aquestes etapes és el dipòsit de les dades en un repositori. En general, es permet el dipòsit en RiuNet de les dades derivades d'investigacions en què participen investigadors de la Universitat Politècnica de València.

 

  • Compliment amb les polítiques i mandats sobre dades d'investigació imposats per agències de finançament de la investigació i revistes acadèmiques.

  • Assignació d'un Digital Object Identifier (DOI) per a les dades.

  • Presència de RiuNet en el directori de repositoris de dades d'investigació r3data.org, gràcies al compliment dels requisits per al registre en aquest directori.

  • Descripció de les dades complint els estàndards internacionals, cosa que fa que les dades puguen ser oposades, accessibles, interoperables i reusables (FAIR).

  • Establiment de diferents tipus de llicències Creative Commons per a especificar l'ús de les dades.

  • Possibilitat de restringir l'accés a les dades durant un temps determinat. Durant aquest període d'embargament qualsevol persona pot sol·licitar a l'autor l'accés a les dades a través de l'opció “Sol·licitar una còpia a l'autor”.

  • Emmagatzematge i preservació de les dades facilitant-ne la difusió al llarg del temps.

 

Segons l'OpenAIRE Research Data Management Briefing Paper, les dades s’han de dipositar preferentment en un repositori temàtic de dades consolidat per a aquesta disciplina. Recursos com ara re3data.org i Fairsharing.org permeten localitzar repositoris temàtics de dades.

 

D'altra banda, també s'ha de comprovar la política sobre dades d'investigació de la revista on es publica el treball relacionat amb les dades que es volen dipositar.

 

En cas de no localitzar un repositori de dades que complisca amb els criteris expressats en els paràgrafs anteriors, les dades podran ser dipositades en RiuNet.

  • Les dades han d'haver sigut produïdes:

    • Dins de projectes en què participen investigadors de la UPV

    • Entitats i/o serveis de la UPV

  • Els autors de les dades han d'estar en condicions de concedir els drets necessaris a la UPV per a assegurar la correcta distribució i preservació de les dades a través de RiuNet

  • Si el conjunt de dades conté dades personals, s'ha de tenir en compte l'expressat en la normativa nacional i internacional sobre protecció de dades personals

  • S'ha d'indicar el tipus de versió de les dades que es vol dipositar: dades en brut, dades processades, versió final, etc.

  • Les dades han d'estar degudament organitzats per a facilitar-ne la comprensió i reutilització. Per a això, se seguiran les recomanacions següents:

  • Encara que es poden dipositar diversos fitxers amb dades d'investigació, cadascun dels fitxers no ha de superar els 2 GB de grandària

  • Els investigadors de la UPV poden realitzar el dipòsit de les dades d'investigació en la col·lecció Datasets que es troba en RiuNet.

  • Si les dades s'han obtingut/processat dins d'un projecte d'investigació amb finançament (H2020, MINECO, GVA, etc.) s’ha de reflectir en RiuNet durant el dipòsit, i indicar, d'una banda, l'agent finançador i, de l’altra, el codi del projecte. D'aquesta manera es facilita la justificació del compliment de la política o mandat de l'agent finançador.

  • La data de publicació de les dades d'investigació s’ha d'introduir de manera completa, és a dir, any/mes/dia.

  • Les dades dipositades han de complir amb les condicions descrites anteriorment. Especialment, a més dels fitxers amb les dades s'ha de dipositar un fitxer README.txt on es descriguen les dades d'investigació.

  • La publicació de les dades en RiuNet no és immediata ja que la biblioteca ha de realitzar un procés de validació. Durant aquest procés es comprova el compliment de les condicions per a l'acceptació, així com el nivell de descripció de les dades.

  • Contacta amb la Biblioteca per a qualsevol dubte sobre el dipòsit de les dades d'investigació en RiuNet.

Hi ha múltiples repositoris multidisciplinaris de dades, alguns dels més representatius són:

  • Zenodo: repositori finançat pel projecte OpenAIRE que es pot utilitzar si no es troba cap repositori adequat que encaixe amb les dades d'investigació.

    La Biblioteca ha creat, per al dipòsit dels seus investigadors, la comunitat "Universitat Politècnica de València (UPV). Research Data".

    Consulteu el Manual de dipòsit en Zenodo.

  • Dataverseaplicació web de codi obert desenvolupada en el marc del projecte del Institute for Quantitative Social Science(IQSS) i Harvard Library per a posar dades d'investigació a la disposició d'investigadors i recol·lectors de dades a tot el món. 
  • EUDAT B2SHARE (European Data Infrastructure): projecte del H2020 que ofereix un repositori de dades multidisciplinari.

  • Dryad: repositori multidisciplinari de dades. Té costos de dipòsit del dataset.

  • Figshare: repositori multidisciplinari de dades.

A més dels repositoris de dades enumerades anteriorment, és possible localitzar altres repositoris a través de directoris com ara re3data.org i Fairsharing.org.


A més de la difusió en Accés Obert de les dades d'investigació a través dels repositoris, també és possible publicar aquestes dades en data journals. Aquestes revistes publiquen data papers, que són articles centrats en les dades en si mateixes (descripció, metodologia, motivació, etc.) i no en les hipòtesis, anàlisis i conclusions extretes a partir d'aquestes dades.

 

La publicació de les dades d'investigació en data journals ofereix múltiples beneficis als investigadors:

  • Procés de revisió per experts que garanteix la qualitat de les dades

  • Publicació de dades d'investigació amb un alt potencial de reutilització

  • Facilita la cita i reconeixement acadèmic

  • Difusió en Accés Obert que respecta el reconeixement als autors

  • Millora la transparència en la investigació

  • Assignació d'un DOI (Digital Object Identifier) a les dades d'investigació

 

Hi ha múltiples data journals, tant disciplinaris com multidisciplinaris, on és possible publicar les dades d'investigació. La Biblioteca de la Universitat de la Corunya i la Biblioteca de la UPV hem realitzat una recopilació amb més de 50 data journals. Per a cada data journal s'ofereix informació, entre la qual destaca:

  • Temàtica

  • Saber si està indexada en el Directory of Open Access Journals (DOAJ)

  • Saber si està indexada en les Web of Science Core Collections (WOS)

  • Quartil que ocupa en el Scimago Journal and Country Rank (SJR)

  • Tipus de treballs que publica: data papers, programari papers, etc.

La Llei de Propietat Intel·lectual, que ha sigut adaptada a la normativa europea, arreplega dos aspectes molt importants aplicables a les dades d'investigació:

  • Són objecte de propietat intelectual les creacions originals literàries, artístiques o científiques expressades per qualsevol medi o suport, tangible o intangible, actualment conegut o que s'invente en el futur (article 10)

  • Les bases de dades on figuren les dades d'investigació sí que són objecte de propietat intel·lectual (article 12) mitjançant el dret sui generis (títol VIII)

 

El dret sui generis sobre una base de dades té les característiques següents:

  • Protegeix la inversió substancial, avaluada qualitativament o quantitativament, que realitza el fabricant de la base de dades, ja siga de mitjans financers, ús de temps, esforç, energia o uns altres de similar naturalesa, per a l'obtenció, verificació o presentació del contingut

  • El fabricant d'una base de dades pot prohibir l'extracció i/o reutilització de la totalitat o d'una part substancial del contingut de la base de dades, avaluada qualitativament o quantitativament, sempre que l'obtenció, la verificació o la presentació d'aquest contingut representen una inversió substancial des del punt de vista quantitatiu o qualitatiu. Aquest dret es pot transferir, cedir o donar en llicència contractual

  • No estan autoritzades l'extracció i/o reutilització repetides o sistemàtiques de parts no substancials del contingut d'una base de dades que suposen actes contraris a una explotació normal d'aquesta base o que causen un perjudici injustificat als interessos legítims del fabricant de la base

  • La protecció de les bases de dades s'entendrà sense perjudici dels drets existents sobre el seu contingut

  • El termini de protecció expirarà quinze anys després de l'1 de gener de l'any següent a la data en què haja acabat el procés de fabricació de la base de dades. En els casos de bases de dades posades a la disposició del públic abans de l'expiració del període descrit anteriorment, el termini de protecció expirarà als quinze anys, comptats des de l'1 de gener següent a la data en què la base de dades haguera sigut posada a la disposició del públic per primera vegada

 

A continuació es mostra una presentació, realitzada dins del seminari web sobre informació legal organitzat per OpenAIRE, amb informació pràctica sobre la protecció de les dades d'investigació dins de la legislació europea:

Font: OpenAIRE. OpenAIRE Legal Policy Webinar: Data, Data Ownership and Open Science 

Tal com s'arreplega en les Guidelines on Open Access to Scientific Publications and Research Data in Horizon 2020, és convenient afegir llicències d'ús als sets de dades que es generen.

 

Per a indicar el tipus d'ús permès, es poden utilitzar llicències Creative Commons 4.0, com les CC0 i CC-BY. També és possible utilitzar llicències específiques per a dades Open Data Commons:

  • Attribution License (ODC-By) — Attribution for data/databases permet a tercers copiar, distribuir i usar la base de dades, així com utilitzar-la per a crear nous continguts, bases de dades o col·leccions de bases de dades (sempre que se cite la base de dades original).
  • Open Database License (ODC-ODbL) — Attribution Share-Alike for data/databases permet a tercers copiar, distribuir i usar la base de dades, així com utilitzar-la per a crear nous continguts, bases de dades o col·leccions de bases de dades, sempre que a les bases de dades derivades se'ls atorgue la mateixa llicència que a la base de dades original.
  • Public Domain Dedication and License (ODC-PDDL). No imposa cap restricció, permet copiar, distribuir i utilitzar la base de dades, així com crear nous productes i adaptacions.

 

Per a programes informàtics es recomana l'ús de llicències de la Free Software Foundation i l'Open Source Iniciative, que es poden localitzar des de https://tldrlegal.com/.

 

Per a la selecció de llicències, tant de dades com de programes informàtics, es recomana la utilització de l'eina License selector.

 

Cal no oblidar la idea general “Tan obert com siga possible, tan tancat com siga necessari” que es declara en les Guidelines on FAIR Data Management in Horizon 2020. Complint aquesta premissa, no es difondran en obert les dades d'investigació en determinades situacions: existència de clàusules de confidencialitat, possible explotació comercial o industrial, etc.

La preparació, l'emmagatzematge i la difusió de les dades d'investigació seguint els principis FAIR pot comportar una sèrie de costos econòmics i en recursos humans. Tanmateix, hi ha agències de finançament que permeten comptabilitzar aquests costos dins del projecte d'investigació.

 

La Comissió Europea, en el marc del H2020, pot cobrir costos tècnics i professionals associats a la gestió i difusió de les dades d'investigació. Per a ajudar a comptabilitzar i justificar aquestes despeses dins del projecte d'investigació, es pot utilitzar l'eina d'estimació de costos de gestió de dades d'investigació desenvolupada per OpenAIRE.

 

A continuació, es mostra una infografia creada per OpenAIRE sobre diferents aspectes relacionats amb els costos de gestió i difusió de les dades d'investigació:

 

 

També hi ha altres eines per a ajudar a comptabilitzar les diferents despeses de gestió de dades d'investigació, com ara la Data Management Cost Guide desenvolupada per la Universitat d'Utrecht.

Citar les dades d'investigació és una pràctica que ha de ser realitzada pels motius següents:

  • Les dades d'investigació han de ser considerades com un output més de la investigació

  • Es poden incorporar en el CV i en el registre ORCID de l'investigador

  • Milloren la transparència de la investigació

  • Es poden realitzar mesures d'impacte de les dades d'investigació esmentades

 

Per a realitzar una citació correcta de les dades d'investigació es recomana:

  • Incloure una sèrie de dades mínimes: autor, data, títol, tipus de recurs i identificador únic persistent

  • Identificar unívocament les dades d'investigació mitjançant un identificador únic persistent (DOI)

  • Citar cada conjunt de dades de manera independent

Utilitzar DOI Citation Formatter: servei que genera les referències bibliogràfiques amb diferents estils de citació a partir del DOI de les dades d'investigació

 

Exemples de cites de dades d'investigació:

  • Sallstrom, Nathalie; Goulas, Thanos; Martin, Simon; Engstrom, Daniel (2020): Additive Manufacturing of Highly Elastic Nanoclay-crosslinked Hydrogel with Self-healing Abilities. figshare. Dataset. https://doi.org/10.17028/rd.lboro.11793948.v1

  • Herrera, Carlos M. (2019), Complex long-term dynamics of pollinator abundance in undisturbed Mediterranean montane habitats over two decades, v2, Dryad, Dataset, https://doi.org/10.5061/dryad.5hq26p1

 

Citar dades d'investigació

Font: REBIUN. Cita les teuves dades d'investigació

Pujar

Dades d'investigació

D'una manera senzilla, es pot dir que les dades d'investigació són fets, observacions o experiències creats durant el procés d'una investigació. En el document de bones pràctiques sobre dades d'investigació realitzat per la FECYT, s'arrepleguen com poden ser les dades d'investigació:

  • Numèriques, descriptives o visuals

  • En estat brut o analitzat, poden ser experimentals o observacionals

  • Inclouen: quaderns de laboratori, quaderns de camp, dades d'investigació primària (incloses les dades en paper o en suport informàtic), qüestionaris, cintes d'àudio, vídeos, desenvolupament de models, fotografies, pel·lícules, i les comprovacions i les respostes de la prova, diapositives, dissenys i mostres. En la informació sobre la procedència de les dades també es podria incloure: com, quan, on es va arreplegar i què (per exemple, instruments)

  • El codi de programari utilitzat per a generar, comentar o analitzar les dades també poden ser considerades dades

Cicle de les dades científiques
 

Hi ha nombroses raons per a compartir les dades d'investigació. En el document Recomanacions per a la gestió de dades d'investigació, elaborat per la xarxa Maredata, es detallen els motius següents:

  • Promoure la innovació i la reutilització de les dades que potencialment puguen tenir nous usos

  • Facilitar la col·laboració entre usuaris de dades, creadors de dades i reutilitzadors

  • Maximitzar la transparència i la fiabilitat de les dades

  • Afavorir la reproductibilitat dels assajos experimentals

  • Permetre la verificació dels resultats d'investigació

  • Reduir costos en evitar la duplicació de dades

  • Augmentar l'impacte i la visibilitat de la investigació

  • Promoure els projectes d'investigació dels quals provenen les dades i les seues publicacions

  • Generar un reconeixement directe dels investigadors productors de dades, com ocorre amb qualsevol altre resultat d'investigació

 

Ciència oberta

 

Font: REBIUNCiència Oberta: La investigació i les dades de recerca accessibles i obertes a tots els ciutadans   

 

Hi ha nombroses revistes i agències de finançament que sol·liciten que es publiquen les dades d'investigació associades als treballs acadèmics. Tanmateix, cal complir uns criteris per a facilitar que altres investigadors puguen tenir accés a les dades d'investigació.

 

Font: Wikipedia Commons 

 

Els principis FAIR fan referència a com s’han de tractar les dades d'investigació perquè siguen localitzables, accessibles, interoperables i reutilitzables (Findable, Accessible, Interoperable, Reusable).

 

Font: Australian National Data Service. FAIR principles 

L'eina online FAIR-Aware, desenvolupada pel projecte FAIRsFAIR, ajuda a entendre millor els principis FAIR i com contribueixen a millorar el valor i l’impacte de les dades d'investigació.

Per a poder reutilitzar les dades d'investigació primer cal localitzar-les. Alguns dels principis que s'han de complir són:

Una vegada localitzats les dades d'investigació, és necessari saber com es pot accedir a les dades. Alguns dels principis que s'han de complir són:

És necessari que les dades puguen ser interoperables perquè siguen utilitzades per altres aplicacions o fluxos de treball. Alguns dels principis que s'han de complir són:

La reutilització de les dades d'investigació l'objectiu principal que es persegueix amb els principis FAIR. Alguns dels principis que s'han de complir són:

  • Les metadades han de contenir una llicència clara i accessible sobre la reutilització de les dades

  • El contingut de les dades (atributs, metodologia, variables, programari i maquinari necessari, etc.) ha de ser descrit per a facilitar la reutilització de les dades

Pujar

Polítiques i mandats

La disponibilitat de les dades d'investigació en accés obert s'està convertint en una recomanació, i fins i tot obligació, imposada per les agències finançadores de la investigació científica. A través del projecte Sherpa Juliet s'ofereix informació sobre aquestes polítiques i mandats.

El nou programa marc, Horitzó Europa (2021-2027) segueix amb la consolidació d'accés obert per als resultats de la investigació financiada amb fons públics. En juliol de 2021 es va publicar l'últim esborrany del “EU Grants Annotated General Model Grant Agreement” per als programes de finançament de l'EU per al període 2021-2027.

A l'apartat sobre “COMMUNICATION, DISSEMINATION, OPEN SCIENCE AND VISIBILITY” es recullen per al cas de les dades:

  • Gestionar les dades sota els principis FAIR
  • Fer i mantindre un Pla de Gestió de Dades
  • Dipositar l'abans possible les dades en un repositori
  • Per a les llicències:
    • Baix llicencia CC-BY o CC0, seguint la màxima de tan obert com es puga, tan tancat com siga necessari
    • Dipositar les metadades sota una llicència CC0
  • Proporcionar al repositori qualsevol informació rellevant per a la validació o reutilització de les dades

Des de gener de 2017 tots els projectes finançats pel programa H2020 (tret d’excepcions justificades) han de garantir l'accés obert a les dades d'investigació. Per aquest motiu, els projectes participants en el H2020 han de:

 

Complint la premissa general “Tan obert com siga possible, tan tancat com siga necessari”, es persegueix que les dades siguen localitzables, accessibles, interoperables i reutilitzables; és a dir, que siguen FAIR (Findable, Accessible, Interoperable and Reusable).

La Comissió Europea pot cobrir costos tècnics i professionals associats a la gestió i difusió en accés obert. Per a realitzar una estimació d'aquests costos la Universitat d'Utrecht ha creat la Data Management Cost Guide.

Compliment del mandat del H2020

Font: REBIUN. Com complir amb els mandats sobre gestió i publicació de dades 

  • Dades principals (Underlying data): dades necessàries per a validar els resultats presentats en publicacions científiques, incloent-hi les metadades associades (per exemple, les que descriuen les dades dipositades en el repositori)

  • Qualsevol altra dada: per exemple, les dades no associades directament a una publicació o les dades en brut, incloent-hi les metadades associades, dins dels terminis establits en el Pla de Gestió de Dades

Informació preliminar sobre la gestió de dades d'investigació

En la fase d'enviament de la documentació per a la sol·licitud d'adjudicació del projecte d'investigació es presenta certa informació que, encara que no és un Pla de Gestió de Dades complet, fa referència a les dades d'investigació que es pensen generar:

  • Quin tipus de dades genera/utilitza el projecte

  • Quins estàndards s'usen

  • Com són les dades utilitzades i/o compartides/accessibles per a la seua verificació i reutilització. Si les dades no estan accessibles, s'ha de justificar

  • Com són les dades tractades i preservades

 

Pla de Gestió de Dades

Una vegada s'ha obtingut l'aprovació del finançament del projecte i aquest ha començat, s'ha d'enviar la primera versió del Pla de Gestió de Dades (PGD) dins dels primers 6 mesos del projecte

 

El PGD ha de ser actualitzat durant el projecte quan es produïsquen canvis significatius, per exemple:

  • Noves dades

  • Canvis en les polítiques: nova innovació potencial, decisió de sol·licitar una patent, etc.

  • Canvis en la composició del consorci i factors externs: nous membres que s'incorporen o que abandonen el consorci

 

A més, el PGD s'ha d'actualitzar en el moment de l'avaluació periòdica del projecte; és a dir, a meitat i a la finalització del projecte.

 

Hi ha diverses guies per a l'elaboració del PGD orientat a l'àmbit del H2020:

  • Guidelines on FAIR Data Management in Horizon 2020: elaborat per la Comissió Europea, ofereix una completa informació sobre les dades d'investigació en el H2020, així com una explicació del contingut de cadascun dels apartats del PGD que s'ha de presentar

  • Plans de Gestió de Dades: creat pel Consorci de Serveis Universitaris de Catalunya (CSUC), serveix com a suport als investigadors en la creació dels PGD en el marc del H2020

 

Es poden consultar les eines i exemples per a facilitar la creació d'un PGD.

 

Font: OpenAIRE. https://www.openaire.eu/how-to-comply-to-h2020-mandates-for-data

En qualsevol etapa del projecte d'investigació (proposta, preparació de l'acord de subvenció [GAP] o després de la signatura de l'acord de subvenció), és possible declarar de manera justificada la impossibilitat d'oferir en obert les dades d'investigació.

 

Els motius que es poden al·legar són els següents:

  • Incompatibilitat amb l'obligació de protegir els resultats si poden ser explotats comercialment o industrialment

  • Incompatibilitat amb temes de confidencialitat o de seguretat

  • Incompatibilitat amb regulacions sobre dades personals

  • Pot posar en perill l'objectiu del projecte

  • No es generen o arrepleguen dades d'investigació

  • Qualsevol altra raó legítima degudament justificada

En la convocatòria de l'any 2021 del procediment de concessió d'ajudes a "Projectes de Generació de Coneixement" en el marc del Programa estatal d'Investigació Científica i Tècnica i d'Innovació 2020-2023, apareixen per primera vegada les següents referències a les dades d'investigació:

  • Obligacions de les entitats beneficiàries (article 50): les dades d'investigació s'hauran de depositar en repositoris institucionals, nacionals i/o internacionals abans que transcórreguen dos anys des de la finalització del projecte, amb la finalitat d'impulsar l'accés a dades d'investigació de les ajudes finançades

  • Criteris d'avaluació (article 20. Segona fase): Impacte esperat dels resultats: Se valorarà [...]; en el cas de que resulte pertinent, el pla de gestió de dades d'investigació associats als resultats; [...]; la difusió i l'accés obert dels resultats i de les dades (en aquells casos que ho requereixen)

  • Instruccions per a omplir la memòria científico-técnica (apartat 4): s'ha de presentar un Pla de gestió de dades d'investigació en el quals'indique quines dades es van a recollir ogenerar (tipologia i formats), com serà l'accés (qui, com i quan es podrà accedir a les dades) i en quin repositori està previst el dipòsit.

 

Juntament a la convocatòria, s'ha publicat un document de preguntes freqüents. En la pregunta 89 s'aclareixen diversos aspectes relatius a les dades d'investigació:

  • No cal incloure en la sol·licitud del projecte el Pla de Gestió de Dades (PGD): en la memòria científic-tècnica de la proposta solament s'haurà d'incorporar una descripció inicial que continga quines dades que es van a arreplegar o generar en el marc del projecte (tipologies i formats), com serà l'accés a les dades (qui,com i quan es podrà accedir), de qui són les dades i en quin repositori està previst el seu dipòsit, difusió i preservació. Així mateix, s'arreplegaran, si escau, les condicions ètiques o legals específiques que els regulen (ex. privacitat de les dades i la seua reglamentació; dades protegides o protegibles per propietat intel·lectual o industrial, etc.) que condicionen la seua disponibilitat, ús i/o reutilització

  • El PGD s'haurà de presentar, si així és requerit, juntament amb els informes de seguiment intermedi i final del projecte finançat. Així mateix, es recomana la publicació en accés obert del PGD al costat dels datasets utilitzats, i en format llegible per màquina

  • Es recomana que totes les dades d'investigació resultants de projectes finançats amb fons públics siguen sempre FAIR i, sempre que siga possible, obertes

  • S'han de dipositar en repositoris d'accés obert totes les dades que subjauen a la investigació, això és, les dades brutes generades o produïdes en el transcurs de la investigació

  • S'hauran de publicar, juntament als articles científics, les dades finals que siguen necessaris per a garantir la verificació i reproducibilitat dels resultats presentats

  • En el dipòsit i publicació de les dades s'haurà de tenir en compte: la protecció de dades personals, aspectes ètics i els requisits específics de les editorials científiques

En l'article 6 de l'Ordre CNU/1360/2021, de 3 de desembre, es detallen les obligacions dels beneficiaris de les ajudes públiques en el marc del Pla Estatal:

  • Les dades d'investigació hauran d'estar disponibles en accés obert, encara que podran haver-hi excepcions

  • Les convocatòries podran preveure la realització d'un Pla de Gestió de Dades que formarà part de la documentació de la sol·licitud i que es podrà modificar durant l'execució del projecte

  • Si es difondran en obert les dades, s'indicarà el repositori institucional o temàtic d'accés obert en el qual es depositaran les dades

  • Les excepcions a l'obligatorietat de l'accés obert a les dades d'investigació són:

    • Quan es preveja que les dades generades en la investigació i els resultats de la investigació realitzada puguen ser sotmesos a sol·licitud de la protecció de drets de propietat industrial o intel·lectual

    • Quan per la seua naturalesa les dades estiguen subjectes a la protecció de dades de caràcter personal o quan afecten la seguretat pública

El Pla Estatal d'Investigació Científica i Tècnica i d'Innovació 2021-2023, a través de les actuacions que finança, té com a objectiu impulsar un model d'investigació responsable i oberta a la societat a través de la incorporació del model de Ciència Oberta. En l'apartat de Transparència i rediment de comptes de les ajudes i del procediment de concessió, es parla tant de l'accés obert com de les dades d'investigació que hauran de seguir els principis FAIR i difondre's en obert, sempre que siga possible.

 

El marc de referència pluriennal per al foment de la investigació científica, tècnica i d'innovació a Espanya és la “Estratègia Espanyola de Ciència, Tecnologia i Innovació (EECTI) 2021-2027".

Dissenyada per a maximitzar la coordinació entre la planificació i programació estatal i autonòmica i per a facilitar l'articulació de la política nacional d'I+D+I amb el programa marc de ciència i innovació de la UE.

En l'eix d'actuació es recull la importància de la implicació ciutadana en la ciència i la innovació, fomentant la divulgació i la cultura científica, i promovent la ciència oberta i inclusiva. Igual que indiquen les directrius de la UE, s'impulsa l'accés obert als resultats d'investigació, de manera que les dades complisquen amb els criteris FAIR (localitzables, accessibles, interoperables i reutilitzables), i es destaca també el paper dels repositoris oberts.

Cada vegada més revistes sol·liciten que les dades d'investigació en què es basen les publicacions científiques estiguen disponibles en accés obert a través de repositoris de dades. D'aquesta manera, s'aconsegueixen diferents beneficis, com ara millorar el procés de revisió per experts, facilitar la reproductibilitat de la investigació, etc.

 

A continuació, es mostren algunes polítiques d'editorials acadèmiques referents a les dades d'investigació:

Pujar