Archiviazione dei dati di ricerca - Research data archiving

L'archiviazione dei dati di ricerca è l' archiviazione a lungo termine dei dati di ricerca accademica , comprese le scienze naturali, le scienze sociali e le scienze della vita. Le varie riviste accademiche hanno politiche diverse riguardo alla quantità di dati e metodi che i ricercatori devono memorizzare in un archivio pubblico e ciò che viene effettivamente archiviato varia ampiamente tra le diverse discipline. Allo stesso modo, le principali istituzioni che concedono sovvenzioni hanno atteggiamenti diversi nei confronti dell'archiviazione pubblica dei dati. In generale, la tradizione della scienza prevede che le pubblicazioni contengano informazioni sufficienti per consentire ad altri ricercatori di replicare e quindi testare la ricerca. Negli ultimi anni questo approccio è diventato sempre più teso poiché la ricerca in alcune aree dipende da grandi set di dati che non possono essere facilmente replicati in modo indipendente.

L'archiviazione dei dati è più importante in alcuni campi rispetto ad altri. In pochi campi, tutti i dati necessari per replicare il lavoro sono già disponibili nell'articolo della rivista. Nello sviluppo di farmaci viene generata una grande quantità di dati che devono essere archiviati in modo che i ricercatori possano verificare che i rapporti pubblicati dalle aziende farmaceutiche riflettano accuratamente i dati.

Il requisito dell'archiviazione dei dati è uno sviluppo recente nella storia della scienza . È stato reso possibile dai progressi della tecnologia dell'informazione che hanno consentito di archiviare e accedere a grandi quantità di dati da posizioni centrali. Ad esempio, l' American Geophysical Union (AGU) ha adottato la sua prima politica sull'archiviazione dei dati nel 1993, circa tre anni dopo l'inizio del WWW . Questa politica impone che i set di dati citati nei documenti AGU debbano essere archiviati da un centro dati riconosciuto; permette la creazione di "carte dati"; e stabilisce il ruolo di AGU nel mantenimento degli archivi di dati. Ma non richiede agli autori di carta di archiviare i propri dati.

Prima dell'archiviazione organizzata dei dati, i ricercatori che desiderano valutare o replicare un articolo dovrebbero richiedere informazioni sui dati e sui metodi all'autore. La comunità accademica si aspetta che gli autori condividano dati supplementari . Questo processo è stato riconosciuto come uno spreco di tempo ed energia e ha ottenuto risultati contrastanti. Le informazioni potrebbero andare perse o danneggiarsi nel corso degli anni. In alcuni casi, gli autori si rifiutano semplicemente di fornire le informazioni.

La necessità di archiviazione dei dati e due diligence aumenta notevolmente quando la ricerca si occupa di questioni di salute o formazione di politiche pubbliche.

Politiche selezionate per riviste

Biotropica

Biotropica richiede, come condizione per la pubblicazione, che i dati a supporto dei risultati nel documento e i metadati che li descrivono debbano essere archiviati in un archivio pubblico appropriato come Dryad , Figshare , GenBank , TreeBASE o NCBI . Gli autori possono scegliere di rendere i dati disponibili al pubblico non appena l'articolo è pubblicato o, se la tecnologia dell'archivio lo consente, di vietare l'accesso ai dati fino a tre anni dopo la pubblicazione dell'articolo. Una dichiarazione che descrive la disponibilità dei dati sarà inclusa nel manoscritto come descritto nelle istruzioni per gli autori. Eccezioni all'archiviazione richiesta dei dati possono essere concesse a discrezione del Direttore per gli studi che includono informazioni sensibili (ad esempio, l'ubicazione di specie a rischio di estinzione). Il nostro editoriale che spiega la motivazione di questa politica può essere trovato qui . Un elenco più completo di archivi di dati è disponibile qui . Promuovere una cultura di collaborazione con i ricercatori che raccolgono e archiviano i dati: i dati raccolti dai biologi tropicali sono spesso a lungo termine, complessi e costosi da raccogliere. Il Board of Editors di Biotropica incoraggia vivamente gli autori che riutilizzano i data set di archivi archiviati a includere come collaboratori pienamente coinvolti gli scienziati che li hanno originariamente raccolti. Riteniamo che ciò migliorerà notevolmente la qualità e l'impatto della ricerca risultante attingendo alle profonde intuizioni del raccoglitore di dati sulla storia naturale del sistema di studio, riducendo il rischio di errori nelle nuove analisi e stimolando l'interdisciplinarietà e l'interculturalità. collaborazione e formazione per le quali ATBC e Biotropica sono ampiamente riconosciute.

NB: Biotropica è una delle due sole riviste che paga le tasse per gli autori che depositano i dati presso Dryad.

Il naturalista americano

L'American Naturalist richiede agli autori di depositare i dati associati agli articoli accettati in un archivio pubblico. Per i dati di sequenza genica e gli alberi filogenetici , è richiesta la deposizione rispettivamente in GenBank o TreeBASE . Esistono molti archivi possibili che possono adattarsi a un particolare set di dati, incluso il repository Dryad per i dati di biologia ecologica ed evolutiva. Tutti i numeri di accesso per GenBank, TreeBASE e Dryad devono essere inclusi nei manoscritti accettati prima di passare alla produzione. Se i dati vengono depositati altrove, fornire un collegamento. Se i dati vengono estratti dalla letteratura pubblicata, deposita i dati raccolti in Dryad per comodità dei tuoi lettori. Eventuali impedimenti alla condivisione dei dati dovrebbero essere portati all'attenzione dei redattori al momento dell'invio in modo che possano essere elaborati gli accordi appropriati.

Journal of Heredity

I dati primari alla base delle conclusioni di un articolo sono fondamentali per la verificabilità e la trasparenza dell'impresa scientifica e dovrebbero essere conservati in forma utilizzabile per decenni in futuro. Per questo motivo, Journal of Heredity richiede che le sequenze nucleotidiche o amminoacidiche segnalate di recente e le coordinate strutturali siano inviate a database pubblici appropriati (ad esempio, GenBank; EMBL Nucleotide Sequence Database ; DNA Database of Japan; Protein Data Bank  ; e Swiss -Proteggi ). I numeri di adesione devono essere inclusi nella versione finale del manoscritto. Per altre forme di dati (p. Es., Genotipi microsatelliti, mappe di collegamento, immagini), il Journal sostiene i principi della Joint Data Archiving Policy (JDAP) nell'incoraggiare tutti gli autori ad archiviare set di dati primari in un archivio pubblico appropriato, come Dryad, TreeBASE , o la rete di conoscenza per la biocomplessità. Gli autori sono incoraggiati a rendere i dati disponibili al pubblico al momento della pubblicazione o, se la tecnologia dell'archivio lo consente, optare per l'embargo dell'accesso ai dati per un periodo fino a un anno dopo la pubblicazione. L'American Genetic Association riconosce anche il vasto investimento dei singoli ricercatori nella generazione e nella cura di grandi set di dati. Di conseguenza, raccomandiamo che questo investimento sia rispettato nelle analisi secondarie o nelle meta-analisi con un cortese spirito collaborativo.

-  oxfordjournals.org

Ecologia molecolare

Molecular Ecology prevede che i dati a supporto dei risultati nel documento debbano essere archiviati in un archivio pubblico appropriato, come GenBank, Gene Expression Omnibus , TreeBASE, Dryad, the Knowledge Network for Biocomplexity , il proprio archivio istituzionale o finanziatore o come informazioni di supporto su il sito web di Ecologia Molecolare. I dati sono prodotti importanti dell'impresa scientifica e dovrebbero essere preservati e utilizzabili per decenni in futuro. Gli autori possono scegliere di rendere i dati disponibili al pubblico al momento della pubblicazione o, se la tecnologia dell'archivio lo consente, possono optare per l'embargo dell'accesso ai dati per un periodo fino a un anno dopo la pubblicazione. Possono essere concesse eccezioni a discrezione dell'editore, in particolare per informazioni sensibili come i dati di soggetti umani o l'ubicazione di specie in via di estinzione.

-  Wiley

Natura

Tale materiale deve essere ospitato su un sito indipendente accreditato (URL e numeri di accesso che devono essere forniti dall'autore), o inviato alla rivista Nature al momento dell'invio, caricato tramite il servizio di invio online della rivista o se i file sono troppo grandi o in un formato non adatto a questo scopo, su CD / DVD (cinque copie). Tale materiale non può essere ospitato esclusivamente sul sito web personale o istituzionale di un autore. La natura richiede al revisore di determinare se tutti i dati e i metodi supplementari sono stati archiviati. La politica consiglia ai revisori di considerare diverse domande, tra cui: "Si dovrebbe chiedere agli autori di fornire metodi o dati supplementari per accompagnare l'articolo online? (Tali dati potrebbero includere codice sorgente per studi di modellazione, protocolli sperimentali dettagliati o derivazioni matematiche).

Scienza

La scienza sostiene gli sforzi dei database che aggregano i dati pubblicati per l'uso della comunità scientifica. Pertanto, prima della pubblicazione, grandi set di dati (inclusi dati di microarray, sequenze di proteine ​​o DNA e coordinate atomiche o mappe di microscopia elettronica per strutture macromolecolari) devono essere depositati in un database approvato e un numero di accesso fornito per l'inclusione nel documento pubblicato. "Materiali e metodi" - La scienza ora richiede che, in generale, gli autori inseriscano la maggior parte della loro descrizione di materiali e metodi online come materiale di supporto, fornendo solo la descrizione dei metodi nel manoscritto stampato quanto è necessario per seguire la logica del testo . (Ovviamente, questa restrizione non si applicherà se l'articolo è fondamentalmente uno studio di un nuovo metodo o tecnica.)

Società Reale

Per consentire ad altri di verificare e sviluppare il lavoro pubblicato sulle riviste della Royal Society , è condizione della pubblicazione che gli autori rendano disponibili i dati, il codice e il materiale di ricerca a supporto dei risultati dell'articolo.

I set di dati e il codice dovrebbero essere depositati in un repository appropriato, riconosciuto e pubblicamente disponibile. Dove non esiste un repository specifico per i dati, gli autori dovrebbero depositare i propri set di dati in un repository generale come Dryad (repository) o Figshare .

Journal of Archaeological Science

Il Journal of Archaeological Science ha adottato una politica di divulgazione dei dati almeno dal 2013. La loro politica afferma che 'tutti i dati relativi all'articolo devono essere resi disponibili in file supplementari o depositati in archivi esterni e collegati all'interno dell'articolo. La politica raccomanda che i dati siano depositati in un archivio come l' Archeology Data Service , il Digital Archaeological Record o PANGEA . Uno studio del 2018 ha rilevato un tasso di disponibilità dei dati del 53%, che riflette una scarsa applicazione di questa politica o una comprensione incompleta tra editori, revisori e autori di come interpretare e implementare questa politica.

Politiche delle agenzie di finanziamento

Negli Stati Uniti, la National Science Foundation (NSF) ha rafforzato i requisiti per l'archiviazione dei dati. I ricercatori che cercano finanziamenti da NSF sono ora tenuti a presentare un piano di gestione dei dati come supplemento di due pagine alla domanda di sovvenzione.

L' iniziativa NSF Datanet ha portato al finanziamento del progetto Data Observation Network for Earth ( DataONE ), che fornirà l'archiviazione dei dati scientifici per i dati ecologici e ambientali prodotti da scienziati di tutto il mondo. L'obiettivo dichiarato di DataONE è preservare e fornire accesso a dati multiscala, multidisciplinari e multinazionali. La comunità di utenti di DataONE comprende scienziati, gestori di ecosistemi, responsabili politici, studenti, educatori e il pubblico.

Il DFG tedesco richiede che i dati della ricerca siano archiviati nell'istituto del ricercatore o in un'infrastruttura nazionale appropriata per almeno 10 anni.

Il British Digital Curation Center mantiene una panoramica delle politiche sui dati del finanziatore.

Archivi di dati

I dati della ricerca vengono archiviati in librerie o archivi di dati.

Guarda anche

Riferimenti

Appunti