1. Portage
  2. /
  3. Outils et ressources
  4. /
  5. Directives de la GDR sur la COVID-19
  6. /
  7. Dépôts recommandés pour les données de recherche sur la COVID-19

Dépôts recommandés pour les données de recherche sur la COVID-19

La communication des données de recherche impose une nouvelle recherche et façonne les politiques et la prise de décisions. En temps de pandémie, l’accès rapide aux données les plus récentes éclaire les réponses des responsables de la santé publique et aide à sauver des vies. Préserver ces données en vue de leur utilisation future contribue aussi à clarifier les effets économiques, politiques et culturels à long terme de la santé publique et des décisions stratégiques, et à mieux se préparer en vue d’autres éventuelles pandémies. Le présent document vous aidera à choisir un dépôt qui vous donnera un accès immédiat et à long terme à vos données sur la COVID-19.

Vous pouvez également télécharger ce document en format PDF de la communauté Zenodo de Portage.

Table des matières

Choisir entre un dépôt disciplinaire ou général

Option 1 : Dépôt de données disciplinaire

Les données de recherche devraient être déposées dans un dépôt qui est reconnu par les autres chercheurs de votre communauté de pratique. Si un tel dépôt n’existe pas ou si aucun ne convient, vous pouvez déposer vos données de recherche dans un dépôt général (voir l’option 2).

Les avantages d’un dépôt disciplinaire sont les suivants :

  • vos données de recherche sont plus visibles pour les collègues qui entreprennent le même genre de recherche ;
  • le dépôt peut être conçu de manière à mieux accepter votre type de données ;
  • de nombreux dépôts de données de recherche sont des collections de curation des données de recherche sur la COVID 19 pour améliorer la divulgation de ce type de données.

Au moment de choisir un dépôt de données de recherche disciplinaire, attardez-vous sur :

  • les suggestions ou les exigences formulées dans les directives des bailleurs de fonds (p. ex. IRSC)
  • les listes des dépôts de données disciplinaires recommandés qui sont publiées dans diverses revues, dont Scientific Data et PLOS ONE .
  • la popularité au sein de la communauté (quels sont les dépôts largement utilisés dans votre domaine ? Ce sont ceux qui sont susceptibles d’être consultés par vos pairs) .

Table des matières

Dépôts disciplinaires recommandés

Voici la liste retenue des dépôts qui conviennent pour la communication des données sur la COVID-19. Elle est loin d’être complète. Vous trouverez aussi d’excellentes recommandations dans RDA COVID-19 Recommendations and Guidelines (trad. : les recommandations et directives de la RDA en ce qui a trait à la COVID‑19).

  • Santé publique et épidémiologie
    • OpenICPSR COVID-19 Data Repository (trad. : Dépôt de données sur la COVID‑19 d’OpenICPSR).
      • Le risque de divulgation rattaché aux ensembles de données déposés dans OpenICPSR ne fait pas l’objet d’un examen, mais, en répondant à une série de questions, vous pourrez déterminer si les données peuvent être rendues publiques. Les données qui contiennent des renseignements sensibles ou qui permettent d’établir l’identité d’une personne seront publiées en accès restreint (serveurs localisés aux États-Unis).
      • Il est possible de se procurer une trousse de curation professionnelle comprenant une analyse de divulgation. Communiquez à cette fin avec le service des acquisitions de l’ICPSR at deposit@icpsr.umich.edu pour en savoir plus.
  • Sciences sociales
  • Logiciels
  • Données cliniques
    • Vivli pour les données des essais cliniques
      • Accès restreint. D‑wise renoncera aux frais d’anonymisation des études sur la COVID‑19 qui seront faites au moyen de la plateforme Vivli, et Vivli renoncera aux frais relatifs à la communication et à l’archivage de toutes les données des essais cliniques liés à la COVID-19 de même qu’à leur accès.
    • OpenNeuro pour les IRM, MEG, EEG, iEEG et ECoG
      • Dépôt en libre accès. Les données doivent être dépersonnalisées avant d’être partagées.
    • EBRAINS pour les données brutes ou traitées sur le cerveau humain, les modèles, les analyses, les méthodes, les codes, les logiciels
      • Dépôt en libre accès. Les données doivent être dépersonnalisées avant d’être partagées.
    • RSNA International COVID-19 Open Radiology Database (trad. : base de données ouverte de radiologie sur la COVID‑19 de RSNA International) pour l’imagerie thoracique (TDM et rayons X)
      • Dépôt en libre accès. Les images doivent être dépersonnalisées. RSNA a publié un protocole de dépersonnalisation et le logiciel Anonymizer à cette fin.
    • The Immunology Database and Analysis Portal (ImmPort) (Trad. : The portail des bases de données et de l’analyse en immunologie) pour la cytométrie et l’immunologie
  • Acides nucléiques et « omiques »
    • International Nucleotide Sequence Database Collaboration (INSDC) (Trad. : archives de la collaboration internationale sur la base de données de séquences nucléotidiques) pour les données de génomique (données brutes sur la séquence du virus, données sur l’expression des gènes)
    • NCBI GenBank pour les données en génomique (génomes assemblés et annotés)
    • La Worldwide Protein Data Bank (wwPDB) pour les données de structure
    • Voir RDA Guidelines (Trad. : des directives de la RDA) la section 4.4. (pages 28 à 36) sur les recommandations concernant le génome du virus et le génome hôte, les données de structure, la protéomique, la métabolomique et la lipidomique.

Table des matières

Option 2 : Dépôt de données de recherche canadien ou international général

Il existe un bon nombre de dépôts de données de recherche généraux, notamment les dépôts de bibliothèques universitaires canadiennes. Ils fournissent un lieu où déposer des données à partager sans égard au sujet de la recherche et ils sont sans doute plus aptes à recevoir d’une variété de données.

Votre choix pourrait s’arrêter sur ce genre de dépôts si :

  • aucun dépôt disciplinaire ne convient ;
  • vous souhaitez déposer avec vos données des programmes d’analyse et des renseignements complémentaires ;
  • vous aimeriez partager vos données avec un public élargi.

Les dépôts canadiens vous permettront de garder vos données sur des serveurs canadiens, profiter de services de curation dans vos institutions (le cas échéant) et rendre vos données visibles à de larges communautés de données. L’interopérabilité et la visibilité entre les dépôts canadiens et internationaux ne cessent de s’améliorer. Le Dépôt fédéré des données de recherche (DFDR) canadien recueille des métadonnées de nombreux autres dépôts canadiens, dont tous les dépôts du Scholars Portal Dataverse, et les partage avec OpenAIRE pour que les données canadiennes puissent être consultées à l’échelle internationale.

Table des matières

Dépôts généraux recommandés

*En 2019, Portage a publié un guide intitulé Options de dépôt au Canada qui décrit et compare Dataverse et DFDR en détail. Si vous avez du mal à choisir entre ces deux options, nous vous recommandons de lire la section intitulée « Comment décider quelle option de dépôt utiliser ? »

Table des matières

Option 3 : Choisir son propre dépôt

Nous avons mis en évidence quelques dépôts dans nos recommandations précédentes, mais il existe beaucoup plus d’options disponibles pour différentes disciplines et différents objectifs. Vous aurez peut-être la chance de trouver un dépôt pertinent en utilisant les outils de découverte suivants.

Sachez que la plupart de ces outils répertorient une grande variété de dépôts, dont certains n’offrent pas de conservation à long terme ou n’acceptent pas les dépôts de données (il s’agit uniquement de plateformes de publication ou de découverte). Il peut être utile de garder à l’esprit ce Survol des caractéristiques importantes des dépôts lors votre exploration de ces ressources :

  • This General Repository Comparison Chart (Trad. : Ce Tableau de comparaison des dépôts généralistes) vous donne un aperçu des grands dépôts généralistes internationaux.
  • The Repository Finder (Trad. : L’outil de repérage de dépôt) fouille dans le répertoire re3data de dépôts de recherche pour aider les chercheurs à trouver des options convenables de dépôt.
  • Vous pouvez explorer re3data par sujet, puis utiliser des filtres pour raffiner vos résultats. Les filtres de téléversement (data upload) et de restrictions de téléversement (data upload restrictions) vous aident à éliminer les dépôts qui n’acceptent pas de nouveaux dépôts ou ceux qui imposent des limites quant aux déposants (par exemple, des dépôts réservés aux établissements membres).
  • FAIRsharing peut servir à trouver diverses normes et bases de données dans votre domaine de recherche. Sachez que la catégorie des bases de données comprend à la fois les dépôts qui peuvent accueillir de nouveaux dépôts de données, et d’autres ressources qui cataloguent et hébergent des données, mais qui peuvent ne pas accepter de dépôts directs de données de la part des chercheurs.

Table des matières

Survol des caractéristiques importantes des dépôts

En plus de rendre vos données accessibles, les bons dépôts garantiront la fiabilité de celles-ci. Pour ce faire, les dépôts doivent disposer d’une infrastructure fiable, d’une bonne gouvernance, de politiques qui soutiennent leur communauté (tant les déposants que les utilisateurs) et ils doivent faire preuve d’une gestion responsable des données. Les recommandations suivantes sont adaptées des principes TRUST pour les dépôts numériques généralement reconnus :

  • Le dépôt a la possibilité d’attribuer des identifiants uniques aux ensembles de données (par exemple, DOIs ou des numéros d’acquisition).
    • Pourquoi est-ce important ? Cela vous permettra et permettra aux autres de citer vos ensembles de données en reliant vos données aux résultats de vos recherches et en veillant à ce que vos données puissent être découvertes.
  • Le dépôt a des conditions d’utilisation claires et s’engage à conserver les fonds numériques.
    • Pourquoi est-ce important ? Certains dépôts ne permettent pas de conserver les données. Si vous voulez vous assurer que vos données sont conservées à long terme, vous devez choisir un dépôt qui a une politique claire en matière de conservation.
  • Le dépôt assure l’intendance du fonds de données, y compris la validation technique, la documentation et le contrôle de la qualité.
    • Pourquoi est-ce important ? Les déposants et les utilisateurs doivent avoir confiance dans la qualité durable des données contenues dans un dépôt.
  • Le dépôt dispose d’un mécanisme d’assistance aux utilisateurs
    • Pourquoi est-ce important ? Les dépôts doivent être transparents et facilement compréhensibles par l’utilisateur final, en suivant l’évolution des attentes et en y répondant.
  • Le dépôt est reconnu au sein de sa communauté de recherche, et soutient les métadonnées et les normes de conservation désignées de la communauté.
    • Pourquoi est-ce important ? Où allez-vous pour rechercher des données dans votre domaine ? Les chercheurs doivent pouvoir trouver vos données dans les endroits où ils s’attendent à les trouver.

Table des matières

Quelques éléments à considérer

  • Quels types de résultats de recherche devez-vous archiver ?
    • Les lignes directrices de la RDA recommandent aux chercheurs d’archiver les données situationnelles, les modèles analytiques, les résultats scientifiques et les rapports utilisés dans la prise de décision. Certains dépôts n’acceptent pas tous ces types de documents. Vous pouvez mettre en évidence les ressources connexes dans votre fichier README ou dans d’autres documents ; de nombreux dépôts ont un champ « ressources connexes » qui vous permettra de faire des liens directs à des ressources externes.
  • Où vos données seront-elles stockées ? Vos données doivent-elles être hébergées au Canada ?
    • Si vous avez des préoccupations en matière de confidentialité ou de sécurité, vous devrez considérer le lieu de stockage du dépôt en plus de ses autres caractéristiques.
  • Est-ce que toutes vos données peuvent être partagées ? Avez-vous besoin d’un dépôt qui peut en restreindre l’accès ?

Table des matières

Dépôts

  1. EBRAINS https://ebrains.eu/services/data-knowledge/share-data
  2. Dépôt fédéré de données de recherche (DFDR) https://www.frdr-dfdr.ca/repo/?locale=fr
  3. Immunology Database and Analysis Portal (ImmPort) https://www.immport.org/resources/dataTemplates
  4. International Nucleotide Sequence Database Collaboration (INSDC) archives http://www.insdc.org/
  5. NCBI GenBank https://www.ncbi.nlm.nih.gov/genbank/
  6. OpenICPSR COVID-19 Data Repository https://www.openicpsr.org/openicpsr/covid19
  7. OpenNeuro https://openneuro.org/
  8. Qualitative Data Repository https://qdr.syr.edu/deposit/process
  9. RSNA International COVID-19 Open Radiology Database https://www.rsna.org/covid-19/COVID-19-RICORD
  10. Scholars Portal Dataverse https://dataverse.scholarsportal.info/
  11. Software Heritage Archive https://www.softwareheritage.org/save-and-reference-research-software/
  12. Vivli https://vivli.org/
  13. Worldwide Protein Data Bank (wwPDB) http://www.wwpdb.org/
  14. Zenodo https://zenodo.org/

Table des matières