1. Portage
  2. /
  3. Outils et ressources
  4. /
  5. Directives de la GDR sur la COVID-19
  6. /
  7. Ensemble des documents requis pour les dépôts

Ensemble des documents requis pour les dépôts

La recherche sur la COVID-19 progresse de manière fulgurante. Par conséquent, le volume de production augmente exponentiellement. Il est donc encore plus important de documenter et décrire ces données de façon adéquate. Il est parfois nécessaire de diffuser les résultats d’essais préliminaires ou des ensembles de données brutes, que les autres chercheurs ont parfois du mal à interpréter sans information contextuelle. Pour que vos données soient compréhensibles indépendamment, vous pourriez inclure les éléments suivants :

  • Livre de codes ou fichier README ;
  • Description des méthodes suivies pour la collecte ou le traitement des données ;
  • Code, scripts ou syntaxe des fichiers à partir desquels vous traitez ou analysez vos données ;
  • Entente d’utilisation si certaines données sont restreintes.

Vous pouvez également télécharger ce document en format PDF de la communauté Zenodo de Portage.

Table des matières

Créer un fichier README

Pour créer un livre de codes ou un fichier README, veuillez tenir compte des éléments suivants :

  • Inclure un point de contact ;
  • Énumérer toutes les restrictions relatives à l’utilisation secondaire de vos données ;
  • Définir toutes les variables et valeurs admissibles pour les ensembles de données quantitatives. Le cas échéant, inclure les unités de mesure et définir les codes utilisés pour les valeurs manquantes ou nulles ;
  • Inclure une brève description de votre étude, méthodes de collecte des données et mesures prises pour traiter ou rendre les données anonymes ;
  • Inclure une liste des variables qui ont été retirées de vos ensembles de données brutes pour créer une copie publique à des fins d’archivage, le cas échéant. Les changements que vous avez apportés dans vos ensembles de données brutes sont ainsi transparents. Vous pourriez aussi inclure des statistiques sommaires pour les variables qui ont été retirées.
  • Énumérer l’équipement ou les instruments avec lesquels vous avez recueilli vos données, ainsi que les logiciels ou progiciels statistiques que vous avez utilisés pour traiter les données. Si possible, précisez la version des logiciels auxquels vous avez eu recours ;
  • Si vos fichiers ne sont pas en format texte clair, recommander les logiciels à utiliser pour voir ou analyser les fichiers.

Pour plus d’information à ce sujet, consulter les documents suivants : Guide rapide : créer un fichier README pour vos ensembles de données et Guide to writing « readme » style metadata (Université Cornell). Cornell a aussi publié un modèle de fichier README à télécharger et modifier pour vos propres ensembles de données.

Table des matières

Inclure les documents complémentaires recommandés

Pensez aussi à déposer les documents suivants, ou inclure un lien qui permet d’y accéder dans votre livre de codes ou fichier README si ces documents ont été déposés ailleurs :

  • Copie de votre plan de gestion de données ;
  • Exemplaire non signé du formulaire de consentement que vous remettez aux participants de l’étude. Vous pouvez l’archiver avec vos données, ou transmettre le formulaire au dépôt de données si vos données sont contrôlées avant d’être archivées pour évaluer le risque de divulgation ;
  • Documents complémentaires illustrant le contexte de vos données, notamment les protocoles d’étude, rapports d’études cliniques et plans d’analyse statistique ;
  • Liens vers des articles publiés ou ressources connexes qui présentent les résultats de vos analyses. Il est possible d’inclure les liens vers ces publications plus tard si vous avez déjà déposé vos données.

Table des matières

Ajouter des métadonnées pour le dépôt

Une autre façon de mettre vos données en contexte est d’ajouter des métadonnées riches quand vous les déposez. Certains dépôts disciplinaires exigent des normes auxquelles vous devez adhérer, mais plusieurs dépôts requièrent uniquement de l’information générale, dont le titre, auteur à contacter et choix de licence, pour publier les données. Afin d’accroître la facilité d’utilisation et de repérage de vos données, choisissez des mots clés et des titres descriptifs. Avec une description robuste, les autres chercheurs ont plus de facilité à comprendre vos données. Ceci est d’autant plus important si l’accès à vos ensembles de données est limité. Il est parfois utile de décrire un ensemble de données tout comme on rédigerait un résumé d’article. Cette description devrait inclure de l’information très détaillée sur l’ensemble de données, dont la méthodologie pour la collecte de données, mesures prises pour traiter ou analyser les données, résultats des analyses et autres utilisations potentielles des données.

Table des matières

Préciser les ententes d’utilisation des données

Si vous déposez des documents restreints, vous devez préciser toutes les limitations quant à l’accès et l’utilisation secondaire des données. Vous pouvez négocier une entente d’utilisation des données avec le dépôt, mais il est fortement recommandé de définir toutes les restrictions dans votre fichier README. Les conditions d’utilisation des dépôts sont en général très simples (https://www.immport.org/agreement). Dataverse propose des modèles d’entente d’utilisation des données plus complexes si vous avez des données dépersonnalisées sur des sujets humains : Harvard Dataverse Sample Data Usage Agreement.

Table des matières