gestion de données

Cours signalées avec « gestion de données »

Retrouvez dans ce module les clés pour bien gérer et partager vos données afin de répondre aux exigences de reproductibilité et contribuer ainsi à améliorer la qualité des résultats de la recherche.

Catégorie: Oscar Inrae
Durée estimée: 5 heures
Licence: Etalab (Licence Ouverte / Open Licence)
Open badge: Non
Nombre d'inscrits: 3
Catalogue: Oui
Thématique: Science Ouverte, Données de la recherche
Durée: Format long (> 1h30)
Type d'accès: Libre accès
Partenaire: Oscar INRAE
Langue: Français

Disquettes, CR-ROM, DVD, cartes SD, clés USB, disques durs externes, cloud computing... Nos façons de stocker nos données évoluent avec les supports. Chaque support a ses avantages et inconvénients en termes de sécurité et de facilité de partage des données.

Vous trouverez ici quelques conseils pour optimiser la sécurité de vos données durant un travail de recherche.

Auteur(s) / Formateur(s): Urfist Méditerranée
Production cours: Viet Jeannaud
Public cible: Chercheurs, Doctorants
Date de publication: 27 février 2017
Mise à jour: 15 janvier 2024
Durée estimée: 20 minutes
Licence: CC BY-NC-SA
Open badge: Non
Nombre d'inscrits: 3
Catalogue: Oui
Thématique: Données de la recherche
Durée: Format court (< 1h)
Type d'accès: Libre accès, Auto-inscription, Ressource éducative libre
Partenaire: Urfist
Langue: Français

Les wikis de la Fondation Wikimedia (Wikipédia, Wikidata, Wiktionnaire, etc.) constituent de précieux corpus de données pour les chercheurs. Cette formation permettra d'identifier les donnés ouvertes proposées, ainsi que les principaux outils facilitant la réutilisation de ces données. Outils vu au cours de cette formation : API, BaGLAMa, Dumps, EditGroups, Entitree, EventStream, GLAMorgan, GLAM Wiki Dashboard, Glitter, Grafana, Humaniki, Lingua Libre Query Service, Listen to Wikipedia, Mapping Diversity, Mix'n'match, OpenRefine, PageViews, Pattypan, Jupyter Notebook PAWS, PetScan, Quarry, QuickStatements, Retention, Special:Export, Special:Search, Tidywikidatar, Toolforge, Upload Wizard, Who Wrote That?, WikidataQueryServiceR, WikiNav, WikiPulse, WikiPulseAngular, Wikidata Query Service, Wikimedia Commons Query Service, Wikistats, Wikiscan, XTools.

Catégorie: Wikimedien
Open badge: Non
Nombre d'inscrits: 3
Catalogue: Oui
Thématique: Données de la recherche, Wikimédia, Outils / logiciels
Durée: Format long (> 1h30)
Type d'accès: Libre accès, Auto-inscription
Partenaire: Urfist
Langue: Français

Ce module présente des bonnes pratiques de gestion de données de recherche à travers un exemple de projet de recherche. 

Il aborde quelques notions principales pour s'initier progressivement : format de fichier, convention de nommage, support de stockage durant le projet, licence de réutilisation, documentation des données, dépôt dans un entrepôt de données.

Objectifs 
  • Distinguer formats de fichiers ouverts et fermés
  • Choisir un espace de stockage sécurisé
  • Suivre une règle de nommage de fichiers
  • Vérifier les conditions de réutilisation de données
  • Identifier un moyen simple pour documenter un jeu de données
  • Chercher un espace pour déposer en ligne ses données
Catégorie: Economie-gestion
Auteur(s) / Formateur(s): Sothearath Seang - Project Manager | Sevea Consulting
Production cours: Viet Jeannaud - Fondation Callisto
Public cible: Doctorants
Date de publication: 14 janvier 2022
Mise à jour: 25 mars 2025
Durée estimée: 30 minutes
Licence: CC BY-NC-SA
Open badge: Non
Catalogue: Oui
Thématique: Science Ouverte, Données de la recherche
Durée: Format court (< 1h)
Type d'accès: Libre accès
Partenaire: DoRANum
Langue: Français

Inspiré d'un projet de recherche en sciences économiques et en droit de la concurrence, disponible sur le site web de l'Institut des Études et de la Recherche sur le Droit et la Justice, ce cas d'étude pointe certaines pratiques liées à la gestion et la diffusion des données. 

Il a pour but de s'appuyer sur ces pratiques pour vous alerter sur les points de vigilance et d'amélioration à prévoir dans vos travaux scientifiques, notamment dans une perspective de reproductibilité.

Catégorie: Economie-gestion
Auteur(s) / Formateur(s): Sothearath Seang - Project Manager | Sevea Consulting
Production cours: Viet Jeannaud - Callisto Formation
Public cible: chercheurs, Doctorants en droit et économie
Date de publication: 9 février 2023
Durée estimée: 30 min
Prérequis: aucun
Licence: CC BY-NC-SA
Citation: Seang, S., & Jeannaud, V. (2023). Droit de la concurrence : approche quantitative de jeux de données juridiques (Version 1). Callisto Formation.
Open badge: Non
DOI: https://doi.org/10.60538/APPROCHE-QUANTITATIVE-DONNEES-JURIDIQUES
Nombre d'inscrits: 3
Catalogue: Oui
Thématique: Science Ouverte, Données de la recherche
Durée: Format court (< 1h)
Type d'accès: Libre accès, Auto-inscription
Partenaire: DoRANum
Langue: Français
Auteur(s) / Formateur(s): Auréa Cophignon - Université Côte d'Azur
Production cours: Viet Jeannaud - Fondation Callisto
Public cible: doctorants en biologie
Date de publication: 25 juin 2024
Durée estimée: 45 minutes
Prérequis: aucun
Licence: CC BY-NC-SA
Citation: Cophignon, A., & Jeannaud, V. (2024). Rédiger un DMP pour sa thèse en biologie (Version 1). Callisto Formation.
Open badge: Non
DOI: https://doi.org/10.60538/reaction-dmp-biologie
Nombre d'inscrits: 3
Catalogue: Non

L'objectif de ce cours est de présenter les différentes étapes associées à la gestion de la donnée scientifique dans les champs de la Biologie et de la Bio-informatique. On abordera ces étapes sous l'angle technique tout en considérant les perspectives de science ouverte et de données FAIR qu'il est indispensable d'intégrer dans sa démarche.

Catégorie: Bio-informatique
Auteur(s) / Formateur(s): Olivier Collin - Plate-forme GenOuest, Univ Rennes, Inria, CNRS, IRISA
Production cours: Amélie Barrio - Urfist Occitanie, Viet Jeannaud - Callisto Formation
Public cible: chercheurs, Doctorants en biologie et bioinformatique
Date de publication: 17 septembre 2023
Durée estimée: 2h30
Prérequis: aucun
Licence: CC BY-NC-SA
Citation: Collin, O., & Jeannaud, V. (2023). La question des données en Bio-Informatique (Version 1). Callisto Formation.
Open badge: Non
DOI: https://doi.org/10.60538/DONNEES-BIOINFORMATIQUE.
Nombre d'inscrits: 3
Catalogue: Oui
Thématique: Science Ouverte, Données de la recherche
Durée: Format long (> 1h30)
Type d'accès: Libre accès, Auto-inscription
Partenaire: DoRANum
Langue: Français

L'utilisation des données géospatiales connaît actuellement une croissance considérable. Elle joue un rôle de plus en plus important dans les domaines comme les services publics, l'environnement, l'urbanisme, la recherche, la gestion des ressources naturelles, la santé, l'administration des biens foncier, les réseaux de transport et d'énergie, etc.

Cette initiation vous permet d'avoir des notions basiques sur les données géospatiales : que sont les données géospatiales, les données vectorielles, matricielles (aussi appelées raster) et autres, les formats courants et leurs applications. Sont aussi évoqués des programmes de satellites d'observation et de surveillance de la Terre, la technologie LiDAR et les modèles MNT et MNE (Modèle Numérique du Terrain et d’Élévation). Enfin un diagramme évoque quelques pistes  pour trouver les données géospatiales en accès libre.

Catégorie: Environnement
Auteur(s) / Formateur(s): Nicolas Roelandt - Université Gustave Eiffel, Marion Maisonobe - CNRS-Geographie-Cité
Production cours: Olivier Lu - Urfist Lyon, Viet Jeannaud - Fondation Callisto
Public cible: toute personne souhaitant s'initier aux données géospatiales.
Date de publication: 21 juin 2024
Durée estimée: 1 heure 30
Prérequis: aucun
Licence: CC BY-NC-SA
Citation: N. ROELANDT, M. MAISONOBE and O. Lu, V. Jeannaud, “Gérer les données géospatiales" Callisto Formation, 2024.
Open badge: Non
DOI: https://doi.org/10.60538/comprendre-data-geo
Nombre d'inscrits: 3
Catalogue: Oui
Thématique: Science Ouverte, Données de la recherche
Durée: Format moyen (1h - 1h30)
Type d'accès: Libre accès, Auto-inscription
Partenaire: DoRANum
Langue: Français

Nous vous présentons ici les raisons pour lesquelles il convient d'ouvrir les données de recherche, c'est-à-dire de les rendre accessibles publiquement, afin notamment de permettre la reproductibilité des expériences.

À l'aide d'exemples concrets, nous donnons un certain nombre de raisons (éthiques, pratiques, légales…) d'effectuer la mise à disposition dans des entrepôts de données accessibles à long terme. Nous donnons également quelques pistes afin de mettre à disposition les données de recherche en accès libre.

La présentation est avant tout destinée aux universitaires en informatique théorique mais, du fait des similitudes dans ces différents domaines, les personnes effectuant leur recherche en informatique en général ou même en mathématiques, devraient y trouver bon nombre d'informations utiles.

Catégorie: Informatique
Auteur(s) / Formateur(s): Étienne ANDRÉ - Université Sorbonne Paris Nord, LIPN, CNRS UMR 7030
Production cours: Olivier Lu - Urfist Lyon
Public cible: toute personne effectuant des recherches en informatique théorique, ou plus généralement en informatique ou en mathématiques.
Date de publication: 22 novembre 2022
Durée estimée: 45 min
Prérequis: aucun
Licence: CC BY-NC-SA
Citation: É. André and O. Lu, “Ouvrir les données de recherche en informatique théorique : qu'a-t-on à y gagner ?” Callisto, 2023, doi: 10.60538/OUVRIR_DR_INFORMATIQUE_THEORIQUE.
Open badge: Non
DOI: https://doi.org/10.60538/ouvrir_dr_informatique_theorique
Nombre d'inscrits: 3
Catalogue: Oui
Thématique: Science Ouverte, Données de la recherche
Durée: Format court (< 1h)
Type d'accès: Libre accès, Auto-inscription
Partenaire: DoRANum
Langue: Français

Ce cours examine en profondeur les cohortes en santé et l'utilisation des données d'imagerie médicale en recherche médicale. Il couvre les enjeux techniques, juridiques et éthiques de l'ouverture des données de cohortes, ainsi que les défis liés à l'évolution des librairies de programmation et de l'environnement d'exécution dans le contexte des pipelines de traitement.

Catégorie: Santé publique
Auteur(s) / Formateur(s): Frédéric Cervenansky - UCBL Research Engineer | CREATIS
Production cours: Viet Jeannaud - Callisto Formation
Public cible: doctorants et ingénieurs en science des données médicales
Date de publication: 16 juin 2023
Durée estimée: 1h
Prérequis: aucun
Licence: CC BY-NC-SA
Citation: Cervenansky, F., & Jeannaud, V. (2024). Cohortes en santé : données ouvertes en imagerie médicale (Version 1). Callisto Formation.
Open badge: Non
DOI: https://doi.org/10.60538/cohortes-sante
Nombre d'inscrits: 3
Catalogue: Oui
Thématique: Science Ouverte, Données de la recherche
Durée: Format moyen (1h - 1h30)
Type d'accès: Libre accès, Auto-inscription
Partenaire: DoRANum
Langue: Français

netCDF permet la gestion de données scientifiques stockées sous la forme de tableaux. C’est un modèle de représentation des données qui s’applique bien pour structurer des données qui évoluent en fonction de certaines dimensions (temps, altitude, profondeur, latitude, longitude etc...). Il est recommandé pour les scientifiques et gestionnaires de données dans le cadre de la science ouverte par l’infrastructure de recherche Data Terra car il procure un cadre de standardisation international qui permet l’interopérabilité, la pérénnité et la réutilisation des données.

Ce cours est une introduction à netCDF. Il devrait vous permettre d'appréhender son fonctionnement et son utilité pour des travaux menés dans le cadre de la science ouverte.

Auteur(s) / Formateur(s): Maurice Libes - Service d'Observation OSU Pytheas
Production cours: Viet Jeannaud - Callisto Formation
Public cible: chercheurs, doctorants en climatologie, océanographie, météorologie, ou plus largement toutes personnes manipulant des données scientifiques stockées sous forme de tableaux
Date de publication: 1 octobre 2022
Durée estimée: 1h
Prérequis: aucun
Licence: CC BY-NC-SA
Citation: Libes, M., & Jeannaud, V. (2023). netCDF, format de fichier interopérable pour la science ouverte (Version 1). Callisto Formation.
Open badge: Non
DOI: https://doi.org/10.60538/NETCDF-INTRODUCTION-CALLISTO.
Nombre d'inscrits: 3
Catalogue: Oui
Thématique: Science Ouverte, Données de la recherche
Durée: Format moyen (1h - 1h30)
Type d'accès: Libre accès, Auto-inscription
Partenaire: DoRANum
Langue: Français

Dans le cadre du mouvement de l’Open Science, la question de la gestion et du partage des données de la recherche devient centrale dans le montage de projets de recherche. De plus en plus d’organismes de financement public conditionnent le versement de leurs subventions à la diffusion de ces données. Afin d'y répondre, les porteurs de projets doivent réaliser des plans de gestion de données.

Cette formation vise ainsi à fournir des éléments méthodologiques, techniques et juridiques afin d’adopter de bonnes pratiques dans le cadre de la gestion de données de la recherche : 

  • Comprendre les enjeux liés à la gestion et à la diffusion des données de la recherche 
  • Comprendre les principes de la gestion des données de la recherche 
  • Acquérir les bases pour l’élaboration d’un plan de gestion de données 
  • Utiliser l’outil DMP OPIDor afin de rédiger un plan de gestion de données
Auteur(s) / Formateur(s): Chloée Fabre - SCD UT2J
Production cours: Lucas Ricroch - Urfist Paris
Date de publication: 21 décembre 2021
Mise à jour: 2 mars 2024
Durée estimée: 2 heures
Licence: CC BY-NC-SA
Citation: Fabre, C. (2023). Gestion et diffusion des données de la recherche (Version 2). Callisto
Open badge: Non
DOI: doi.org/10.60538/GESTION-DIFFUSION-DONNEES-RECHERCHE
Nombre d'inscrits: 3
Catalogue: Oui
Thématique: Science Ouverte, Données de la recherche
Durée: Format long (> 1h30)
Type d'accès: Libre accès, Auto-inscription
Partenaire: Centre de ressources Urfist
Langue: Français
  • Comprendre ce qu’est l’Open Science / la Science Ouverte 
  • Open Access et Open Research Data 
  • Appréhender les services et les outils associés 
  • Se familiariser avec les enjeux de l’Open Science.
Auteur(s) / Formateur(s): Amélie Barrio - Urfist Occitanie, Chloée Fabre - SCD UT2J, Roxane Mauillon - SCD UT2J
Production cours: Lucas Ricroch - Urfist Paris
Date de publication: 25 novembre 2021
Mise à jour: 4 mars 2024
Durée estimée: 1 heure
Licence: CC BY-NC-SA
Citation: Barrio, A., Fabre, C., & Mauillon, R. (2021). La Science Ouverte, une introduction (Version 2). Callisto.
Open badge: Non
DOI: https://doi.org/10.60538/INTRODUCTION_SCIENCE_OUVERTE
Catalogue: Oui
Thématique: Science Ouverte, Publications scientifiques
Durée: Format moyen (1h - 1h30)
Type d'accès: Libre accès
Partenaire: Centre de ressources Urfist
Langue: Français
Auteur(s) / Formateur(s): Amélie Barrio
Production cours: Lucas Ricroch
Date de publication: 21 janvier 2025
Open badge: Oui
Nombre d'inscrits: 3
Catalogue: Non

Ce J.e-cours présente une introduction au RGPD, notions essentielles (finalité, registre de traitement, minimisation, etc.), cycle de vie des données, un exemples concrets issus d’établissements. Il s'adresse aux acteurs du circuit des thèses afin de mieux comprendre, appliquer et promouvoir le respect du RGPD auprès des doctorants, encadrants et chercheurs.

Auteur(s) / Formateur(s): Marie-Hélène Noël, DPO de l’UPEC / Rebecca Rousseau, adjointe DPO-RSSI de l’Université Paris 1 Panthéon-Sorbonne
Responsable(s) pédagogique(s): Abes
Date de publication: 20 novembre 2025
Durée estimée: 01h09
Licence: CC BY-NC
Open badge: Non
Catalogue: Oui
Thématique: Données de la recherche, Méthodologie de la thèse, Éthique et Intégrité scientifique, Aspects juridiques
Durée: Format moyen (1h - 1h30)
Type d'accès: Libre accès
Partenaire: Abes
Langue: Français