
Retrouvez dans ce module les clés pour bien gérer et partager vos données afin de répondre aux exigences de reproductibilité et contribuer ainsi à améliorer la qualité des résultats de la recherche.

Retrouvez dans ce module les clés pour bien gérer et partager vos données afin de répondre aux exigences de reproductibilité et contribuer ainsi à améliorer la qualité des résultats de la recherche.

Disquettes, CR-ROM, DVD, cartes SD, clés USB, disques durs externes, cloud computing... Nos façons de stocker nos données évoluent avec les supports. Chaque support a ses avantages et inconvénients en termes de sécurité et de facilité de partage des données.
Vous trouverez ici quelques conseils pour optimiser la sécurité de vos données durant un travail de recherche.

Les wikis de la Fondation Wikimedia (Wikipédia, Wikidata, Wiktionnaire, etc.) constituent de précieux corpus de données pour les chercheurs. Cette formation permettra d'identifier les donnés ouvertes proposées, ainsi que les principaux outils facilitant la réutilisation de ces données. Outils vu au cours de cette formation : API, BaGLAMa, Dumps, EditGroups, Entitree, EventStream, GLAMorgan, GLAM Wiki Dashboard, Glitter, Grafana, Humaniki, Lingua Libre Query Service, Listen to Wikipedia, Mapping Diversity, Mix'n'match, OpenRefine, PageViews, Pattypan, Jupyter Notebook PAWS, PetScan, Quarry, QuickStatements, Retention, Special:Export, Special:Search, Tidywikidatar, Toolforge, Upload Wizard, Who Wrote That?, WikidataQueryServiceR, WikiNav, WikiPulse, WikiPulseAngular, Wikidata Query Service, Wikimedia Commons Query Service, Wikistats, Wikiscan, XTools.

Ce module présente des bonnes pratiques de gestion de données de recherche à travers un exemple de projet de recherche.
Il aborde quelques notions principales pour s'initier progressivement : format de fichier, convention de nommage, support de stockage durant le projet, licence de réutilisation, documentation des données, dépôt dans un entrepôt de données.

Inspiré d'un projet de recherche en sciences économiques et en droit de la concurrence, disponible sur le site web de l'Institut des Études et de la Recherche sur le Droit et la Justice, ce cas d'étude pointe certaines pratiques liées à la gestion et la diffusion des données.
Il a pour but de s'appuyer sur ces pratiques pour vous alerter sur les points de vigilance et d'amélioration à prévoir dans vos travaux scientifiques, notamment dans une perspective de reproductibilité.


L'objectif de ce cours est de présenter les différentes étapes associées à la gestion de la donnée scientifique dans les champs de la Biologie et de la Bio-informatique. On abordera ces étapes sous l'angle technique tout en considérant les perspectives de science ouverte et de données FAIR qu'il est indispensable d'intégrer dans sa démarche.

L'utilisation des données géospatiales connaît actuellement une croissance considérable. Elle joue un rôle de plus en plus important dans les domaines comme les services publics, l'environnement, l'urbanisme, la recherche, la gestion des ressources naturelles, la santé, l'administration des biens foncier, les réseaux de transport et d'énergie, etc.
Cette initiation vous permet d'avoir des notions basiques sur les données géospatiales : que sont les données géospatiales, les données vectorielles, matricielles (aussi appelées raster) et autres, les formats courants et leurs applications. Sont aussi évoqués des programmes de satellites d'observation et de surveillance de la Terre, la technologie LiDAR et les modèles MNT et MNE (Modèle Numérique du Terrain et d’Élévation). Enfin un diagramme évoque quelques pistes pour trouver les données géospatiales en accès libre.

Nous vous présentons ici les raisons pour lesquelles il convient d'ouvrir les données de recherche, c'est-à-dire de les rendre accessibles publiquement, afin notamment de permettre la reproductibilité des expériences.
À l'aide d'exemples concrets, nous donnons un certain nombre de raisons (éthiques, pratiques, légales…) d'effectuer la mise à disposition dans des entrepôts de données accessibles à long terme. Nous donnons également quelques pistes afin de mettre à disposition les données de recherche en accès libre.
La présentation est avant tout destinée aux universitaires en informatique théorique mais, du fait des similitudes dans ces différents domaines, les personnes effectuant leur recherche en informatique en général ou même en mathématiques, devraient y trouver bon nombre d'informations utiles.

Ce cours examine en profondeur les cohortes en santé et l'utilisation des données d'imagerie médicale en recherche médicale. Il couvre les enjeux techniques, juridiques et éthiques de l'ouverture des données de cohortes, ainsi que les défis liés à l'évolution des librairies de programmation et de l'environnement d'exécution dans le contexte des pipelines de traitement.

netCDF permet la gestion de données scientifiques stockées sous la forme de tableaux. C’est un modèle de représentation des données qui s’applique bien pour structurer des données qui évoluent en fonction de certaines dimensions (temps, altitude, profondeur, latitude, longitude etc...). Il est recommandé pour les scientifiques et gestionnaires de données dans le cadre de la science ouverte par l’infrastructure de recherche Data Terra car il procure un cadre de standardisation international qui permet l’interopérabilité, la pérénnité et la réutilisation des données.
Ce cours est une introduction à netCDF. Il devrait vous permettre d'appréhender son fonctionnement et son utilité pour des travaux menés dans le cadre de la science ouverte.

Dans le cadre du mouvement de l’Open Science, la question de la gestion et du partage des données de la recherche devient centrale dans le montage de projets de recherche. De plus en plus d’organismes de financement public conditionnent le versement de leurs subventions à la diffusion de ces données. Afin d'y répondre, les porteurs de projets doivent réaliser des plans de gestion de données.
Cette formation vise ainsi à fournir des éléments méthodologiques, techniques et juridiques afin d’adopter de bonnes pratiques dans le cadre de la gestion de données de la recherche :



Ce J.e-cours présente une introduction au RGPD, notions essentielles (finalité, registre de traitement, minimisation, etc.), cycle de vie des données, un exemples concrets issus d’établissements. Il s'adresse aux acteurs du circuit des thèses afin de mieux comprendre, appliquer et promouvoir le respect du RGPD auprès des doctorants, encadrants et chercheurs.
Fondation abritée par la Fondation UNIT
soutenue par le Ministère de l’Enseignement Supérieur et de la Recherche
Tous droits réservés © 2021-2026 Fondation Callisto