Homme pesant des patates douces à chair orange récoltées le long des berges du Brahmapoutre, dans le nord du Bangladesh

Homme pesant des patates douces à chair orange récoltées le long des berges du Brahmapoutre, dans le nord du Bangladesh.
Photo : S.Quinn / CIP

GARDIAN – moteur de recherche permettant d’accéder aux mégadonnées agricoles

Le CGIAR a lancé GARDIAN, sa nouvelle plateforme de mégadonnées (big data) agricoles. Cette plateforme vise à exploiter les capacités du big data pour accélérer et améliorer l’impact de la recherche agricole internationale. GARDIAN assurera un leadership mondial en organisant des données FAIR (Findable, Accessible, Interoperable, Reusable), soit des données trouvables, accessibles, interopérables et réutilisables, en invitant les partenaires à élaborer des idées innovantes, et en démontrant la puissance de l’analyse des mégadonnées grâce à la réalisation de projets motivants.

GARDIAN, premier moteur de recherche de données agricoles pour l’ensemble du CGIAR, est censé représenter un important pas en avant en réunissant de précieuses connaissances scientifiques fournies par le réseau CGIAR et d’autres sources. Le CGIAR a lancé cette plateforme de mégadonnées agricoles en juin 2019.

GARDIAN tire parti de la puissance de l’analyse des mégadonnées pour aider le CGIAR à s’imposer comme leader de la production d’idées exploitables basées sur cette analyse. Il renforcera ses capacités à générer et gérer les mégadonnées et devra se conformer aux principes de libre accès et de données ouvertes afin de permettre la réalisation d’importantes recherches et la création de grosses bases de données. Il devra également permettre aux chercheurs de renforcer les capacités d’analyse des données, d’élaborer en coordination des outils et services pratiques d’exploitation des mégadonnées, et il devra combler d’importantes lacunes organisationnelles et techniques afin d’élargir l’horizon de la recherche du CGIAR. La plateforme est cogérée par le Centre international d’agriculture tropicale (CIAT) et l’Institut international de recherche sur les politiques alimentaires (IFPRI).

Faire en sorte que les données soient FAIR (trouvables, accessibles, interopérables et réutilisables)

« Pour que les données soient vraiment utiles, il faut qu’elles soient réutilisables. C’est pourquoi nous ne voulons plus seulement parler de données ouvertes, mais aussi de la raison pour laquelle elles doivent également être FAIR, c’est-à-dire trouvables, accessibles, interopérables et réutilisables, » déclare Medha Devare, auteure et architecte du GARDIAN. « Par exemple, on peut toujours télécharger un PDF d’une base de données ouvertes dans une archive ; mais la question est de savoir ce qu’on peut vraiment faire de ces données. Pour que ces données alimentent vraiment l’innovation, il faut faire en sorte qu’elles soient trouvables, accessibles, interopérables et réutilisables, autrement dit FAIR, » explique Medha Devare.

Pour qu’une ressource soit trouvable, elle a besoin d’identificateurs permanents, de riches métadonnées et d’une bonne documentation. Pour être accessible, elle doit faire l’objet de droits d’utilisation précis – de préférence non restrictifs – et donner accès aux métadonnées et au dossier physique. Pour être interopérable, elle doit inclure des normes applicables aux métadonnées et aux données, ce qui suppose l’utilisation d’une terminologie contrôlée et de normes sémantiques. Ces normes permettent l’utilisation d’un même « langage » pour différentes sources d’informations, ce qui facilite l’interprétation et l’agrégation — aussi bien au niveau humain qu’au niveau matériel. Dès lors qu’une ressource est un composite de ces différentes dimensions, on peut considérer qu’elle est réutilisable – et par conséquent FAIR.

Plus qu’une recherche et une découverte de ressources

Les centres CGIAR ont habituellement deux référentiels distincts : un pour les données et un pour les publications. D’une manière générale, ces référentiels sont sur différentes plateformes qui ne communiquent pas entre elles. GARDIAN permettra aux utilisateurs de trouver, rapidement et facilement, des informations agricoles sur la trentaine de plateformes de données et de publications des 15 centres CGIAR et de 11 banques de gènes. Il permet actuellement d’accéder à environ 100 000 publications et 3 000 ensembles de données. Bientôt, cet outil permettra également de découvrir des ressources au-delà du CGIAR.

« Nous avions besoin d’un outil permettant d’effectuer des recherches sur l’ensemble des centres CGIAR et au-delà, en utilisant des mots clés simples ou multiples – par exemple genre, nutrition, ou maïs tolérant à la sécheresse – pour identifier les ressources qui existent pour ce thème, » explique Medha Devare.

(CGIAR / db)

Plus d’informations :

Visitez le site web de GARDIAN