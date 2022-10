Un groupe d’étudiants canadiens utilise un site de médias sociaux populaire pour aider à recueillir des informations pour une grande agence spatiale.

Badr Jaidi, étudiant diplômé de l’Université de la Colombie-Britannique, et son équipe, le groupe Social Landslides, ont formé des ordinateurs à «lire» Reddit pour aider une base de données de la NASA.

Les ordinateurs améliorent les prédictions du moment et du lieu des glissements de terrain en traitant les articles de presse sur les catastrophes naturelles et en fournissant les informations à la base de données publique, le Cooperative Open Online Repository (COOLR).

Jaidi et l’équipe terminent leur maîtrise en science des données à l’UBC.

“Lorsque nous savons où les glissements de terrain sont les plus susceptibles de se produire, certaines mesures préventives peuvent être mises en œuvre pour éviter ce type de dommages”, a déclaré Jaidi dans une interview avec CTV News Vancouver. “Donc, plus nous comprenons les glissements de terrain, plus ces mesures peuvent être mises en œuvre.”

Avant l’invention, les gens devaient soumettre manuellement des informations sur les glissements de terrain en recherchant dans des articles de presse. Désormais, l’outil automatise le processus, complétant la recherche et la soumission en quelques minutes.

L’outil analyse Reddit à la recherche d’articles de presse dans un délai donné et extrait les informations pertinentes. Pour éliminer les informations inutiles, l’ordinateur peut dire si le mot “glissement de terrain” est utilisé dans un contexte différent, comme quand quelqu’un gagne “par un glissement de terrain”.

L’équipe a formé l’ordinateur pour ensuite traiter le langage naturel des données de glissement de terrain afin qu’il puisse reconnaître les informations pertinentes.

“Nous lui donnerions un article de presse et demanderions où un glissement de terrain aurait pu se produire”, a expliqué Jaidi dans un message. “Le modèle prédirait la réponse en fonction de la langue impliquée, par exemple, ‘Le glissement de terrain s’est très probablement produit ici, selon cette phrase’, et nous lui ferions savoir si c’était correct ou non.”

L’ordinateur apprend quelles informations sont nécessaires, comme quand un glissement de terrain s’est produit, où, ce qui l’a causé et combien de morts ont été impliqués.

Selon le groupe, le système peut renvoyer l’équivalent d’un mois d’articles en 15 minutes environ et peut être introduit dans COOLR.

L’Organisation mondiale de la santé affirme que les glissements de terrain sont plus répandus que tout autre événement géologique. Les terres avec un terrain escarpé précédemment brûlé par des incendies de forêt et des canaux le long des cours d’eau sont les plus sensibles aux glissements de terrain.

L’équipe a utilisé Reddit car le site est libre d’accès et a moins de restrictions. Les étudiants sont convaincus que la technologie pourrait être étendue à de plus grandes plates-formes et être utilisée pour d’autres catastrophes naturelles.

Il a fallu deux mois aux étudiants pour réaliser le projet.