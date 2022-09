Les réseaux de neurones à convolution profonde (DCNN) ne voient pas les objets comme les humains – en utilisant la perception de forme configurale – et cela pourrait être dangereux dans les applications d’intelligence artificielle (Al) du monde réel, selon les chercheurs. Les DCNN sont le type le plus couramment utilisé pour identifier les modèles dans les images et les vidéos. “Nos résultats expliquent pourquoi les modèles d’IA profonde échouent dans certaines conditions et soulignent la nécessité de considérer des tâches au-delà de la reconnaissance d’objets afin de comprendre le traitement visuel dans le cerveau”, a déclaré le chercheur James Elder de l’Université York à Toronto.

« Ces modèles profonds ont tendance à prendre des « raccourcis » lors de la résolution de tâches de reconnaissance complexes. Bien que ces raccourcis puissent fonctionner dans de nombreux cas, ils peuvent être dangereux dans certaines des applications d’IA du monde réel sur lesquelles nous travaillons actuellement avec nos partenaires industriels et gouvernementaux », a ajouté Elder.

Pour l’étude, publiée dans la revue iScience, l’équipe a utilisé de nouveaux stimuli visuels appelés “Frankensteins” pour explorer comment le cerveau humain et les DCNN traitent les propriétés holistiques et configurales des objets.

« Les Frankenstein sont simplement des objets qui ont été démontés et remontés à l’envers. En conséquence, ils ont toutes les bonnes fonctionnalités locales, mais aux mauvais endroits », a déclaré Elder.

Les enquêteurs ont découvert que si le système visuel humain est confus par les Frankenstein, les DCNN ne le sont pas, ce qui révèle une insensibilité aux propriétés configurales des objets.

Selon les chercheurs, les modifications de la formation et de l’architecture visant à rendre les réseaux plus ressemblant au cerveau n’ont pas conduit à un traitement de configuration, et aucun des réseaux n’a été en mesure de prédire avec précision les jugements d’objets humains essai par essai.

“Nous supposons que pour correspondre à la sensibilité de la configuration humaine, les réseaux doivent être formés pour résoudre un plus large éventail de tâches d’objet au-delà de la reconnaissance des catégories”, a noté Elder.

