Innover dans le domaine de l’intelligence visuelle pour de nouvelles expériences utilisateur – Samsung Global Newsroom

Au milieu de la quatrième révolution industrielle, les technologies de nouvelle génération telles que l’intelligence artificielle (IA), la 5G, la 6G et la robotique ont accéléré les changements que la technologie apporte à notre vie quotidienne, dans les domaines des transports, de la banque et même du fitness.

Samsung Electronics reconnaît depuis longtemps l’importance de ces technologies de pointe et poursuit activement l’innovation dans ces domaines. Des chercheurs experts travaillent d’arrache-pied à Samsung Research1 14 centres de R&D et 7 centres mondiaux d’IA dans le monde entier afin de préparer l’avenir, d’innover pour les utilisateurs et de créer la prochaine génération de technologies et de services de pointe sur lesquels repose l’héritage de Samsung Electronics.

Dans cette série de relais, Samsung Newsroom présente des experts techniques des centres de R&D de Samsung du monde entier pour en savoir plus sur leur travail et sur la manière dont il améliore directement la vie des consommateurs.

Le premier expert de la série à être présenté est Sergii Lytvynenko, chef de l’équipe d’intelligence visuelle au Samsung R&D Institute Ukraine (SRK). Sergii travaille pour SRK depuis plus de dix ans depuis son arrivée en tant qu’ingénieur logiciel. Lisez la suite pour en savoir plus sur le travail révolutionnaire que Lytvynenko et son équipe entreprennent chez SRK.

Q : Pouvez-vous présenter brièvement le Samsung R&D Institute Ukraine et le type de travail qui s’y déroule ?

Notre centre de R&D est situé à Kiev, au cœur de l’Ukraine. Depuis sa création en 2009, SRK s’est concentré et possède une expertise approfondie dans les domaines de l’IA, de la réalité augmentée (AR) / réalité virtuelle (VR) et de la sécurité. SRK est composé d’éminents professionnels de l’industrie et travaille actuellement sur l’étude de la sécurité du renseignement, de la vision par ordinateur, des services intelligents contextuels, etc. De plus, dans le cadre d’initiatives de coopération industrielle et éducative, SRK coopère activement avec les universités et écoles locales.

Q : Sur quoi travaillez-vous avec l’équipe d’intelligence visuelle en ce moment ?

Notre équipe mène actuellement des recherches fondamentales dans les domaines de l’IA, de la vision par ordinateur et de l’infographie. La mission principale de notre équipe est de transformer les avancées de la recherche en expériences utilisateur holistiques, améliorant ainsi la qualité de vie des gens, simplifiant leurs routines quotidiennes et offrant des émotions positives et des expériences immersives.

Pour ce faire, nous collaborons étroitement avec diverses équipes dans d’autres pays en menant des recherches avancées dans nos domaines de prédilection et en travaillant avec différentes unités commerciales en apportant nos technologies de base aux produits Samsung.

Q : Votre équipe couvre deux domaines technologiques majeurs : la vision par ordinateur et l’infographie. Comment ces technologies contribuent-elles à l’innovation de nouvelles expériences utilisateur ?

L’année dernière, nous avons entrepris un travail approfondi sur la solution Smart Trainer, qui permet un tout nouveau niveau d’expériences de fitness à domicile. Grâce à la caméra USB connectée à la Smart TV Samsung, le système peut suivre vos activités, suivre les exercices que vous faites et même proposer des recommandations sur la précision de votre forme, le tout grâce à l’IA. Nous sommes maintenant très heureux que les utilisateurs de téléviseurs Samsung puissent profiter de cette fonctionnalité chez eux.

Q : Comment intégrez-vous les technologies clés de vos domaines de prédilection dans vos projets actuels, tels que les lunettes AR ?

Ces jours-ci, nous effectuons une R&D avancée pour relever des défis majeurs dans les domaines de la vision par ordinateur et des graphiques pour les lunettes AR. Du côté de la vision, nous travaillons sur les solutions essentielles requises pour la RA, notamment la localisation et la cartographie simultanées (SLAM), l’estimation de la profondeur, la compréhension de l’environnement et l’interaction homme-machine (HCI). Côté graphisme, nous menons des recherches sur le rendu à faible latence pour l’optimisation de la RA et des performances de jeu.

Équipe d’intelligence visuelle au Samsung R&D Institute Ukraine

Q : En plus de la RA, votre équipe contribue au développement de la technologie S Pen. Pouvez-vous nous donner un aperçu du développement de cette technologie?

L’un de nos domaines de recherche et développement et nos solutions de base sont la technologie de reconnaissance de l’écriture manuscrite pour les appareils compatibles S Pen, qui est en cours de déploiement et de diffusion dans la gamme Galaxy. Tout en travaillant sur notre solution de reconnaissance d’écriture manuscrite, nous avons également développé un riche portefeuille de brevets, contribuant ainsi au développement technologique de base de Samsung.

Q : De quelle manière pensez-vous que les technologies S Pen optimisées que votre équipe a créées pour le Galaxy Z Fold3 compléteront l’expérience des utilisateurs de l’appareil ?

Le Galaxy Z Fold3 est un produit vraiment unique. Son grand écran flexible repousse les limites et ouvre de nouvelles possibilités aux utilisateurs pour servir de véritable compagnon de productivité pour les affaires quotidiennes et l’éducation. Dans ce contexte, le S Pen et la reconnaissance de l’écriture manuscrite et la faible latence deviennent d’une importance cruciale et nous utilisons le meilleur du stylo et du papier conventionnels pour offrir ces mêmes types d’expériences à l’écran numérique.

Q : De quelle manière les technologies que votre équipe a contribué au Galaxy Z Fold3 permettent-elles d’améliorer la qualité de vie des utilisateurs et de simplifier leurs routines ?

Nous avons déployé notre solution de prédiction de points basée sur l’IA pour minimiser l’entrée de latence du S Pen afin que l’expérience d’écriture et de dessin ressemble davantage à celle du stylo et du papier. De plus, les technologies de reconnaissance de l’écriture manuscrite rendent l’écriture numérique plus intelligente, plus facile et plus agréable. Les utilisateurs peuvent transformer leurs notes en documents imprimés, reconnaître des tableaux, des diagrammes, intégrer des liens, résoudre des problèmes mathématiques et plus encore, plus simplement que jamais. Des expériences comme celle-ci sont ce qui fait une réelle différence dans notre vie quotidienne.

Q : Selon vous, quelles sont les principales tendances technologiques en ce moment ?

De nos jours, nous reconnaissons la modalité visuelle comme la prochaine grande chose : comment transformer une note en une note intelligente, comment transformer une vidéo en une vidéo intelligente et combien d’informations contextuelles utiles nous pouvons extraire de ces processus. Pour cette technologie, la RA ouvre des tonnes de possibilités, ainsi que des défis à relever. Par exemple, « Digital Eyes » qui explorerait pleinement un environnement pour un utilisateur et fournirait des informations contextuelles bien organisées pourrait totalement changer nos vies.

Une autre grande tendance en ce moment est HCI. Ici, nous pensons que l’interaction multimodale, qui est un élément crucial de l’IHM, serait essentielle. Les interactions multimodales sont des interactions utilisateur-machine qui encapsulent la vision, le langage et les connaissances, et cette technologie peut aider un appareil Samsung à comprendre le monde dans lequel il se trouve.

Q : Quelle a été votre réalisation la plus mémorable chez SRK jusqu’à présent ?

Juin 2021 a été un mois vraiment spécial pour nous car nous avons remporté le CVPR (Conference on Computer Vision and Pattern Recognition) 2021 Chart Question Answering Challenge. CVPR est la plus grande conférence au monde sur la vision par ordinateur et l’IA. Nous sommes vraiment fiers de ce que nous avons accompli.

Q : Les technologies d’intelligence visuelle sont cruciales lorsqu’il s’agit d’innover de nouvelles expériences mobiles pour les utilisateurs. De quelles manières les technologies liées au langage contribuent-elles également à ces expériences ?

Le traitement du langage naturel (TAL) est l’un des domaines de recherche les plus difficiles. Nous souhaitons vraiment que chaque personne dans le monde puisse utiliser et expérimenter nos solutions, et pour y parvenir, l’extension et le support de la langue sont d’une importance cruciale. Dans la reconnaissance de l’écriture manuscrite S Pen, nous travaillons en permanence pour étendre la couverture linguistique. Notre solution prend désormais en charge plus de 80 langues, et d’autres sont en cours.

Une interview de Lukasz, un expert en traitement du langage naturel du Samsung Research Institute Poland se trouve dans l’épisode suivant.

1 Samsung Research est le centre de recherche et développement (R&D) avancé de la division Consumer Electronics (CE) et de la division IT & Mobile Communications (IM) de Samsung.

Toutes les actualités du site n'expriment pas le point de vue du site, mais nous transmettons cette actualité automatiquement et la traduisons grâce à une technologie programmatique sur le site et non à partir d'un éditeur humain.

Comments