Skip to content

PINGDINGSHAN, Chine (Reuters) – Dans un village de la province centrale du Henan, au milieu de chiens qui aboyaient et de poules errantes, les villageois se rassemblent le long d’un chemin de terre pour échanger des images de leur visage contre des bouilloires, des casseroles et des tasses à thé.

Visages de la batterie de cuisine: le secteur de la collecte de données est florissant alors que la Chine poursuit les ambitions de l'IA

PHOTO DE FICHIER: Les employés travaillent sur l’étiquetage de différents éléments pour la collecte de données sur des écrans d’ordinateur, qui serviraient au développement de l’intelligence artificielle (IA) et de la technologie d’apprentissage automatique, à la Qian Ji Data Co dans le comté de Jia, province du Henan, Chine 20 mars 2019. REUTERS / Irene Wang

Au début de la file, une femme se tient devant un appareil photo relié à un trépied. Elle tient une photo de sa tête avec les yeux et le nez tranchés devant son visage et pivote lentement d'un côté à l'autre.

Les villageois qui attendent leur tour prennent un ticket numéroté. Certains disent que c’est la troisième ou la quatrième fois qu’ils viennent faire ce genre de travail.

Le projet, exécuté dans une maison de village paisible entourée d'une cour et ornée d'affiches de l'ancien dirigeant chinois Mao Zedong, recueille des matériaux susceptibles de former un logiciel d'IA à la distinction entre les traits réels du visage et les images fixes.

«Les projets les plus importants comptent des dizaines de milliers de personnes, qui vivent toutes dans cette région», a déclaré Liu Yangfeng, PDG de Qianji Data Co Ltd, qui collecte et étiquète les données de plusieurs des plus grandes entreprises de technologie de Chine et est basée dans la ville voisine. de Pingdingshan.

"Nous créons davantage de jeux de données pour servir plus de sociétés d'algorithmes d'IA, afin qu'elles puissent servir le développement de l'intelligence artificielle en Chine", a déclaré Liu, refusant de divulguer ses clients.

L'essor de la demande de données pour la formation d'algorithmes d'intelligence artificielle alimente une nouvelle industrie mondiale qui rassemble des informations telles que des photos et des vidéos, qui sont ensuite étiquetées pour indiquer aux machines ce qu'elles voient.

Les entreprises impliquées dans l'étiquetage ou l'annotation de données, comme on l'appelle aussi, incluent des plates-formes de crowdsourcing telles que Amazon.com (AMZN.O) Mechanical Turk, qui offre aux utilisateurs de petites sommes d’argent en échange de tâches simples, en sous-traitant des entreprises telles que la société indienne Wipro Ltd (WIPR.NS) ainsi que des étiqueteuses professionnelles comme Qianji.

Cognilytica, société américaine de recherche spécialisée dans l'IA, estime que le marché mondial des annotations de données liées à l'apprentissage automatique a augmenté de 66%, pour atteindre 500 millions de dollars en 2018, et qu'il devrait plus que doubler d'ici 2023. Certains initiés du secteur indiquent toutefois le travail effectué n'est pas divulgué, ce qui rend difficile la précision des estimations.

LOIS DE CONFIDENTIALITÉ FAIBLES, BON TRAVAIL

La Chine est devenue un pôle clé pour la collecte de données et l'étiquetage grâce à la demande insatiable d'un secteur de l'intelligence artificielle en plein essor, soutenu par le parti communiste au pouvoir, qui considère l'IA comme un moteur de la croissance économique et un outil de contrôle social.

Un grand nombre d'entreprises ont beaucoup investi dans un domaine de l'IA appelé apprentissage automatique, qui est au cœur de la technologie de reconnaissance faciale et d'autres systèmes basés sur la recherche de modèles de données.

Ceux-ci incluent les géants de la technologie Alibaba Group Holding Ltd (BABA.N), Tencent Holding Ltd (0700.HK), Baidu Inc (BIDU.O) ainsi que de sociétés plus jeunes telles que le spécialiste en intelligence artificielle SenseTime Group Ltd et la société de reconnaissance vocale Iflytek Co Ltd (002230.SZ).

Le résultat a été une prolifération de produits et services d'IA en Chine, allant des systèmes de paiement basés sur la reconnaissance faciale à la surveillance automatisée, en passant même par les présentateurs de nouvelles des médias d'Etat animés par l'IA. Les consommateurs chinois considèrent généralement ces technologies comme nouvelles et futuristes, malgré les inquiétudes suscitées par certaines applications plus invasives.

La faiblesse des lois sur la confidentialité des données et une main-d'œuvre bon marché ont également constitué un avantage concurrentiel pour la Chine, qui cherche à devenir un chef de file mondial dans le domaine de l'IA. Les villageois du Henan étaient heureux d’échanger plusieurs séances devant une caméra contre une tasse de thé ou plusieurs heures contre une casserole.

CLIENTS D'OUTRE-MER

Basée à Pékin, BasicFinder, une entreprise d’étiquetage de données de premier plan implantée dans les provinces du Hebei, du Shandong et du Shanxi, compte un solide éventail de clients nationaux et étrangers.

Lors d'une visite récente dans ses bureaux de Pékin, certains membres du personnel étaient en train d'étiqueter des images de personnes endormies qui seront utilisées par un projet de conduite autonome pour identifier les conducteurs susceptibles de s'endormir au volant.

D'autres étiquetaient des documents britanniques des années 1800 pour un service d'ascendance en ligne occidental, marquant des champs pour les dates, les noms et les sexes sur les certificats de naissance et de décès.

Selon le directeur général de BasicFinder, Du Lin, le fait d’embaucher des étiqueteuses qualifiées en Chine revient moins cher que d’utiliser les marchés du crowdsourcing occidental.

Un projet de l’Université de Princeton relatif à la conduite autonome a initialement confié une tâche à Mechanical Turk d’Amazon, mais à mesure que la tâche devenait plus compliquée, les gens commençaient à faire des erreurs et BasicFinder avait été invité à corriger les résultats, a déclaré Du.

Dans ce projet, une étiqueteuse BasicFinder formée a été en mesure de faire le travail de trois étiqueteuses externalisées, a-t-il ajouté.

«Peu à peu, ils ont constaté qu'ils payaient moins cher pour l'étiquetage, alors ils nous ont embauché pour étiqueter toutes les œuvres dès le début», a déclaré Du.

Princeton a refusé de commenter.

Pour les employés en étiquetage, les raisons de se joindre à l’industrie chinoise des données sont simples. Le travail, bien que parfois fastidieux, est une amélioration des autres emplois disponibles pour les jeunes travailleurs qui souhaitent rentrer chez eux dans de petites villes et villages chinois.

Les étiqueteuses de Qianji gagnent environ 100 yuans (14,50 dollars) par jour en marquant des points de données sur des photographies de personnes, des images de surveillance et des images de rue.

Selon les employés, le travail est généralement simple, bien que certains contenus étrangers constituent un défi.

Visages de la batterie de cuisine: le secteur de la collecte de données est florissant alors que la Chine poursuit les ambitions de l'IA
Diaporama (4 Images)

«Une fois, nous avons pensé classer les cuisinières de style européen équipées d'une laveuse», a déclaré Jia Yahui, étiqueteuse chez Qianji. "Plus tard, on nous a dit qu'il s'agissait en réalité de deux choses distinctes, une cuisinière et un lave-vaisselle."

L'étiquetage apporte aux zones rurales certains des avantages du secteur de la technologie en termes d'emploi, mais ces avantages pourraient être de courte durée si l'IA améliorait suffisamment sa capacité pour effectuer de nombreuses tâches effectuées par les étiqueteuses.

«Nous pensons que cette industrie existera encore dans trois à cinq ans. Ce n'est peut-être pas une carrière à long terme. Nous ne pouvons penser qu'au plan quinquennal pour le moment », a déclaré Liu, PDG de Qianji.

Reportage de Cate Cadell; Édité par Jonathan Weber et Edwina Gibbs

Nos standards:Les principes de Thomson Reuters Trust.

Source

Shein Many GEO's Shein Many GEO's

Comments

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *