Pour Bollywood, les belles femmes ont la peau claire, selon une analyse informatique basée sur l’intelligence artificielle (IA) qui révèle que la conception de la beauté est restée cohérente au fil des ans dans l’industrie cinématographique centrée à Mumbai.

L’analyse informatique automatisée a été menée par des chercheurs d’origine indienne de l’Université Carnegie Mellon (CMU) aux États-Unis.

La recherche a révélé que les bébés dont la naissance était représentée dans les films de Bollywood des années 50 et 60 étaient le plus souvent des garçons; dans les films d’aujourd’hui, les nouveau-nés garçons et filles sont à peu près également répartis.

Dans les années 50 et 60, la dot était socialement acceptable; aujourd’hui, pas tellement.

Les chercheurs, dirigés par Kunal Khadilkar et Ashiqur KhudaBukhsh du Language Technologies Institute (LTI) de la CMU, ont rassemblé 100 films de Bollywood de chacune des sept dernières décennies ainsi que 100 des mouvements hollywoodiens les plus rentables de la même période.

Ils ont ensuite utilisé des modèles linguistiques statistiques pour analyser les sous-titres de ces 1 400 films pour les préjugés sexistes et sociaux, à la recherche de facteurs tels que les mots étroitement associés les uns aux autres.

«La plupart des études culturelles sur les films pourraient envisager cinq ou dix films», a déclaré Khadilkar, étudiant à la maîtrise en LTI.

« Notre méthode permet de regarder 2 000 films en quelques jours. »

Par exemple, les chercheurs ont évalué les conventions de beauté dans les films en utilisant un test dit de cloze.

Il s’agit essentiellement d’un exercice à remplir: «Une belle femme devrait avoir la peau BLANCHE.»

Un modèle de langage prédirait normalement la réponse «douce», ont noté les chercheurs.

Mais lorsque le modèle a été formé avec les sous-titres de Bollywood, la prédiction cohérente est devenue «juste».

La même chose s’est produite lorsque les sous-titres hollywoodiens ont été utilisés, même si le biais était moins prononcé, selon l’étude.

Pour évaluer la prévalence des caractères masculins, les chercheurs ont utilisé une métrique appelée Ratio des pronoms masculins (MPR), qui compare l’occurrence des pronoms masculins tels que «il» et «lui» avec les occurrences totales des pronoms masculins et féminins.

De 1950 à aujourd’hui, le MPR pour les films de Bollywood et d’Hollywood variait d’environ 60 à 65 MPR.

En examinant les mots associés à la dot au fil des ans, les chercheurs ont trouvé des mots tels que «prêt», «dette» et «bijoux» dans les films de Bollywood des années 50, qui suggéraient la conformité.

Dans les années 1970, d’autres mots, tels que «consentement» et «responsabilité», ont commencé à apparaître. Enfin, dans les années 2000, les mots les plus étroitement associés à la dot – y compris «trouble», «divorce» et «refusé» – indiquent le non-respect ou ses conséquences.

«Nous savions toutes ces choses en quelque sorte», a déclaré KhudaBukhsh, un scientifique du projet LTI, «mais maintenant nous avons des chiffres pour les quantifier. Et nous pouvons également constater les progrès réalisés au cours des 70 dernières années, car ces biais ont été réduits. »

Les résultats ont été présentés lors de la conférence virtuelle de l’Association for the Advancement of Artificial Intelligence au début du mois.