Pastilla, darija, traditions : pourquoi l’IA ne comprend rien à la culture marocaine
Des chercheurs émiratis ont révélé que les modèles d’intelligence artificielle peinent à comprendre les nuances culturelles arabes. Leurs erreurs d’interprétation, notamment sur des éléments du patrimoine marocain, montrent un manque de diversité dans leur conception.
Une équipe de l’université d’intelligence artificielle Mohamed bin Zayed (MBZUAI) d’Abou Dhabi a testé plusieurs modèles gratuits, dont cinq optimisés pour la langue arabe. Les résultats montrent une réelle incapacité à saisir les spécificités régionales. Karima Kadaoui, doctorante au sein de l’établissement, cite l’exemple d’une image montrant une femme avec un couvre-chef traditionnel du nord du Maroc. Les systèmes apportent des réponses vagues ou affirment, avec excès de confiance, qu’il s’agit d’un sombrero mexicain.
Sur Bladi.net : Darija marocaine : l’IA chinoise « Habibi » humilie le géant américain ElevenLabs
Cette confusion s’étend également à la gastronomie et à la linguistique. Face à un dessert omanais, l’une des intelligences artificielles l’a identifié à tort comme étant une pastilla, la célèbre recette marocaine. Sur le plan de la langue, les chercheurs ont constaté d’importants mélanges dialectaux. Un outil peut ainsi débuter sa phrase en arabe marocain, y insérer des mots égyptiens, avant de basculer vers l’arabe littéral classique pour terminer sa réponse.
Comment expliquer ces défaillances ? Comme le rapporte le quotidien The National, les systèmes analysent les images par le prisme des probabilités statistiques plutôt que par l’observation humaine. Par exemple, un chameau est fréquemment confondu avec une autruche ou un lama à cause de sa couleur ou de ses appuis au sol. Le problème vient surtout de l’annotation initiale des données, une étape cruciale souvent réalisée par des personnes extérieures au monde arabe, dépourvues des repères culturels nécessaires.
Sur Bladi.net : La pastilla marocaine fait sa pub sur Arte
Ces travaux, menés avec l’entreprise Toloka AI, ont fait l’objet d’une publication présentée en mars lors d’une conférence scientifique au Maroc. À travers cette étude, les chercheurs espèrent pousser les développeurs à créer des outils plus inclusifs. « Il faut se battre pour l’inclusion, la réclamer et continuer à faire un travail qui expose les lacunes et les biais », insiste Karima Kadaoui, appelant à intégrer des données beaucoup plus diversifiées.