Darija marocaine : l’IA chinoise « Habibi » humilie le géant américain ElevenLabs
Des chercheurs chinois ont lancé « Habibi », le premier modèle d’IA en open source capable de synthétiser plus de 20 dialectes arabes, dont la darija marocaine. Cette innovation de l’Université Jiao Tong de Shanghai surpasse les références commerciales actuelles.
Développé par le laboratoire X-LANCE, ce système de synthèse vocale utilise une capacité « zero-shot » pour cloner une voix à partir d’un simple extrait sonore. Selon les résultats de l’étude, Habibi surpasse déjà les solutions de l’américain ElevenLabs dans la génération du darija et d’autres dialectes régionaux majeurs.
Sur Bladi.net : Oui, l’arabe dépasse (largement) l’anglais et le chinois
Le projet s’attaque à la complexité de l’arabe parlé, souvent très éloigné de la langue officielle utilisée dans l’éducation. « Le goulot d’étranglement ultime se résume aux données », explique Chen Yushen, chercheur principal, soulignant la rareté des enregistrements de haute qualité pour les spécificités linguistiques locales.
Cette avancée cible le marché massif des réseaux sociaux et du commerce électronique au Moyen-Orient. Le modèle pourrait transformer la production de contenus localisés pour TikTok ou les podcasts, renforçant ainsi l’influence technologique et l’image de l’IA chinoise dans l’ensemble de la région MENA.
Sur Bladi.net : Love is Blind, Habibi : un candidat irakien insulte les Marocaines
Bien que pionnière, l’équipe considère ce travail comme une fondation à perfectionner par la recherche académique. « Nous espérons qu’en mettant le modèle en open source, nous pourrons recueillir des retours plus larges de la communauté », a déclaré Chen pour encourager la collaboration des locuteurs natifs.