Baptisée d’après le nom d’une montagne située aux Émirats arabes unis, Jais-Chat, agent conversationnel boosté à l’IA, s’impose comme la référence du genre en langue arabe.
Un concurrent direct à Chat GPT ?
Ce chatbot est l’œuvre de la société américaine Cerebras Systems, spécialisée en intelligence artificielle, en collaboration avec Inception, une filiale du groupe d’investissement G42 appartenant à Abu Dhabi. Jais-chat a notamment surpassé le modèle linguistique Llama 2 développé par Meta, populaire chez les développeurs, car open source contrairement au GPT-4 d’OpenAI dont les API sont payantes. Cerebras et Inception ont fait le choix de limiter Jais-Chat à deux langues : l’anglais et l’arabe. L’ensemble de données sur lequel il s’est entraîné est composé à 29 % d’arabe, 59 % d’anglais et 12 % de code. Avec 13 milliards de paramètres, le modèle est loin des 175 milliards de GPT-3, mais parvient tout de même à tirer son épingle du jeu grâce à une base de données soigneusement sélectionnée et à la limitation à deux langues.
« Ce qui était intéressant, c’est que l’arabe améliorait aussi l’anglais », explique Andrew Feldman, co-fondateur et PDG de Cerebras, lors d’un entretien accordé à ZDNET. « Nous avons fini par obtenir un modèle aussi performant que Llama en anglais, bien que nous l’ayons entraîné sur environ un dixième des données », fait-il savoir. « Nous donnons à 400 millions d’arabophones une voix dans l’IA. C’est cela de démocratiser l’IA. C’est la langue principale de 25 pays », déclare Andrew Feldman. L’anglais est largement privilégié par les IA génératives. « Les plus grands ensembles de données reposent sur le scraping de l’Internet, et celui-ci est principalement en anglais », regrette Andrew Feldman. Une étude de Meta publiée en 2022 indiquait que 63,7 % des sites web sont en langue anglaise, alors que seuls 25,9 % des internautes la parlent. Avec cette IA, la langue arabe est revalorisée à sa juste valeur.
Ajib.fr, Le Media Musulman qui partage les bonnes nouvelles!
Rejoignez-nous sur notre chaîne Telegram
Suivez-nous sur YouTube