Le Niger adopte la carte d'identité biométrique de l'AES    LA RENAISSANCE DE BRAHIM    CAN 2025 : Marrakech vue de l'Ouganda    Message de vœux de l'ambassadrice de Chine Yu Jinsong aux Marocains à l'occasion de l'année 2026    La Bourse de Casablanca débute en hausse    Électricité : la demande franchit un seuil et redessine l'architecture du marché    Une mesure douanière contre les fraudeurs mobilise les transitaires aux ports et aéroports du Maroc    La MINURSO réduit ses effectifs    Les Émirats refusent d'être impliqués dans les événements en cours au Yémen    Rejet du Somaliland, soutien au polisario : l'Union africaine face à ses incohérences    Le président coréen en visite d'État en Chine pour un sommet avec Xi Jinping    Soutien social direct : Nadia Fettah reconnaît les limites du système de ciblage    CAN 2025 : les 16 équipes qualifiées pour les huitièmes de finale désormais connues    CAN 2025 : les médias espagnols font l'éloge de Brahim Diaz    Atalanta rejoint la course des clubs intéressés par Yassir Zabiri    DGSN : 15 morts dans 1.941 accidents en une semaine en périmètre urbain    Réforme de la santé : Vers une généralisation progressive des GST en 2026    Pêche au poulpe: Lancement de la campagne hivernale    Manœuvres militaires : Simulation chinoise d'un blocus des ports de Taïwan    Ukraine : Trump tout près d'un accord, sans annoncer de percée    Maroc : L'indice des prix à la production augmente de 0,3% en un mois (HCP)    Les retenues d'eau à 1.770 millions m3 depuis septembre    SRM Fès-Meknès : Près de 10 milliards de dirhams d'investissements en 2026-2030    Parlement : Ouahbi botte en touche sur le projet de loi relatif à la profession d'avocat    CAN 2025 : Le Maroc affrontera la Tanzanie en huitième de finale à Rabat    CAN 2025 : «On ne s'attendait pas à un tel scénario face au Maroc» (sélectionneur de la Zambie)    CAN 2025 : Achraf Hakimi boucle sa 60e victoire avec la sélection du Maroc    Victoire des Lions de l'Atlas célébrée à Molenbeek après le triomphe contre la Zambie    Chambre des représentants : Examen en commission du projet de loi relative à la procédure civile    Fireworks and small fires in Molenbeek after Morocco beats Zambia    Le Maroc à la tête du CA de l'Institut de l'UNESCO pour l'apprentissage tout au long de la vie    Le streamer Ilyas El Malki condamné à dix mois de prison ferme    CAN 2025: Achraf Hakimi alcanza su 60a victoria con la selección de Marruecos    La prison locale d'Ain Sebaa 1 dément les allégations de torture contre Saida El Alami    Parlamento: Ouahbi elude el proyecto de ley sobre la profesión de abogado    Accidents de la route: 15 décès et 2.559 blessés en périmètre urbain durant la semaine dernière    Casablanca : Fin des travaux et mise en service du nœud autoroutier de Ain Harrouda    Malgré les stéréotypes, le darija gagne en popularité parmi les apprenants étrangers de l'arabe    Ouverture des candidatures pour la 12e édition du Prix national de la lecture    Rachat de Warner Bros. Discovery : Le conseil d'administration s'orienterait vers un rejet de la dernière offensive de Paramount    Fondation Chouaib Sdaiki, vigie culturelle sur la côte de Mazagan    Révision des listes électorales des Chambres professionnelles : Fin des inscriptions le 31 décembre    BCIJ : «CAN ou pas CAN, pas de relâche face au terrorisme !»    Pétrole : le calme trompeur des prix bas    Droits de l'Homme: La DIDH adhère au Portail national du droit d'accès à l'information    Vernissage de l'exposition nationale «60 ans de peinture au Maroc» le 6 janvier 2026    L'exposition «Mohammed Ben Allal : Récits du quotidien» célèbre la mémoire populaire de Marrakech    Essaouira et les Provinces du sud unissent leurs mémoires pour la nouvelle génération    







Merci d'avoir signalé!
Cette image sera automatiquement bloquée après qu'elle soit signalée par plusieurs personnes.



Moroccan and International researchers develop Atlas-Chat, the first language model in Darija
Publié dans Yabiladi le 02 - 10 - 2024

Atlas-Chat is the first large language model tailored for Darija, Moroccan Arabic, outperforming similar models in handling this dialect. The model was created using existing language resources and new datasets.
A team of researchers from Morocco and beyond has developed the first large language models specifically designed for Darija, Moroccan Arabic. Named «Atlas-Chat», this AI model is a nod to the Atlas Mountains, a significant symbol of Morocco.
Atlas-Chat is capable of understanding and speaking Darija. In a research paper published on ResearchGate in September, titled «Atlas-Chat: Adapting Large Language Models for Low-Resource Moroccan Arabic Dialect», the researchers explain that the model was developed by integrating existing Darija language resources, creating new datasets, and carefully translating English instructions.
Atlas-Chat-9B response example 2 (The model can understand English instructions but only responds in Darija)
The paper also highlights that their models, «Atlas-Chat-9B and Atlas-Chat-2B», outperform other cutting-edge Arabic-specialized language models, including LLaMa, Jais, and AceGPT in following instructions in Darija. The Atlas-Chat models can also perform standard Natural Language Processing (NLP) tasks, which include interpreting, manipulating, and comprehending human language.
Their findings also show that Atlas-Chat achieved a «13% performance boost over a larger 13B model on DarijaMMLU», a newly introduced evaluation suite for Darija that covers both discriminative and generative tasks.
Darija and low-resource languages
The study also observes that while large language models excel at understanding and using major languages, they often struggle with underrepresented languages, particularly Arabic dialects like Darija.
This is mostly because while Arabic boasts a rich cultural history and a complex linguistic structure, most efforts to develop Arabic-specialized models focus on bilingualism—balancing English and Modern Standard Arabic (MSA)—while often overlooking dialectal Arabic (DA).
Although DA is spoken by millions, there is a lack of data available for training large language models for it. To address this, the researchers created new datasets and evaluation tests specifically for DA.
Atlas-Chat-9B response example 1.
The research was conducted by researchers from Mohamed bin Zayed University of Artificial Intelligence (United Arab Emirates), Ecole des Mines de Rabat (Morocco), Université Mohammed VI Polytechnique (Morocco), KTH Royal Institute of Technology (Sweden), Atlas Institute for Artificial Intelligence (Morocco), and Ecole Polytechnique (France).
To inspire the development of similar models for other low-resource languages, the researchers have made all of their resources publicly available.


Cliquez ici pour lire l'article depuis sa source.