Hadretna : l’intelligence artificielle au service du dialecte algérien

Spread the love

La startup Fentech, opérant sous le nom Tamatech en Algérie, est partenaire scientifique avec le chercheur Professeur Merouane Debbah pour lancer Hadretna, un algorithme de traduction en ligne des différents
dialectes parlés en Algérie. Hadretna, qui signifie “notre parler” en Daridja, ambitionne ainsi de contribuer à la préservation de la diversité linguistique et culturelle dans le pays, tout en favorisant le développement de services accessibles aux 45 millions d’Algériens.

Hadretna : algorithme en 2 giga de token de données arabe, latine et tifinagh

Fruit de 6 mois de travail de nos équipes conjointes, Hadretna est à ce stade alimenté par 2 giga
token de données collectées en ligne dans 3 alphabets : arabe, latin et tifinagh. L’algorithme de traduction en ligne présenté aujourd’hui est la première étape indispensable vers la mise en œuvre d’un modèle d’intelligence artificielle générative (LLM : Large Language Model, en anglais) algérien utilisant les dialectes répandus en Algérie.

« Avec Hadretna, notre vision est de créer un pont linguistique entre les différents dialectes parlés en Algérie, permettant ainsi à tous ses habitants d’accéder à n’importe quelle information dans leur dialecte maternel. Nous souhaitons contribuer à l’inclusion numérique de tous les Algériens”, déclare le Professeur Merouane Debbah, directeur scientifique de Hadretna, lors de la cérémonie d’annonce, qui s’est tenue mardi 25 juin, à l’hotel Marriott de Bab Ezzouar.

Pour être performant, un LLM nécessite d’être entraîné sur une importante quantité de ressources textuelles. L’anglais représentant 45% du contenu aujourd’hui disponible sur Internet, les LLM les plus connus (Chat GPT d’Open AI, Lama de Meta, Gemini de Google) ont donc été conçus en grande partie dans cette langue. Construire un LLM sur des dialectes disposant d’une documentation écrite limitée, représente un défi technique majeur. Afin de réaliser cet objectif, les équipes de Hadretna travaillent à la construction du plus grand corpus de textes dans les différents dialectes en circulation en Algérie.

hadretna.ai : site Web pour collecter traductions et annotations

« Notre ambition est de construire le premier LLM en dialectes d’Algérie », ajoute Moussab Djerrab, CSO de Fentech. « Pour atteindre cet objectif, nous avons lancé le site Internet www.hadretna.ai. Toutes les personnes qui le souhaitent peuvent ainsi participer au projet en alimentant Hadretna avec leurs traductions et leurs annotations. »

Une fois constituée, cette nouvelle base de données permettra d’entraîner la version 2 de Hadretna.
Les modèles d’IA élaborés sur ces données seront mis en open-source sur une plateforme à venir.

A propos de Fentech :

Fondée par 3 frères en 2018, Fentech est une startup qui développe une plateforme d’intelligence artificielle permettant aux entreprises tous secteurs confondus d’optimiser leurs décisions en temps réel (optimiser la consommation d’énergie, prédire la consommation d’un
produit, fixer les prix, gérer les stocks). Elle a ses propres  bureaux à Alger et à Paris.


Spread the love

Publié

dans

,

par

Étiquettes :