Traverser les îles : UK-LLM déploie l’IA pour les langues britanniques avec NVIDIA Nemotron

Traverser les îles : UK-LLM déploie l'IA pour les langues britanniques avec NVIDIA Nemotron

Le Royaume-Uni se lance dans une initiative ambitieuse pour préserver et promouvoir ses langues celtiques. En partenariat avec NVIDIA et l’université de Bangor au Pays de Galles, le projet UK-LLM développe un modèle d’intelligence artificielle (IA) capable de raisonner en gallois, une langue parlée par environ 850 000 personnes. Cette avancée technologique, basée sur la plateforme NVIDIA Nemotron, vise à rendre les services publics, comme la santé et l’éducation, plus accessibles et pertinents pour les locuteurs gallois.

Ce projet s’inscrit dans une stratégie plus large de développement de l’IA souveraine, une approche qui privilégie le contrôle et l’autonomie sur les technologies d’IA. Le gouvernement britannique espère ainsi stimuler l’innovation et protéger son patrimoine culturel. L’objectif est de créer un écosystème d’IA qui profite à tous les citoyens, quelle que soit leur langue maternelle. L’initiative s’aligne également sur l’objectif du gouvernement gallois, Cymraeg 2050, qui vise à atteindre un million de locuteurs gallois d’ici 2050.

L’IA au service des langues minoritaires

Image article

Le projet UK-LLM, lancé en 2023 sous le nom de BritLLM, s’appuie sur les modèles NVIDIA Nemotron, une famille de modèles open source. Ces modèles permettent aux chercheurs et aux développeurs de créer des applications d’IA adaptées à des besoins spécifiques. L’équipe a utilisé les modèles Nemotron pour entraîner une IA capable de comprendre et de générer du texte en gallois. Cette approche est particulièrement intéressante pour les langues minoritaires, car elle permet de surmonter les obstacles liés au manque de données disponibles pour l’entraînement des modèles d’IA. Selon les données de 2024, le gallois est parlé par environ about 850,000 people au Pays de Galles.

L’utilisation de l’IA pour le gallois pourrait avoir des conséquences importantes. Cela inclut l’amélioration de l’accès aux services publics, la facilitation de l’apprentissage de la langue et la préservation du patrimoine culturel. De plus, le projet UK-LLM prévoit d’étendre cette approche à d’autres langues celtiques du Royaume-Uni, telles que le cornique, l’irlandais, le scots et le gaélique écossais. L’objectif est de créer des modèles d’IA pour toutes ces langues, contribuant ainsi à leur survie et à leur développement.

NVIDIA Nemotron : une base open source pour l’IA multilingue

Image article

La clé de voûte de ce projet est l’utilisation de la plateforme NVIDIA Nemotron, une technologie d’IA open source. Ce choix permet aux développeurs d’accéder à des outils et des ressources pour créer des modèles d’IA personnalisés. Les modèles Nemotron sont optimisés pour le calcul à faible coût et peuvent être exécutés sur diverses plateformes, du cloud aux ordinateurs portables. L’équipe du projet a notamment utilisé les microservices NVIDIA NIM pour traduire des données de l’anglais vers le gallois, créant ainsi un ensemble de données d’entraînement suffisamment large pour le modèle d’IA. Découvrez plus de détails sur NVIDIA Nemotron.

L’université de Bangor apporte son expertise linguistique et culturelle pour assurer la qualité des données d’entraînement et évaluer les performances du modèle. Les chercheurs vérifient l’exactitude des traductions automatiques et analysent la capacité du modèle à gérer les nuances de la langue galloise, notamment les mutations consonantiques initiales. Ce travail est essentiel pour garantir que le modèle d’IA soit précis et adapté à la langue galloise.

Perspectives d’avenir et implications

Le projet UK-LLM représente une avancée significative dans le domaine de l’IA appliquée aux langues minoritaires. En rendant l’IA accessible et en favorisant son développement, le projet contribue à la préservation des langues celtiques et à la promotion de la diversité linguistique. Ce projet démontre comment l’IA peut être utilisée pour soutenir les objectifs de développement durable, tels que la préservation du patrimoine culturel et l’amélioration de l’accès aux services publics. Le gouvernement gallois vise à atteindre un million de locuteurs gallois d’ici 2050, ce qui correspond à l’initiative Cymraeg 2050.

Le modèle d’IA développé dans le cadre du projet UK-LLM sera mis à disposition des entreprises et du secteur public. Cette ouverture permettra de soutenir la recherche, la formation de modèles et le développement d’applications. L’initiative s’inscrit dans une tendance plus large vers l’IA souveraine, où les pays cherchent à maîtriser les technologies d’IA pour protéger leurs intérêts nationaux et culturels. Cette approche pourrait inspirer d’autres projets similaires dans le monde, contribuant à la préservation de langues en danger et à la création d’un avenir plus inclusif.

En conclusion, le projet UK-LLM illustre le potentiel de l’IA pour préserver les langues minoritaires et rendre les services publics plus accessibles. Grâce à la collaboration entre les institutions universitaires, les entreprises technologiques et les gouvernements, ce projet promet de transformer la façon dont nous interagissons avec les langues et de contribuer à un avenir numérique plus inclusif. Les modèles Nemotron de NVIDIA, comme le prouve ce projet, offrent une base solide pour le développement de modèles d’IA multilingues. Pour en savoir plus sur le sujet, vous pouvez consulter NVIDIA Nemotron.