Revue Suisse 5/2025

STÉPHANE HERZOG Nous cherchons notre chemin à travers les avenues piétonnes du campus de l’Ecole polytechnique de Lausanne (EPFL). Nous avons rendez-vous avec Antoine Bosselut, spécialiste de l’intelligence artificielle et des questions multilingues dans les Large Language Models (LLM): «les grands modèles de langage». Ces systèmes d’intelligence artificielle nourris de milliards de données sont capables, à l’instar de ChatGPT, de répondre à une infinité de questions. Né en France, formé aux États-Unis, ce professeur de 34 ans en connaît un bout sur les moyens de créer des machines capables de maitriser des idiomes aussi différents que le tibétain ou le romanche. C’est l’un des pères de la nouvelle IA suisse: Apertus. Début septembre, les deux écoles polytechnique suisses et le Centre suisse de calcul scientifique (CSCS) ont annoncé la sortie du premier LLM multilingue en open source développé en Suisse. «Apertus représente une étape majeure pour la transparence et la diversité dans l’intelligence artificielle générative», avancent ses géniteurs. En quoi ce LLM serait-il différent de Llama 4 (développé par Meta), Grok (produit par Elon Musk) ou encore ChatGPT, qui est en fait un système d’IA complet? Les éléments qui constituent la machinerie suisse – ses algorithmes et ses paramètres de calcul – sont accessibles librement. Le mode d’emploi est fourni, alors que, par exemple, ChatGPT demeure un modèle commercial opaque. Autre différence, Apertus n’est pas un système généraliste. «Les modèles commerciaux ne sont pas assez spécialisés pour certains usages particuliers, or plus une IA est spécialisée, plus elle est forte», explique Antoine Bosselut. Des hôpitaux pourraient se servir de l’outil Apertus – de ses algorithmes, de son système de calcul – pour entraîner le système à effectuer des analyses sur des milliers de radiographies. L’IA est capable, en comparant des données, de détecter des différences peu visibles à l’œil. La quête de données sûres Le super ordinateur du CSCS a entraîné Apertus au moyen de milliards de données puisées sur Internet. Elles constituent le lexique de base des LLM. Pour ce modèle, seules ont été prises en compte des données dont les propriétaires n’interdisent pas explicitement l’utilisation de «crawlers», ces robots qui moissonnent le web, précise l’EPFL. «Si, par exemple, le New York Times interdit l’accès à ses articles à certains crawlers, nous excluons cette source de nos données», indique le professeur. L’entrainement d’Apertus s’est basé sur 15 milliards de mots captés sur 1800 langues (Internet recelant La Suisse propose au monde une IA qui parle même le romanche Les deux écoles polytechniques suisses et leur partenaire ont lancé en septembre le modèle de langage Apertus. Ce système a été entraîné sur des mots puisés dans 1800 langues, dont le suisse allemand et le romanche. Apertus est critiqué pour ses erreurs. Des spécialistes estiment qu’il faut lui laisser du temps. quelque 50’000 milliards de mots). Dans ce cas, les créateurs de ce LLM garantissent aux futurs utilisateurs – par exemple des entreprises – la fiabilité des données au sens éthique et juridique du terme, là où les acteurs commerciaux de l’IA refusent de publier leurs données d’entrainement. Apertus «comprend» également le tibétain et le romanche En général, les grands modèles se focalisent sur les langues historiques d’Internet – l’anglais, le français, le chinois, le japonais, etc. Avec leurs calculateurs et leurs algorithmes, ils décodent leurs structures. Or cette fois, le LLM suisse a cherché des données auprès d’idiomes peu présents sur Internet comme le tibétain, le yoruba, le suisse allemand et même le romanche! Mais ces langues étant peu «parlées» sur Internet, il a fallu créer des contenus à partir de langues voisines. L’idée est que le modèle pourra apprendre le romanche malgré la rareté des données, parce qu’il est également entraîné sur l’italien et qu’il existe des similitudes entre les deux langues, précise Antoine Bosselut. Pour quoi faire? Apertus a par exemple été adopté par une école au Nigeria, qui peut ainsi développer des cours en se basant sur une langue généralement peu présente dans d’autres modèles. Cela répond à la volonté de l’EPFL de «démocratiser l’IA». La Ville de Zurich utilise Apertus Pour mûrir, le LLM suisse a été soumis à des cracks durant des «hackaAntoine Bosselut, de l’EFPL, souligne la transparence du modèle d’IA suisse Apertus. L’idée est «de démocratiser» l’IA. Photo MAD Revue Suisse / Décembre 2025 / N°5 12 Connaissance

RkJQdWJsaXNoZXIy MjYwNzMx