STÉPHANE HERZOG Recorremos las avenidas peatonales del campus de la Escuela Politécnica Federal de Lausana (EPFL) hasta llegar al lugar donde nos espera Antoine Bosselut, especialista en inteligencia artificial y en cuestiones multilingües aplicadas a los “modelos extensos de lenguaje” (LLM, por sus siglas en inglés). Al igual que ChatGPT, estos sistemas de inteligencia artificial alimentados con miles de millones de datos son capaces de contestar a una infinidad de preguntas. Antoine Bosselut, de 34 años, nacido en Francia y formado en Estados Unidos, es experto en el desarrollo de máquinas capaces de aprender y dominar idiomas tan diversos como el tibetano o el romanche. Bosselut es uno de los padres de la nueva IA suiza: Apertus. A principios de septiembre, las dos escuelas politécnicas suizas y el Centro Suizo de Computación Científica (CSCS) anunciaron el lanzamiento del primer LLM multilingüe de código abierto desarrollado en Suiza. “Apertus representa un hito en materia de transparencia y diversidad en el ámbito de la inteligencia artificial generativa”, declararon sus creadores. ¿En qué se diferencia este nuevo LLM suizo de Llama 4 (desarrollado por Meta), de Grok (producido por Elon Musk) o, incluso, de ChatGPT, un sistema completo de IA? La respuesta es que los elementos que componen este modelo fundacional de IA suizo —sus algoritmos y sus parámetros de cálculo— son de libre acceso. Además, Apertus incluye un manual de instrucciones, mientras que ChatGPT se basa en un modelo de negocio que carece de transparencia. Otra diferencia es que Apertus no es un sistema de uso universal. “Los modelos comerciales no son lo suficientemente especializados para determinados usos. Cuanto más especializada es una IA, más potente es”, explica Antoine Bosselut. Por ejemplo, los hospitales podrían usar Apertus (sus algoritmos y su sistema de cálculo) a fin de entrenar el sistema para que analice miles de radiografías. La IA detecta diferencias en los datos que son difíciles de observar a simple vista. En busca de datos fiables El superordenador del CSCS entrenó Apertus con miles de millones de datos tomados de Internet. Estos datos conforman el léxico de base del LLM. Para este modelo solo se utilizaron datos cuyos propietarios no han prohibido explícitamente el uso de “rastreadores”, es decir, de robots que rastrean la red, precisa la EPFL en un comunicado. “Si, por ejemplo, el New York Times prohíbe a determinados rastreadores el acceso a sus artículos, excluimos esta fuente de nuestros datos”, señala el profesor. Para entrenar a Apertus, se utilizaron 15 mil millones de palabras procedentes de 1 800 idiomas (Internet contiene aproximadamente 50 mil millones de palabras). Los desarrolladores de este LLM garantizan a sus futuros Apertus, la nueva IA suiza, habla romanche Las dos escuelas politécnicas suizas y su socio, el Centro Suizo de Computación Científica, lanzaron en septiembre Apertus. Este modelo de lenguaje se entrenó con palabras de 1 800 lenguas, entre otras el alemán suizo y el romanche. Aunque Apertus es criticado por sus errores, los expertos opinan que hay que darle tiempo. usuarios (por ejemplo, a los empresarios) la fiabilidad ética y jurídica de sus datos, a diferencia de los proveedores comerciales de la IA, que se niegan a publicar sus datos de entrenamiento. Apertus “entiende” el tibetano, el yoruba y el romanche Por lo general, los grandes modelos de lenguaje se centran en las lenguas históricas presentes en la red: inglés, francés, chino, japonés, etc., cuya estructura descifran gracias a sus calculadoras y algoritmos. El LLM suizo, por el contrario, ha recopilado datos de idiomas con poca presencia en Internet, como el tibetano, el yoruba, el alemán suizo y el romanche. Dado que estas lenguas apenas se “hablan” en Internet, los contenidos tuvieron que crearse a partir de lenguas emparentadas. La idea subyacente es que, a pesar de la escasez de datos, el modelo puede aprender romanche porque también se ha entrenado en italiano, ya que ambos idiomas presentan similitudes, explica Bosselut. ¿Qué aplicaciones tienen en mente sus creadores? Una escuela en Nigeria, por ejemplo, utilizó Apertus para desarrollar cursos en un idioma que suele tener una representación limitada en otros modelos, lo cual corresponde al objetivo de la EPFL: “democratizar la IA”. La administración municipal de Zúrich utiliza Apertus Con vistas a su ulterior desarrollo, el LLM suizo fue sometido a cracks informáticos durante un hackatón, una especie de concurso cuyo objetivo es poner los sistemas a prueba. Algunos estudiantes utilizaron la herramienta para crear servicios: por ejemplo, proAntoine Bosselut, de la EFPL, destaca la transparencia del modelo suizo de IA Apertus, y afirma que la IA debe “democratizarse”. Foto cedida a la revista Panorama Suizo / Diciembre de 2025 / Nº5 12 Conocimiento
RkJQdWJsaXNoZXIy MjYwNzMx