- EuroLLM y OpenEuroLLM buscan crear modelos de IA multilingües, abiertos y éticos para toda Europa.
- El consorcio reúne universidades, empresas y centros de supercomputación de primer nivel europeo para garantizar diversidad lingüística y soberanía digital.
- El enfoque es la transparencia, cumplimiento normativo y democratización del acceso a tecnologías punteras de IA en los 24 idiomas oficiales de la UE.
La inteligencia artificial está revolucionando Europa. El continente, tradicionalmente a la zaga de gigantes como Estados Unidos y China en la carrera tecnológica, ha decidido tomar el timón con proyectos como EuroLLM y OpenEuroLLM. Estas iniciativas quieren garantizar que la IA del futuro no hable solo el idioma de Silicon Valley ni se rija solamente por intereses lejanos, sino que sea multilingüe, ética, transparente y plenamente ‘made in Europe’.
Tras años viendo cómo los modelos de lenguaje de gran tamaño (LLMs) venían sobre todo de fuera y priorizaban idiomas como el inglés o el chino, Europa reacciona apostando por una infraestructura de IA propia, soberana y adaptada a su diversidad cultural y normativa. En este artículo te contamos todo, absolutamente todo, sobre EuroLLM y OpenEuroLLM: sus orígenes, colaboradores, retos, filosofía, modelos, impacto y futuro. Si quieres saber cómo la inteligencia artificial escrita (y también pensada) en Europa va a cambiar las reglas del juego, ¡sigue leyendo!
¿Por qué necesitaba Europa su propio modelo de IA?
La enorme dependencia tecnológica de Europa respecto a los LLMs de Estados Unidos y China ha sido una fuente de preocupación para gobiernos, expertos y empresas. No solo por cuestiones estratégicas y de competitividad, sino porque los modelos más populares – véase ChatGPT, Gemini, Bard o similares – están formados y afinados sobre grandes corpus de datos mayoritariamente en inglés, ajustados a vivencias, cultura y sesgos que nada tienen que ver con la compleja realidad europea.
Esta dependencia trae consigo múltiples riesgos:
- Privacidad y protección de datos: Los datos personales y confidenciales de los europeos pueden acabar almacenados y procesados en jurisdicciones ajenas al GDPR. El cumplimiento estricto de la legislación de privacidad es una de las principales preocupaciones.
- Sesgo y falta de relevancia cultural: Los LLM importados pueden invisibilizar o distorsionar la diversidad lingüística, los matices y valores propios de los países europeos.
- Desventaja competitiva y pérdida de soberanía: Si Europa solo usa tecnología de fuera, su capacidad de innovar y crear soluciones adaptadas decae. Las empresas locales se ven obligadas a pagar licencias a proveedores extranjeros y pierden control sobre sus datos y desarrollo.
- Impacto económico y de innovación: El pago de derechos de uso y la fragmentación normativa dificultan la creación de productos o servicios competitivos, especialmente para pymes y startups.
A esta situación se suma el hecho de que el 90% de los contenidos de Internet podría estar generado por IA en apenas un año, según estimaciones. No es de extrañar que la Comisión Europea haya apostado fuerte para revertir la tendencia.
El nacimiento de EuroLLM y OpenEuroLLM: dos apuestas conjuntas
En el último bienio han cobrado vida dos de los proyectos de IA más ambiciosos y relevantes del Viejo Continente: EuroLLM y OpenEuroLLM. Aunque a menudo se confunden o se solapan en discusiones públicas, hay matices clave que conviene comprender.
- EuroLLM: iniciado en septiembre de 2023, se centra en crear modelos abiertos y multilingües entrenados sobre los 24 idiomas oficiales de la UE (y otros adicionales), con especial mimo a la publicación completa y transparente de modelos y pesos. Ha lanzado versiones iniciales como EuroLLM-1.7B y EuroLLM-1.7B-Instruct.
- OpenEuroLLM: es el gran paraguas presentado oficialmente como proyecto europeo a principios de 2025, con el objetivo de desplegar una familia de modelos LLM plenamente adaptados a la regulación y valores europeos, con participación de grandes entidades, supercomputación puntera y una estrategia firme de apertura y cumplimiento normativo.
Ambas iniciativas cuentan con respaldo institucional y empresarial, forman parte de la estrategia europea de digitalización y buscan evitar la fractura competitiva y de soberanía en tecnologías clave.
Un consorcio europeo de primer nivel
Estos proyectos materializan la idea de que, solo uniendo fuerzas, Europa puede competir con los gigantes tecnológicos. El consorcio de OpenEuroLLM está formado por 20 instituciones líderes del continente, con una dirección dual que refleja el espíritu universitario y empresarial europeo:
- Jan Hajič (Universidad Charles de Praga): reconocido lingüista computacional y coordinador principal.
- Peter Sarlin (AMD Silo AI, Finlandia): co-líder técnico, experto en aplicaciones industriales de IA y CEO de uno de los laboratorios de IA más importantes del norte de Europa, recientemente adquirido por AMD.
Entre los socios académicos y técnicos destacados encontramos:
- Universidad de Helsinki (Finlandia)
- Ellis Institute Tübingen (Alemania)
- Instituto Fraunhofer IAIS (Alemania)
- Universidades de Oslo, Turku y Tübingen
- Universidad de Eindhoven, Sorbonne University, Instituto Superior Técnico (Portugal), University of Edinburgh, University of Amsterdam y Université Paris-Saclay
Por parte empresarial y tecnológica, hay nombres de peso:
- Silo AI (Finlandia)
- Aleph Alpha Research (Alemania)
- Ellamind (Alemania)
- LightOn (Francia)
- Prompsit Language Engineering (España)
- Unbabel
- Aveni, Naver Labs
- Empresas especializadas en traducción automática, IA y análisis multilingüe
Además, la infraestructura de supercomputación es uno de los puntos fuertes:
- Barcelona Supercomputing Center (BSC): líder español en cálculo de IA.
- Cineca (Italia), CSC-TI Center for Science (Finlandia) y Surf (Países Bajos), todos con supercomputadoras EuroHPC.
La variedad y calidad de los participantes garantizan que el desarrollo científico y las aplicaciones prácticas caminarán de la mano y que, por fin, los datos y necesidades de toda Europa serán tenidos en cuenta.
España: motor en la diversidad lingüística y la IA europea
España ocupa una posición clave en estos proyectos a través de la empresa Prompsit Language Engineering, spin-off relevante para la gestión de corpus y procesamiento multilingüe de datos. Ubicada en el Parque Científico de la Universidad Miguel Hernández (Elche), trabaja en el desarrollo y curación de datos para entrenar modelos con la máxima diversidad idiomática y calidad.
Prompsit co-lidera los paquetes de trabajo de datos y diseminación y colabora en la evaluación de modelos multilingües y conjuntos de datos abiertos a través de iniciativas como ParaCrawl, MaCoCu o HPLT.
España también aporta músculo en supercomputación con la creación de una de las siete AI Factories europeas, ubicada en Barcelona. Liderada por el BSC, esta infraestructura democratiza el acceso a supercomputación para innovación y desarrollo de IA, tanto para grandes empresas como para startups, permitiendo que la I+D española esté entre la élite europea.
La apuesta española por la IA es estratégica y cuenta con una inversión superior a 174 millones de euros, implicando a instituciones estatales, autonómicas y europeas, y situando al país como referente continental.
EuroLLM: modelos multilingües abiertos de última generación
Uno de los hitos más importantes es el desarrollo y publicación de modelos LLM realmente abiertos, multilingües y competitivos. Hasta la fecha, la mayoría de modelos abiertos estaban claramente enfocados en inglés y solo una pequeña parte en otros idiomas europeos. EuroLLM cambia radicalmente el panorama:
- EuroLLM-1.7B: modelo con 1.7 mil millones de parámetros, entrenado sobre 4 billones de tokens repartidos entre los 24 idiomas oficiales de la UE más otros importantes como ruso, árabe, chino y lenguas de amplia presencia en Europa oriental y países aspirantes a la UE.
- EuroLLM-1.7B-Instruct: versión afinada en tareas de instrucción general y traducción automática, usando el dataset EuroBlocks, específicamente diseñado para entrenamiento multilingüe variado y relevante.
- EuroLLM-9B: modelo de mayor tamaño, desarrollado con apoyo de Horizon Europe y el European Research Council, y entrenado sobre la supercomputadora MareNostrum 5, capaz de competir y superar a modelos abiertos recientes como Gemma-2B (Google) en tareas multilingües.
Todos estos modelos se ofrecen bajo licencia código abierto Apache 2.0 en plataformas como Hugging Face, acompañados de sus pesos y documentación detallada. Esta apertura real permite que universidades, empresas de cualquier tamaño, administraciones públicas y hasta ciudadanos a título individual puedan utilizarlos, adaptarlos y construir nuevas soluciones que hablen todos los idiomas de Europa.
¿Qué significa realmente «open source» en la IA europea?
Uno de los debates más encendidos en el sector es el verdadero alcance del término ‘código abierto’. La Open Source Initiative (OSI) admite que no necesariamente hay que publicar los datos de entrenamiento (por razones legales, privacidad o copyright), pero los proyectos europeos quieren ir más allá:
- Pesos abiertos: los modelos, junto con el fichero de pesos, están completamente disponibles a la comunidad.
- Dataset transparentes: siempre que es posible legalmente, se comparten o se documentan exhaustivamente las fuentes y el proceso de curación.
- Métodos y procesos abiertos: el workflow de desarrollo, el tokenizador, los scripts y el pipeline son auditables y reproducibles.
- Métricas y benchmarks públicos: el rendimiento del modelo se reporta abiertamente en tareas de traducción, comprensión y generación de texto multilingüe.
La transparencia se aplica también al proceso de mejora y evaluación, permitiendo una competencia sana y una innovación verdaderamente abierta.
Normativas, ética y regulación: el corazón de la IA europea
Uno de los sellos de identidad de EuroLLM y OpenEuroLLM es el cumplimiento estricto de la legislación europea, especialmente del GDPR y de la inminente Ley de IA de la UE. Esto asegura una base legal sólida y protege a los usuarios y ciudadanos frente a abusos o usos indebidos de IA.
- Protección de datos: el desarrollo de los modelos está diseñado desde el inicio para respetar la privacidad y las leyes de protección vigentes.
- Equidad algorítmica: se aplican mecanismos de curación de datos e identificación de sesgos para garantizar resultados justos y equilibrados, sin discriminar por idioma, origen o contexto cultural.
- Transparencia y explicabilidad: se investiga activamente cómo abrir la ‘caja negra’ de los LLM y dotar de explicaciones interpretables a los resultados del modelo, especialmente en aplicaciones sensibles.
- Robustez y fiabilidad: se priorizan la validación, los test y la resistencia ante entradas inesperadas o escenarios de uso límite.
Este enfoque es esencial para crear confianza social y para que los servicios basados en IA sean aceptados ampliamente entre empresas, administraciones y ciudadanía.
Democratización del acceso y ecosistema abierto
Un objetivo central es democratizar el acceso a la IA de alta calidad: los modelos serán reutilizables por cualquier empresa, incluidas pymes y startups, por la administración y organizaciones de la sociedad civil, y por unidades de investigación y educación. Hasta los usuarios particulares podrán experimentar e innovar.
Esto reduce la brecha digital y de capacidades y permite que la IA europea evolucione adaptada a las necesidades propias. Asimismo, se fomenta la colaboración y la generación de una comunidad europea de práctica e innovación abierta en IA.
Aplicaciones concretas: de los chatbots al sector público
La versatilidad de modelos como EuroLLM y OpenEuroLLM favorece su uso en una enorme variedad de escenarios:
- Chatbots y asistentes virtuales orientados al ciudadano: capaces de atender consultas en cualquier idioma europeo de forma eficiente.
- Traducción automática y comunicación multilingüe: para hacer accesibles los servicios públicos o empresariales a todos los habitantes de la UE, sin importar su lengua materna.
- Automatización administrativa: agilizando tareas repetitivas y mejorando la eficiencia de la gestión pública y privada.
- Educación y cultura: adaptando recursos y materiales a todos los idiomas y promoviendo la diversidad cultural europea.
- Personalización de servicios públicos: ajustando la atención y los recursos a las necesidades concretas de cada usuario o colectivo.
Estos casos de uso permiten a la administración europea ahorrar costes, aumentar la calidad de los servicios y hacerlos más inclusivos.
Retos y desafíos por delante
A pesar del entusiasmo, hay obstáculos nada menores:
- Presupuesto limitado: aunque el montante de OpenEuroLLM supera los 37 millones de euros (y el de EuroHPC ronda los 7.000 millones si se cuenta la infraestructura de supercomputación), las cifras palidecen frente a los cientos o miles de millones invertidos en EE. UU. o China. que es eurollm
- Complejidad de la gestión consorcial: coordinar 20 instituciones de distintos países y campos científicos no es sencillo y puede ralentizar la toma de decisiones estratégicas.
- Disponibilidad de datos abiertos multilingües: las restricciones legales y de copyright dificultan el acceso a grandes corpus de calidad para todos los idiomas, obligando a buscar vías creativas para la síntesis y generación de datos o acuerdos con fuentes públicas.
- Agilidad frente a la competencia internacional: competidores como Mistral AI o LightOn, basados en equipos pequeños y muy enfocados, han logrado en poco tiempo modelos open source reconocidos. La estructura europea, más densa y supervisada, debe buscar eficiencia sin perder valores ni profundidad.
Aun así, la combinación de músculo científico y empresarial y el aprovechamiento de recursos existentes, como el legado del proyecto HPLT, coloca a la iniciativa europea en posición de avanzar rápidamente.
Colaboración y “coopetencia” en el ecosistema europeo
El panorama internacional muestra que, si bien hay desencuentros (como el debate entre OpenEuroLLM y el euroLLM ‘original’ sobre la propiedad del nombre), la tendencia general favorece la colaboración y las alianzas público/privadas y entre distintos clústeres de IA.
Cabe destacar que iniciativas emblemáticas como Mistral AI en Francia, aunque no participan directamente en OpenEuroLLM, forman parte de la constelación europea de IA open source y comparten retos y visiones similares. Europa busca evitar la duplicidad de esfuerzos y fomentar el intercambio de mejores prácticas, evitando el “reinventar la rueda” cada vez que hay nueva financiación europea.
Impacto social, económico y cultural
Quizá lo más relevante es que EuroLLM y OpenEuroLLM pretenden no solo avanzar en tecnología dura, sino que buscan maximizar el impacto social, educativo y cultural de la inteligencia artificial en Europa.
- Fomento de sistemas inclusivos: permitiendo que todos los ciudadanos europeos, independientemente de su lengua, accedan a IA y servicios digitales avanzados.
- Impulso a la competitividad global: las empresas europeas contarán con modelos adaptados a sus contextos, evitando depender de soluciones externas y favoreciendo la creación de nuevos productos y modelos de negocio.
- Promoción de la diversidad e innovación: el desarrollo de LLM multilingües abiertos potencia la personalización, reduce el sesgo y amplía el mercado de soluciones basadas en IA en sectores tan diversos como turismo, cultura, comercio o educación.
- Confianza y soberanía digital: al cumplir rigurosamente la normativa, se construye confianza y se garantiza el control europeo sobre su infraestructura crítica en IA.
El resultado es un ecosistema de IA diverso, participado y resiliente a cambios tecnológicos globales.

Expertos en software, desarrollo y aplicación en industria y hogar. Nos encanta sacar todo el potencial de cualquier software, programa, app, herramienta y sistema operativo del mercado.
