Cómo ejecutar Ollama y modelos de lenguaje en la Raspberry Pi 5: Guía completa

  • Ollama permite correr modelos de lenguaje avanzados localmente en Raspberry Pi 5, cuidando la privacidad y sin depender de la nube.
  • La selección del modelo adecuado (TinyLlama, Phi, Llama3, entre otros) es clave para equilibrar rendimiento y calidad, según los recursos disponibles en la Pi.
  • La instalación es sencilla y puede potenciarse con Docker y WebUI para un uso visual, además de ofrecer integración con Python y LangChain para automatizaciones avanzadas.

Instalar ollama en raspberry piMontar un servidor de inteligencia artificial en casa ya no es una idea futurista ni requiere una inversión desbordante. Hoy, gracias a proyectos como Ollama y a la potencia de la Raspberry Pi 5, es posible ejecutar modelos de lenguaje avanzados sin depender de la nube, con total privacidad y flexibilidad. Si te atrae la idea de experimentar con IA local, automatizar tareas o simplemente explorar las posibilidades de tu mini PC, aquí descubrirás cómo dar el salto y todo lo que necesitas saber para aprovechar al máximo la combinación de Ollama y Raspberry Pi 5.

En las siguientes líneas te sumergirás en una guía completa sobre cómo instalar, configurar y sacar partido a Ollama en una Raspberry Pi 5. Además, conocerás los distintos modelos de lenguaje que mejor se adaptan a este hardware compacto, consejos para exprimir el rendimiento, opciones de personalización y cómo conectarlo a otras herramientas o interfaces web. Si alguna vez has querido tener tu propio ChatGPT o servidor de IA sin compartir datos con terceros, sigue leyendo porque esto te va a interesar especialmente.

¿Qué es Ollama y por qué elegirlo para tu Raspberry Pi 5?

Ollama es una herramienta open source que simplifica la ejecución de modelos de lenguaje grandes (LLMs) directamente en tu dispositivo, sin depender de servicios externos ni de la nube. A diferencia de soluciones como ChatGPT, que trabajan a través de servidores remotos de OpenAI, Ollama procesa todos los datos localmente, garantizando privacidad y control total sobre la información.

La Raspberry Pi 5, sobre todo en su versión de 8 GB de RAM, es el complemento ideal para este tipo de proyectos. Su bajo consumo energético y precio reducido lo convierten en la opción predilecta tanto para entusiastas de la inteligencia artificial como para quienes buscan experimentar sin grandes desembolsos. Utilizar Ollama en Raspberry Pi 5 permite interactuar con modelos como TinyLlama, Phi3, Llama3 y muchos más, abriendo la puerta a tareas de procesamiento de lenguaje natural, análisis de textos, respuesta automática y hasta interpretación básica de imágenes.

Ventajas clave de ejecutar Ollama localmente en Raspberry Pi 5

  • Privacidad y seguridad: Todo el procesamiento ocurre en tu dispositivo, sin enviar datos a servidores externos. Si valoras la confidencialidad o manejas información sensible, esta es la única forma de mantener el control absoluto.
  • Autonomía y sin dependencia de Internet: Una vez configurados los modelos, puedes utilizar la IA incluso sin conexión, muy útil para entornos desconectados o para proyectos autónomos.
  • Coste reducido: Sin suscripciones ni cuotas: sólo necesitas una Raspberry Pi 5, almacenamiento suficiente, y ganas de aprender.
  • Personalización total: Puedes elegir entre un amplio catálogo de modelos de IA open source, adaptando las capacidades del sistema a tus necesidades, desde respuesta a preguntas hasta clasificación de textos u otras tareas específicas.

Material necesario y requisitos previos

Para empezar tu aventura con Ollama en Raspberry Pi 5 necesitarás lo siguiente:

  • Una Raspberry Pi 5 (preferiblemente de 8GB de RAM para mayor fluidez).
  • Almacenamiento suficiente en tu microSD o SSD externo (los modelos más grandes pueden ocupar varios gigas).
  • Raspberry Pi OS Bookworm 64 bits o una versión de Linux compatible.
  • Conexión a internet para la descarga inicial de modelos y dependencias.
  • Terminal con acceso de usuario privilegiado (sudo).
  • En algunos casos, conocimientos básicos de Docker si quieres experimentar con interfaces web o contenedores.

Instalación paso a paso de Ollama en Raspberry Pi 5

El proceso ha evolucionado mucho y actualmente es más sencillo de lo que imaginas. Ollama proporciona un script oficial que automatiza el grueso de la instalación:

  1. Actualiza el sistema operativo ejecutando los siguientes comandos en el terminal para tener los últimos paquetes y evitar conflictos:
    sudo apt update && sudo apt upgrade
  2. Verifica la instalación de curl (herramienta necesaria para descargar el script):
    sudo apt install curl
  3. Descarga y ejecuta el instalador oficial de Ollama:
    curl -fsSL https://ollama.com/install.sh | sh

    Si prefieres, puedes descargar el script, revisarlo manualmente en tu navegador y ejecutarlo después.

  4. Comprueba que Ollama está correctamente instalado:
    ollama --version
    Deberías ver la versión instalada en pantalla.

No olvides: para que Ollama funcione necesitas una versión de sistema operativo de 64 bits. Si tu Raspberry Pi usa una distribución de 32 bits, tendrás que reinstalar la versión adecuada.

Opciones avanzadas: instalación con Docker y WebUI

Si te manejas bien con Docker, puedes ir un paso más allá y montar Ollama junto a una interfaz gráfica web (WebUI) para facilitar la interacción con los modelos de lenguaje. Este método es ideal para quienes buscan comodidad, gestión visual de modelos o quieren compartir el acceso con más usuarios en la red local.

  1. Instala Docker en la Raspberry Pi (si no lo tienes): existen guías oficiales y muchos tutoriales gratuitos.
  2. Descarga la última versión de Ollama WebUI, por ejemplo desde el repositorio en GitHub.
  3. Crea tu propio archivo docker-compose.yaml personalizando rutas y usuario si lo necesitas.
  4. Levanta los servicios:
    docker-compose up -d
  5. Accede al WebUI en tu navegador escribiendo la dirección http://localhost:3000 o la IP de tu Raspberry en la misma red.
  6. En la WebUI podrás gestionar cuentas de usuario, descargar y seleccionar modelos fácilmente desde la propia interfaz gráfica.

Con esta opción, compartir tu servidor de IA o utilizarlo desde distintos dispositivos en casa es mucho más sencillo y visual. Además, puedes acceder, lanzar preguntas o cargar documentos sin escribir comandos en la terminal.

¿Qué modelos de lenguaje elegir? Comparativa y recomendaciones

La elección del modelo es crucial para adaptarse a los recursos de tu Raspberry Pi y al tipo de tarea que quieras llevar a cabo. La propia web de Ollama mantiene una lista actualizada de modelos compatibles, pero aquí tienes una selección de los más interesantes y probados para Raspberry Pi 5:

  • TinyLlama: Extremadamente ligero (1.1B parámetros), rápido en Raspberry Pi y adecuado para respuestas básicas o chatbots sencillos. Descárgalo y ejecútalo con:
    ollama run tinyllama
  • Phi / Phi3: Modelo ligero desarrollado por Microsoft, con buen equilibrio entre calidad de respuesta y consumo de recursos. Puede tardar algo más en responder pero es manejable. Instálalo con:
    ollama run phi3 o ollama run phi
  • Deepseek-R1:
    Esta familia de modelos tiene distintas versiones según el número de parámetros (1.5B, 7B, 8B, 14B). Cuanto más grande el modelo, más RAM y paciencia necesitarás. El modelo 1.5B suele ser el más recomendable para fluidez. Ejecútalo así:
    ollama run deepseek-r1:1.5b
  • Llama3: Uno de los modelos más avanzados y pesados. Su consumo de RAM y almacenamiento es elevado (necesitas al menos 4.7GB libres y la versión de 8GB de Raspberry Pi). Ofrece respuestas muy precisas, pero el rendimiento baja notablemente si se le exige mucho. Cárgalo con:
    ollama run llama3
  • llava: Propone funcionalidades de descripción de imágenes, aunque su peso y requisitos hacen que sólo sea viable en la Raspberry Pi 5 con máxima RAM y no siempre de forma fluida.

Consejo práctico: Empieza probando con TinyLlama o Phi. Si te interesa la máxima calidad, prueba Llama3, pero ten en cuenta que las respuestas pueden tardar más y el consumo de memoria será notable.

Cómo usar Ollama: interacción por terminal y desde API

La forma más directa de trabajar con Ollama es con el terminal y comandos básicos:

  • Para ejecutar un modelo y chatear con la IA:
    ollama run tinyllama (o el modelo que prefieras)
  • Para cambiar de modelo repite el comando cambiando el nombre.

Además, Ollama incorpora una API HTTP local muy fácil de consultar desde cualquier aplicación externa (Python, web, etc). Por ejemplo, puedes enviar una pregunta y obtener la respuesta en formato JSON usando este comando curl:

curl http://localhost:11434/api/generate -d '{ "model": "tinyllama", "prompt": "¿Cuál es la capital de Australia?", "stream": false}'

El resultado se recibe como JSON, con el texto generado y datos sobre el procesamiento. Esto permite automatizar tareas, crear aplicaciones propias o conectar tu servidor IA con asistentes, robots o páginas web propios.

Configuración, optimización y consejos de uso

Ejecutar LLMs en un dispositivo pequeño implica optimizar recursos y monitorizar el rendimiento:

  • Supervisa el consumo de RAM antes de cargar modelos pesados. Si tu Raspberry Pi 5 tiene 8GB de RAM podrás cargar modelos grandes, pero si notas que el sistema va lento o se detiene, vuelve a modelos más livianos.
  • Utiliza almacenamiento rápido y con suficiente espacio. Los modelos ocupan desde 1GB hasta más de 10GB en los casos más pesados.
  • Monitoriza el uso de la CPU y la temperatura. Puedes hacerlo con herramientas como htop o el monitor de recursos de Raspberry Pi OS.
  • Ajusta el tipo de modelo al uso final. Si quieres respuestas rápidas y no necesitas máxima precisión, los modelos pequeños son ideales incluso para robots, domótica o asistentes personales.
  • Actualiza Ollama y Raspberry Pi OS regularmente para beneficiarte de nuevas optimizaciones y compatibilidad.

Casos de uso prácticos y ejemplos reales

Las posibilidades de esta combinación son casi infinitas:

  • Chatbots privados y asistentes personales en casa: Responde preguntas, gestiona tareas o notificaciones sin exportar información fuera de tu red local.
  • Automatiza la respuesta de emails, clasificación de textos o análisis de sentimiento usando la API de Ollama y scripts de Python.
  • Proyectos educativos o talleres de IA: Enseña a programar inteligencia artificial de forma segura y offline.
  • Integración con sistemas robóticos o domóticos (Raspberry Pi ya se usa mucho en robótica y domótica). La IA puede analizar comandos de voz, identificar patrones de texto o generar instrucciones de forma autónoma.
  • Procesamiento local de imágenes (Llava, en modelos avanzados): Permite tareas básicas de análisis visual, aunque las limitaciones de hardware pueden ralentizar estas operaciones.

Ollama y LangChain: Automatización de flujos de trabajo en Python

Si quieres ir un paso más allá en la personalización e integración, LangChain es un framework de Python especializado en conectar y gestionar modelos de IA, incluyendo Ollama. Con él puedes crear chatbots más complejos, asistentes conversacionales, sistemas de análisis de documentos e incluso aplicaciones que combinen varias fuentes de datos.

Para usar LangChain con Ollama sólo necesitas instalar el paquete langchain-community vía pip:

pip install langchain-community

Luego puedes diseñar tus propios flujos de conversación, aplicar lógica condicional, crear cadenas de consultas o combinar varios modelos para distintas fases del proceso. Esto multiplica las posibilidades de tu Raspberry Pi como servidor de IA local.

Errores comunes y cómo solucionarlos

  • No inicia Ollama o recibes errores de arquitectura: Asegúrate de estar usando Raspberry Pi OS (o una distro compatible) en versión 64 bits.
  • El sistema se bloquea con modelos pesados: Cambia a un modelo más ligero o cierra otras aplicaciones en la Pi para liberar RAM.
  • Lentitud extrema al ejecutar ciertos modelos: Esto es normal en modelos muy grandes. Paciencia, o prueba alternativas más ligeras.
  • No puedes acceder al WebUI vía navegador: Comprueba que Docker y los contenedores estén activos y que no hay conflictos de puertos.

Trucos para mejorar la experiencia y facilitar el uso

  • Si usas la terminal habitualmente, crea atajos de comandos para lanzar o parar modelos rápidamente.
  • Utiliza sistemas de monitorización como Glances o htop para tener control del rendimiento y evitar cuelgues inesperados.
  • Haz copias de seguridad periódicas de tu carpeta de modelos, ya que algunos son voluminosos y una reinstalación puede requerir una descarga prolongada.
  • Comparte el acceso a tu servidor local con otros dispositivos de tu red, así puedes consultar a tu IA desde el móvil, portátil o cualquier navegador.

Comunidad y recursos útiles

La comunidad de Ollama crece constantemente, con repositorios, foros y tutoriales muy activos. Puedes explorar más información y modelos en:

Con todo esto, la Raspberry Pi 5 se convierte en una plataforma más que capaz para experimentar, aprender y crear tus propios sistemas inteligentes. Cada vez es más accesible disponer de IA local y privada, lo que te permite mantener el control total de tus datos mientras exploras nuevas posibilidades en el mundo de la inteligencia artificial casera.

Deja un comentario