MELLUM2 THINKING
Una IA especialmente indicada para desarrolladores
Recientemente JetBrains ha anunciado que Mellum2, IA para desarrollo software, pasa a ser un modelo de pesos abiertos (open weights) distribuido bajo licencia Apache 2.0, lo que permite usarlo, modificarlo y desplegarlo sin coste de licencia.
JetBrains propone varias opciones para cargar y ejecutar Mellum2 Thinking, facilitando su adopción según el escenario:
vLLM
Probablemente la opción más popular para servidores locales. Está optimizado para GPU NVIDIA, ofrece alto rendimiento, permite manejar múltiples peticiones simultáneas y mantiene ventanas de contexto amplias. Además, vLLM permite paralelismo entre GPUs para mejorar la concurrencia y el rendimiento en entornos exigentes.
SGLang
Orientado a agentes, workflows complejos y escenarios avanzados como RAG.
RAG (Retrieval-Augmented Generation) es una técnica que permite complementar las respuestas del modelo utilizando información procedente de documentación, bases de conocimiento o repositorios corporativos.
Docker Model Runner
Alternativa simplificada donde Docker gestiona la descarga del modelo, el runtime y la exposición del servicio.
Estos motores van a permitir cargar los pesos del modelo en memoria/GPU, recibir los prompts, ejecutar la inferencia, devolver las respuestas, y opcionalmente usar una API compatible con el formato de API HTTP que popularizó OpenAI.
Mellum2 Thinking es especialmente atractivo como modelo local para agentes ACP, porque combina licencia abierta, enfoque en programación y un tamaño razonable para ejecutarlo on-premise.
ACP (Agent Client Protocol) es un protocolo abierto que permite conectar agentes de IA con diferentes IDEs y editores, de forma similar a cómo LSP (Language Server Protocol) estandarizó la integración de herramientas de análisis de código.
Mellum2 Thinking representa una alternativa muy interesante para organizaciones que desean desplegar capacidades de IA generativa en sus propias infraestructuras.
Su licencia abierta, su especialización en desarrollo software y sus reducidos requisitos de inferencia frente a modelos de mayor tamaño lo convierten en una opción especialmente atractiva para equipos de desarrollo que trabajan con múltiples IDEs y lenguajes de programación.

