---
title: "Mejores Modelos Open Source Baratos para Hermes Agent en 2026"
description: "Cinco modelos open source asequibles para Hermes Agent: MiniMax M2.7, Xiaomi MiMo V2.5 Pro, GLM 5.1, Kimi K2.6 y DeepSeek V4 Pro. Precios, benchmarks y cual elegir segun tu presupuesto."
date: 2026-04-30
categories: ["AI"]
tags: ["ai-tools","hermes","llm"]
---

import Button from "@components/widgets/Button.astro";
import Notice from "@components/widgets/Notice.astro";
import ListCheck from "@components/widgets/ListCheck.astro";
import Accordion from "@components/widgets/Accordion.astro";
import Tabs from "@components/widgets/Tabs.astro";
import Tab from "@components/widgets/Tab.astro";

Hermes Agent funciona 24/7. Responde mensajes, ejecuta tareas programadas, corre habilidades y busca en la web sin parar. Ese tipo de uso se acumula rapido si eliges el modelo equivocado. He estado probando distintos proveedores en mi instancia de Hermes durante meses, y el panorama open source ha cambiado mucho desde mis anteriores [recomendaciones de modelos para OpenClaw](/es/mejores-modelos-opensource-openclaw/).

He reducido la lista a cinco modelos que funcionan con Hermes Agent, cuestan una fraccion de lo que pagarias por acceso a la API de Claude o GPT, y en algunos casos igualan o superan a esos modelos propietarios en benchmarks de codigo y agentes.

<Notice type="info" title="Lo que cubre esta guia">
<ListCheck>
<ul>
<li>Cinco modelos open source asequibles que funcionan bien con Hermes Agent</li>
<li>Precio por token, ventanas de contexto y benchmarks de codigo para cada uno</li>
<li>Cual es el mas barato, cual es el mas potente y cual esta en el medio</li>
<li>OpenCode Go como una sola suscripcion que incluye los cinco modelos</li>
<li>Como configurar cada modelo en Hermes Agent</li>
</ul>
</ListCheck>
</Notice>

Si aun no has instalado Hermes Agent, la [guia de configuracion](/es/guia-configuracion-hermes-agent/) explica todo el proceso. Para opciones de dashboard y gestionar tu agente desde un navegador, consulta la seleccion de los [mejores dashboards para Hermes](/best-hermes-dashboards/).

## Los modelos de un vistazo

| Modelo | Entrada $/M tokens | Salida $/M tokens | Contexto | SWE-Bench Pro | Mejor para |
|--------|-------------------|--------------------|---------|---------------|------------|
| **MiniMax M2.7** | $0.30 | $1.20 | 196K | 56.2% | Opcion mas barata, uso diario |
| **DeepSeek V4 Pro** | $0.435 | $0.87 | 1M | — | Largo contexto con buen precio |
| **Kimi K2.6** | $0.75 | $3.50 | 262K | — | Codigo + agent swarm |
| **MiMo V2.5 Pro** | $1.00 | $3.00 | 1M | — | Agente mas potente, tareas largas |
| **GLM 5.1** | $1.05 | $3.50 | 200K | 58.4% | Mejor en codigo en general |

<Notice type="success" title="Resumen">
**Mas asequible:** MiniMax M2.7 — $0.30/M de entrada mantiene tu factura mensual por debajo de $15 incluso con uso intensivo. **Mas potente:** GLM 5.1 y MiMo V2.5 Pro — ambos igualan a Claude Opus 4.6 en benchmarks de agentes y codigo.
</Notice>

## 1. MiniMax M2.7 — La opcion economica

Este es el modelo al que siempre vuelvo para el uso diario con Hermes. A $0.30 por millon de tokens de entrada y $1.20 por millon de tokens de salida, ejecutar Hermes 24/7 cuesta entre $7 y $15 al mes segun cuanto lo uses. Eso es menos que una suscripcion de cafe.

<Button text="MiniMax M2.7 (10% Descuento)" link="https://go.bitdoze.com/minimax" variant="solid" color="blue" size="md" icon="arrow-right" />

### Que ofrece M2.7

M2.7 no es nada malo por el precio. Saca 56.2% en SWE-Bench Pro, lo que lo pone en el rango de modelos que cuestan entre tres y cinco veces mas. En el benchmark GDPval-AA para tareas economicamente valiosas, alcanza ELO 1495, la puntuacion mas alta entre modelos open source. Depuracion, analisis de causa raiz, generacion de documentos, llamadas a herramientas en multiples pasos — todo eso lo maneja sin desmoronarse.

MiniMax tambien ofrece M2.7-highspeed, que ejecuta el mismo modelo con mayor throughput por un precio algo mas alto. Para sesiones interactivas de Hermes donde el tiempo de respuesta importa, vale la pena probarlo.

| Especificacion | Valor |
|----------------|-------|
| **Arquitectura** | Mixture-of-Experts (MoE) |
| **Ventana de Contexto** | 196K tokens |
| **SWE-Bench Pro** | 56.2% |
| **GDPval-AA ELO** | 1,495 |
| **Costo Entrada** | $0.30/M tokens |
| **Costo Salida** | $1.20/M tokens |
| **Cache Read** | $0.059/M tokens |

### Token Plan

MiniMax ofrece un [Token Plan](https://platform.minimax.io/subscribe/token-plan) con tarifas con descuento. Si te registras a traves de [este enlace](https://go.bitdoze.com/minimax), obtienes un 10% de descuento en el Token Plan.

<Notice type="info" title="Consejo del plan de codificacion">
El Token Plan de MiniMax te da un pool fijo de tokens con descuento. Para Hermes Agent, el plan base de M2.7 cubre la mayoria de los casos de uso. Suscribete a traves de [go.bitdoze.com/minimax](https://go.bitdoze.com/minimax) para un 10% de descuento.
</Notice>

### Configurar M2.7 en Hermes

```bash
hermes config set model minimax/minimax-m2.7
```

O configuralo desde el selector de modelos:

```bash
hermes model
```

Selecciona MiniMax y autentica con tu API key.

## 2. DeepSeek V4 Pro — Largo contexto, buen precio

DeepSeek V4 Pro te da una ventana de contexto de 1 millon de tokens por $0.435 por millon de tokens de entrada. El contexto mas largo y el segundo precio mas barato de esta lista. Si tus conversaciones de Hermes se alargan o le pasas repos grandes, este es el modelo que lo maneja sin perder el hilo.

Ejecuta 1.6 billones de parametros totales con 49 mil millones activados por token y soporta modos de pensamiento y sin pensamiento.

| Especificacion | Valor |
|----------------|-------|
| **Arquitectura** | MoE (1.6T total, 49B activos) |
| **Ventana de Contexto** | 1M tokens |
| **AA Intelligence Index** | 51.5 (mejor que el 96% de modelos) |
| **AA Agentic Index** | 67.2 (mejor que el 98% de modelos) |
| **Costo Entrada** | $0.435/M tokens |
| **Costo Salida** | $0.87/M tokens |
| **Cache Read** | $0.003625/M tokens |

### Donde destaca DeepSeek V4 Pro

La tasa de alucinacion de este modelo es del 6.0% en el benchmark AA-Omniscience, la mas baja de esta lista por mucho. Cuando Hermes ejecuta comandos en un servidor en produccion, esa diferencia importa. Tambien saca 96.2% en tau2-Bench Telecom para fiabilidad de agentes conversacionales.

El costo de salida de $0.87/M tokens tambien es el mas barato de la lista. Si tu uso de Hermes genera mucha salida — resumenes de investigacion, generacion de codigo, escritura de documentos — DeepSeek V4 Pro mantiene la factura baja.

<Button text="Anuncio DeepSeek V4 Pro" link="https://api-docs.deepseek.com/news/news260424" variant="outline" color="blue" size="md" icon="arrow-right" />

### Configurar DeepSeek V4 Pro en Hermes

```bash
hermes config set model deepseek/deepseek-v4-pro
```

Anade tu API key de DeepSeek a `~/.hermes/.env`:

```bash
echo "DEEPSEEK_API_KEY=your-key-here" >> ~/.hermes/.env
```

## 3. Kimi K2.6 — Agent swarm integrado

Kimi K2.6 de Moonshot AI hace algo que los demas modelos de esta lista no: un agent swarm que levanta cientos de sub-agentes en paralelo para descomponer y abordar tareas complejas por su cuenta. No tienes que descomponer el trabajo tu mismo — K2.6 lo resuelve.

| Especificacion | Valor |
|----------------|-------|
| **Arquitectura** | MoE (1T total, 32B activos) |
| **Ventana de Contexto** | 262K tokens |
| **AA Intelligence Index** | 53.9 (mejor que el 98% de modelos) |
| **AA Coding Index** | 47.1 (mejor que el 95% de modelos) |
| **AA Agentic Index** | 66.0 (mejor que el 96% de modelos) |
| **Costo Entrada** | $0.75/M tokens |
| **Costo Salida** | $3.50/M tokens |

### Por que K2.6 funciona con Hermes

K2.6 saca 91.1% en GPQA Diamond para razonamiento cientifico de nivel doctoral — la puntuacion mas alta de esta lista. Tambien maneja codigo en Python, Rust y Go en tareas de largo alcance. La funcion Agent Swarm significa que cuando Hermes encuentra una tarea compleja, K2.6 puede descomponerla internamente y trabajar en las partes en paralelo.

Moonshot AI ofrece [Kimi Code](https://www.kimi.com/code) como servicio de suscripcion. Los planes empiezan en $15/mes para el tier Moderato. Si usas Hermes principalmente para tareas de codificacion, la suscripcion de Kimi Code te da una experiencia gestionada con K2.6 incluido.

<Button text="Pagina de Kimi K2.6" link="https://www.kimi.com/ai-models/kimi-k2-6" variant="solid" color="purple" size="md" icon="arrow-right" />

### Configurar K2.6 en Hermes

```bash
hermes config set model moonshotai/kimi-k2.6
```

Anade tu API key de Moonshot:

```bash
echo "MOONSHOT_API_KEY=your-key-here" >> ~/.hermes/.env
```

## 4. Xiaomi MiMo V2.5 Pro — El potente para agentes

MiMo V2.5 Pro es el modelo insignia de Xiaomi y una de las dos opciones mas potentes de esta lista. Fue construido desde cero para escenarios de agentes — ingenieria de software compleja, tareas de largo alcance y flujos de trabajo con cientos de llamadas a herramientas en una sola sesion.

En pruebas internas, MiMo V2.5 Pro completo un compilador SysY completo en Rust en 4.3 horas con 672 llamadas a herramientas, obteniendo una puntuacion perfecta de 233/233 en el conjunto de pruebas oculto. Una tarea que a estudiantes de pregrado de la Universidad de Pekin les toma varias semanas. Tambien construyo una aplicacion web de editor de video funcional — 8,192 lineas de codigo en 1,868 invocaciones de herramientas — en 11.5 horas de trabajo autonomo.

<Button text="Docs MiMo V2.5 Pro" link="https://platform.xiaomimimo.com/docs/en-US/news/v2.5-news" variant="solid" color="blue" size="md" icon="arrow-right" />

| Especificacion | Valor |
|----------------|-------|
| **Ventana de Contexto** | 1M tokens |
| **AA Intelligence Index** | 53.8 (mejor que el 98% de modelos) |
| **AA Coding Index** | 45.5 (mejor que el 94% de modelos) |
| **AA Agentic Index** | 67.4 (mejor que el 98% de modelos) |
| **Costo Entrada (hasta 256K)** | $1.00/M tokens |
| **Costo Salida (hasta 256K)** | $3.00/M tokens |
| **Costo Entrada (mas de 256K)** | $2.00/M tokens |
| **Costo Salida (mas de 256K)** | $6.00/M tokens |
| **Cache Read** | $0.20/M tokens |

### Ventaja de eficiencia de tokens

MiMo V2.5 Pro esta optimizado para eficiencia de tokens. En el benchmark de agente ClawEval, alcanza la misma puntuacion que Kimi K2.6 usando un 42% menos de tokens. Eso significa que el precio mas alto por token se compensa al necesitar menos tokens para completar la misma tarea.

El [MiMo Token Plan](https://platform.xiaomimimo.com/token-plan) empieza en $72/ano para el tier Lite (720 millones de creditos). El tier Pro a $600/ano da 8.4 mil millones de creditos. Las horas valle (16:00-24:00 UTC) tienen un 20% de descuento adicional sobre la tarifa del plan.

<Button text="MiMo Token Plan ($2 Bonus)" link="https://go.bitdoze.com/mimo" variant="solid" color="green" size="md" icon="arrow-right" />

<Notice type="info" title="Bonus de MiMo">
Registrate a traves de [go.bitdoze.com/mimo](https://go.bitdoze.com/mimo) y obtiene un bono de $2 en el Token Plan de MiMo.
</Notice>

### Configurar MiMo V2.5 Pro en Hermes

```bash
hermes config set model xiaomi/mimo-v2.5-pro
```

Anade tu API key de MiMo:

```bash
echo "MIMO_API_KEY=your-key-here" >> ~/.hermes/.env
```

MiMo V2.5 Pro tambien esta disponible en OpenRouter, asi que si ya tienes Hermes configurado con una API key de OpenRouter, puedes seleccionarlo de la lista de modelos sin anadir un nuevo proveedor.

## 5. GLM 5.1 — El mas potente en general

GLM 5.1 de Z.AI es el modelo mas potente de esta lista. En SWE-Bench Pro, saca 58.4%, por delante de GPT-5.4, Claude Opus 4.6 y Gemini 3.1 Pro. En LMArena Code, ocupa el primer lugar entre modelos open source y el tercero a nivel global. Puede trabajar autonomamente en una sola tarea hasta 8 horas, manteniendo la alineacion con el objetivo sin desviarse.

<Button text="Documentacion GLM 5.1" link="https://docs.z.ai/guides/llm/glm-5.1" variant="solid" color="blue" size="md" icon="arrow-right" />

| Especificacion | Valor |
|----------------|-------|
| **Ventana de Contexto** | 200K tokens |
| **Salida Maxima** | 128K tokens |
| **SWE-Bench Pro** | 58.4% |
| **Posicionamiento** | Alineado con Claude Opus 4.6 |
| **Costo Entrada** | $1.05/M tokens |
| **Costo Salida** | $3.50/M tokens |

### Que hace diferente a GLM 5.1

GLM 5.1 es el unico modelo de esta lista que declara capacidad de ejecucion sostenida de 8 horas. En pruebas internas, realizo 655 iteraciones en una tarea de optimizacion de base de datos vectorial, elevando el throughput de consultas a 6.9x la version de produccion inicial. En KernelBench Nivel 3, logro un speedup geometrico medio de 3.6x a traves de miles de optimizaciones impulsadas por invocaciones de herramientas.

Para Hermes Agent, eso significa que GLM 5.1 maneja tareas programadas de larga duracion — briefings matutinos, monitoreo de servidor, tareas de investigacion complejas — sin perder el hilo a mitad de ejecucion.

Z.AI ofrece [Planes de Codificacion GLM](https://z.ai/subscribe) desde $18/mes para el tier Lite. El tier Pro a $72/mes incluye herramientas MCP y velocidades de generacion mas rapidas.

<Button text="Planes GLM (10% Descuento)" link="https://go.bitdoze.com/glm" variant="solid" color="green" size="md" icon="arrow-right" />

<Notice type="info" title="Descuento GLM">
Registrate a traves de [go.bitdoze.com/glm](https://go.bitdoze.com/glm) y obtiene un 10% de descuento en los Planes de Codificacion GLM.
</Notice>

### Configurar GLM 5.1 en Hermes

```bash
hermes config set model z-ai/glm-5.1
```

Anade tu API key de Z.AI:

```bash
echo "ZAI_API_KEY=your-key-here" >> ~/.hermes/.env
```

GLM 5.1 tambien esta disponible en OpenRouter.

## OpenCode Go — Los cinco modelos, una sola suscripcion

Si no quieres gestionar API keys y facturacion separada para cada proveedor, [OpenCode Go](https://go.bitdoze.com/opencode-go) incluye los cinco modelos en una sola suscripcion por $10/mes. Para un analisis detallado, consulta la [guia de OpenCode Go](/opencode-go-plan/).

<Button text="OpenCode Go" link="https://go.bitdoze.com/opencode-go" variant="solid" color="purple" size="md" icon="arrow-right" />

### Que incluye OpenCode Go

- **$10/mes**
- Acceso a MiniMax M2.7, MiMo V2.5 Pro, GLM 5.1, Kimi K2.6, DeepSeek V4 Pro y mas
- Modelos alojados en EE.UU., UE y Singapur para acceso global estable
- Politica de cero retencion — los proveedores no usan tus datos para entrenamiento

### Limites de uso

OpenCode Go limita el uso a $12 por 5 horas, $30 por semana y $60 por mes. Los modelos mas baratos como MiniMax M2.7 te permiten hacer mas solicitudes dentro de esos limites. Las cantidades estimadas de solicitudes:

| Modelo | Solicitudes por 5 horas | Solicitudes por semana | Solicitudes por mes |
|--------|------------------------|----------------------|-------------------|
| MiniMax M2.7 | 3,400 | 8,500 | 17,000 |
| DeepSeek V4 Pro | 3,450 | 8,550 | 17,150 |
| Kimi K2.6 | 1,150 | 2,880 | 5,750 |
| MiMo V2.5 Pro | 1,290 | 3,225 | 6,450 |
| GLM 5.1 | 880 | 2,150 | 4,300 |

A $10/mes, OpenCode Go cuesta menos que la mayoria de los planes individuales de proveedores y te da la flexibilidad de cambiar entre modelos segun la tarea. Para Hermes Agent, puedes configurar el endpoint de OpenCode Go como proveedor personalizado y elegir el modelo que se ajuste al trabajo.

### Configurar OpenCode Go en Hermes

Anade el endpoint de OpenCode Go a `~/.hermes/.env`:

```bash
echo "OPENAI_BASE_URL=https://opencode.ai/zen/go/v1/chat/completions" >> ~/.hermes/.env
echo "OPENAI_API_KEY=your-opencode-go-key" >> ~/.hermes/.env
```

Luego configura el modelo:

```bash
hermes config set model opencode-go/minimax-m2.7
```

Cambia de modelo en cualquier momento:

```bash
hermes model
```

## Comparacion directa

| Caracteristica | MiniMax M2.7 | DeepSeek V4 Pro | Kimi K2.6 | MiMo V2.5 Pro | GLM 5.1 |
|---------------|-------------|-----------------|-----------|---------------|---------|
| **Entrada $/M** | $0.30 | $0.435 | $0.75 | $1.00 | $1.05 |
| **Salida $/M** | $1.20 | $0.87 | $3.50 | $3.00 | $3.50 |
| **Contexto** | 196K | 1M | 262K | 1M | 200K |
| **AA Intelligence** | 49.6 | 51.5 | 53.9 | 53.8 | — |
| **AA Agentic** | 61.5 | 67.2 | 66.0 | 67.4 | — |
| **Alucinacion** | 65.6% | 6.0% | 60.7% | 75.5% | Cero |
| **SWE-Bench Pro** | 56.2% | — | — | — | 58.4% |
| **Licencia** | Open weights | MIT | Open weights | Open source | Open source |
| **Estimado mensual** | $7-15 | $10-20 | $15-30 | $15-35 | $15-40 |

### Cual deberias elegir?

**Con presupuesto ajustado:** MiniMax M2.7. A $0.30/M de entrada, puedes ejecutar Hermes todo el mes por el precio de un cafe. El rendimiento es suficiente para la mayoria de tareas diarias — recordatorios, preguntas rapidas, gestion de archivos, investigacion simple.

**Necesitas largo contexto:** DeepSeek V4 Pro. La ventana de 1M de tokens a $0.30/M de entrada es dificil de superar. Si tus conversaciones de Hermes se alargan o procesas archivos grandes, este es el indicado.

**Quieres el agente mas potente:** MiMo V2.5 Pro o GLM 5.1. Ambos igualan a Claude Opus 4.6 en benchmarks de agentes. MiMo V2.5 Pro es algo mejor en tareas sostenidas de largo alcance con su eficiencia de tokens. GLM 5.1 tiene la ventaja en codigo puro con su 58.4% en SWE-Bench Pro.

**No quieres elegir:** OpenCode Go a $10/mes te da los cinco modelos. Cambia entre ellos segun la tarea.

<Notice type="warning" title="Aviso de riesgo de suscripcion">
Usar los tokens OAuth de tu suscripcion de Claude Code, Gemini CLI o Codex con Hermes Agent puede hacer que te suspendan la cuenta. Estos proveedores monitorean patrones de uso automatizado. Usa API keys de los proveedores listados arriba en su lugar. Consulta nuestra [guia de modelos para OpenClaw](/es/mejores-modelos-opensource-openclaw/) para el desglose completo de por que el acceso API es la ruta segura.
</Notice>

## Lo que yo uso en realidad

Mi configuracion de Hermes usa MiniMax M2.7 como modelo por defecto para chat diario y tareas rapidas. Para trabajos complejos de codificacion e investigacion, cambio a GLM 5.1 o MiMo V2.5 Pro. DeepSeek V4 Pro se encarga de cualquier cosa que necesite una ventana de contexto larga.

La configuracion de respaldo se ve asi:

```bash
hermes config set model minimax/minimax-m2.7
```

Cuando necesito mas potencia para una tarea especifica:

```bash
hermes model
# Seleccionar GLM 5.1 o MiMo V2.5 Pro
```

Para la mayoria de usuarios de Hermes, empezar con MiniMax M2.7 y subir cuando sea necesario mantiene los costos bajos sin sacrificar capacidad.

## Preguntas frecuentes

<Accordion label="Cual es el modelo mas barato para Hermes Agent?" group="faq" expanded="true">
MiniMax M2.7 a $0.30/M de entrada y $1.20/M de salida. Ejecutar Hermes 24/7 con uso moderado cuesta $7-15/mes. DeepSeek V4 Pro es el segundo mas barato a $0.435/M de entrada y $0.87/M de salida.
</Accordion>

<Accordion label="Cual es el modelo mas potente para codigo?" group="faq">
GLM 5.1 saca 58.4% en SWE-Bench Pro, por delante de GPT-5.4 y Claude Opus 4.6. Ocupa el primer lugar entre modelos open source en LMArena Code. MiMo V2.5 Pro es un segundo cercano con sus capacidades de agente.
</Accordion>

<Accordion label="Puedo usar OpenCode Go con Hermes Agent?" group="faq">
Si. OpenCode Go proporciona un endpoint compatible con OpenAI. Configura la URL base como `https://opencode.ai/zen/go/v1/chat/completions` en tu configuracion de Hermes y usa tu API key de OpenCode Go. A $10/mes, incluye los cinco modelos listados aqui.
</Accordion>

<Accordion label="Estos modelos funcionan a traves de OpenRouter?" group="faq">
Si. MiniMax M2.7, MiMo V2.5 Pro, GLM 5.1, Kimi K2.6 y DeepSeek V4 Pro estan todos disponibles en OpenRouter. Si ya tienes Hermes configurado con una API key de OpenRouter, puedes cambiar entre ellos sin anadir nuevos proveedores.
</Accordion>

<Accordion label="Es seguro usar mi suscripcion de Claude con Hermes?" group="faq">
No. Anthropic monitorea el uso automatizado a traves de tokens OAuth y ha suspendido cuentas por ello. Usa API keys de los proveedores listados arriba. La [guia de modelos de OpenClaw](/es/mejores-modelos-opensource-openclaw/) explica los riesgos en detalle.
</Accordion>

<Accordion label="Cual modelo tiene la menor tasa de alucinacion?" group="faq">
DeepSeek V4 Pro con un 6.0% en el benchmark AA-Omniscience. GLM 5.1 reporta alucinaciones cercanas a cero. Para ejecutar comandos en un servidor en produccion a traves de Hermes, menor alucinacion significa menos errores.
</Accordion>

Para toda la cadena de configuracion de Hermes: empieza con el [instalador](/es/guia-configuracion-hermes-agent/), configura un [dashboard](/best-hermes-dashboards/) para acceso desde el navegador, y si quieres modelos gratuitos, la [guia del Portal Nous](/hermes-agent-mimo-v2-pro/) cubre las promociones gratuitas que rotan a traves de las asociaciones de Hermes. Para gestion de tareas estructurada con flujos de trabajo multi-agente, la [guia de Kanban Hermes](/es/guia-kanban-hermes/) cubre tableros de tareas, dependencias y patrones de coordinacion. Si prefieres un agente de codificacion en terminal mas minimalista con un sistema de extensiones en TypeScript, nuestra [guia de configuracion de Pi coding agent](/es/guia-configuracion-pi-agent/) cubre instalacion, configuracion de modelos y las mejores extensiones incluyendo LazyPi.