---
title: "Modelos Qwen 3.6 para Agentes de Codificacion con IA: Configuracion, Precios y Benchmarks"
description: "La serie Qwen 3.6 de Alibaba incluye Plus, 27B, 35B-A3B y Max Preview. Precios desde $0.33/M tokens de entrada, contexto de 1M, y fuertes benchmarks de codificacion. Como configurarlos con Hermes, OpenClaw y OpenCode."
date: 2026-04-30
categories: ["AI"]
tags: ["ai-tools","hermes","llm"]
---

import Button from "@components/widgets/Button.astro";
import Notice from "@components/widgets/Notice.astro";
import ListCheck from "@components/widgets/ListCheck.astro";
import Accordion from "@components/widgets/Accordion.astro";
import Tabs from "@components/widgets/Tabs.astro";
import Tab from "@components/widgets/Tab.astro";

Alibaba lanzo la serie Qwen 3.6 en abril de 2026 y la comunidad de desarrollo lo noto rapido. El hilo de r/LocalLLaMA sobre Qwen 3.6 alcanzo 760 votos con comentarios como "el salto de rendimiento es real" y gente reportando que manejo tareas que normalmente solo confian a Opus y Codex. He estado probando Qwen 3.6 Plus y Qwen 3.6-27B con [Hermes Agent](/es/guia-configuracion-hermes-agent/), [OpenCode](/es/guia-configuracion-opencode/) y OpenClaw durante las ultimas dos semanas.

Lo que llamo mi atencion: Qwen 3.6 Plus saca 78.8 en SWE-bench Verified, cuesta $0.33/M de tokens de entrada, y tiene una ventana de contexto de 1M de tokens. Para referencia, eso lo pone en el mismo rango de rendimiento que modelos que cuestan entre tres y diez veces mas.

<Notice type="info" title="Lo que cubre esta guia">
<ListCheck>
<ul>
<li>Cuatro modelos Qwen 3.6: Plus, 27B, 35B-A3B y Max Preview</li>
<li>Precios a traves de Alibaba directo, OpenRouter y OpenCode Go</li>
<li>Benchmarks: SWE-bench, Terminal-Bench, GPQA y pruebas de agentes</li>
<li>Configuracion con Hermes Agent, OpenClaw, OpenCode y Ollama</li>
<li>Cual modelo Qwen 3.6 elegir para diferentes tareas</li>
</ul>
</ListCheck>
</Notice>

Si aun estas decidiendo entre agentes de codificacion con IA, nuestra [guia de configuracion de OpenCode](/es/guia-configuracion-opencode/) cubre la alternativa open source a Claude Code, y el articulo de [alternativas a GitHub Copilot](/es/alternativas-github-copilot-2026/) desglosa las opciones despues del cambio de precios del 1 de junio.

## La linea Qwen 3.6

Alibaba lanzo cuatro modelos en la serie 3.6. Cada uno apunta a un caso de uso diferente.

| Modelo | Parametros | Contexto | Entrada $/M | Salida $/M | Licencia | Mejor para |
|--------|-----------|---------|-------------|------------|---------|------------|
| **Qwen 3.6 Plus** | MoE propietario | 1M | $0.33 | $1.95 | Cerrada | Codificacion diaria, agentes |
| **Qwen 3.6 27B** | 27B denso | 262K | ~$0.15 | ~$0.60 | Apache 2.0 | Codificacion autoalojada |
| **Qwen 3.6 35B-A3B** | 35B total, 3B activos | 262K | ~$0.08 | ~$0.30 | Apache 2.0 | Autoalojamiento economico |
| **Qwen 3.6 Max Preview** | ~1T MoE | 262K | Varia | Varia | Cerrada | Maximo rendimiento |

### Qwen 3.6 Plus — El que mas uso

Este es el caballo de batalla. $0.33/M de tokens de entrada con una ventana de contexto de 1M. Alibaba lo optimizo especificamente para codificacion agente y desarrollo frontend.

En SWE-bench Verified saca 78.8. En el benchmark Design Arena para trabajo frontend, entra en el top 11% para escenas 3D, top 14% para juegos y top 16% para componentes de UI.

La ventana de 1M de tokens importa para el trabajo de agente. Cuando Hermes u OpenCode esta procesando un repo grande, el modelo necesita mantener la estructura completa del archivo, multiples archivos relacionados y el historial de la conversacion sin perder piezas.

<Button text="Qwen 3.6 Plus en OpenRouter" link="https://openrouter.ai/qwen/qwen3.6-plus" variant="solid" color="blue" size="md" icon="arrow-right" />

### Qwen 3.6 27B — Codificacion autoalojada

Un modelo denso de 27 mil millones de parametros bajo Apache 2.0. Si tienes una GPU con 24GB+ de VRAM (o 64GB+ de RAM para inferencia en CPU), puedes ejecutarlo localmente a traves de Ollama y pagar cero por token.

Acepta entrada de texto, imagen y video, tiene una ventana de contexto de 262K e incluye un modo de pensamiento integrado para razonamiento extendido.

### Qwen 3.6 35B-A3B — La opcion economica autoalojada

Un modelo MoE con 35B parametros totales pero solo 3B activos por token. Eso significa que funciona rapido con mucho menos hardware que el modelo denso de 27B. Licencia Apache 2.0, contexto nativo de 262K (extensible a 1M via YaRN).

Si quieres autoalojar un modelo de codificacion en un VPS sin GPU, este es el que debes probar. Un modelo con 3B parametros activos puede ejecutarse en hardware solo con CPU a velocidades utilizables.

### Qwen 3.6 Max Preview — Maximo rendimiento

El modelo frontera propietario de Alibaba. Alcanzo el numero uno en seis benchmarks de codificacion el 20 de abril de 2026. Aproximadamente 1 billon de parametros totales, 262K de contexto.

Es de pesos cerrados y solo disponible a traves de las APIs de Alibaba Cloud y Qwen Studio. Es el modelo Qwen mas potente pero cuesta mas que la variante Plus. Para la mayoria de casos de uso de agentes de codificacion, Plus es mejor valor.

## Comparacion de precios

### A traves de OpenRouter

| Modelo | Entrada $/M | Salida $/M | Cache Read |
|--------|-------------|------------|------------|
| Qwen 3.6 Plus | $0.33 | $1.95 | $0.033 |
| Qwen 3.6 35B-A3B | ~$0.08 | ~$0.30 | Varia |
| Qwen 3.6 27B | ~$0.15 | ~$0.60 | Varia |

El precio efectivo promedio ponderado en OpenRouter para Qwen 3.6 Plus es de unos $0.40/M de entrada y $2.05/M de salida. El precio de lectura de cache de $0.033/M es muy bajo, lo que beneficia los flujos de trabajo de agentes donde el modelo lee repetidamente los mismos archivos del proyecto.

### A traves de OpenCode Go

Qwen 3.6 Plus y Qwen 3.5 Plus estan incluidos en [OpenCode Go](https://go.bitdoze.com/opencode-go) a $10/mes. A ese precio, Qwen 3.6 Plus te da un estimado de 3,300 solicitudes por 5 horas y 16,300 solicitudes por mes.

## Benchmarks

### Rendimiento de codificacion

| Benchmark | Qwen 3.6 Plus | Qwen 3.6 Max Preview |
|-----------|--------------|---------------------|
| SWE-bench Verified | 78.8% | #1 (multiples benchmarks) |
| SWE-bench Pro | — | #1 |
| Terminal-Bench 2.0 | — | #1 |

### Design Arena (frontend)

| Categoria | Qwen 3.6 Plus Elo | Ranking |
|-----------|-------------------|---------|
| 3D | 1321 | Top 11% |
| Categorias de Codigo | 1292 | Top 14% |
| Desarrollo de Juegos | 1293 | Top 14% |
| Componente UI | 1301 | Top 16% |
| Sitio Web | 1274 | Top 19% |
| SVG | 1249 | Top 16% |
| Visualizacion de Datos | 1270 | Top 18% |

## Configurar Qwen 3.6 con tus agentes

### Hermes Agent

```bash
# Via OpenRouter (recomendado)
hermes config set model qwen/qwen3.6-plus
echo "OPENROUTER_API_KEY=your-key" >> ~/.hermes/.env
```

### OpenCode

```
/connect
# Seleccionar OpenRouter o OpenCode Go
```

Luego `/models` para elegir Qwen 3.6 Plus.

### OpenClaw

Edita tu configuracion:

```json
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "qwen/qwen3.6-plus",
        "fallback": ["minimax/minimax-m2.7"]
      }
    }
  }
}
```

### Ollama (para autoalojar 27B o 35B-A3B)

```bash
ollama pull qwen3.6:27b
# O la variante MoE
ollama pull qwen3.6:35b-a3b
```

Luego configura tu agente para usar el endpoint local de Ollama. Consulta nuestra [guia de Ollama con Docker](/ollama-docker-install/) para la configuracion.

## Cual modelo Qwen 3.6 deberias elegir?

**Codificacion diaria con agente:** Qwen 3.6 Plus. El precio de $0.33/M de entrada, contexto de 1M y fuerte puntuacion en SWE-bench lo convierten en la opcion por defecto.

**Autoalojamiento con GPU:** Qwen 3.6 27B. Licencia Apache 2.0, 262K de contexto, fuerte rendimiento.

**Autoalojamiento economico:** Qwen 3.6 35B-A3B. Solo 3B parametros activos significa que funciona en hardware modesto.

**Maxima precision sin importar el costo:** Qwen 3.6 Max Preview. Numero uno en seis benchmarks de codificacion.

**No quieres elegir:** [OpenCode Go](https://go.bitdoze.com/opencode-go) incluye Qwen 3.6 Plus y Qwen 3.5 Plus a $10/mes. Consulta la [guía de OpenCode Go](/opencode-go-plan/) para limites y benchmarks.

## Qwen 3.6 vs la competencia

| Caracteristica | Qwen 3.6 Plus | MiniMax M2.7 | GLM 5.1 | DeepSeek V4 Pro |
|---------------|--------------|-------------|---------|----------------|
| **Entrada $/M** | $0.33 | $0.30 | $1.05 | $0.435 |
| **Salida $/M** | $1.95 | $1.20 | $3.50 | $0.87 |
| **Contexto** | 1M | 196K | 200K | 1M |
| **SWE-bench Verified** | 78.8% | — | — | — |
| **Diseno/frontend** | Fuerte | Promedio | Promedio | Promedio |

Qwen 3.6 Plus se situa entre MiniMax M2.7 y GLM 5.1 en precio. Su contexto de 1M iguala a DeepSeek V4 Pro. Donde destaca es en trabajo de frontend y UI — los rankings de Design Arena son significativamente mas fuertes que cualquier otro modelo a este precio.

Para codificacion de backend y sistemas, GLM 5.1 sigue teniendo la ventaja. Para la opcion mas barata, MiniMax M2.7 a $0.30/M de entrada es dificil de superar.

<Notice type="info" title="Guias relacionadas">
- [Mejores modelos baratos para Hermes Agent](/es/mejores-modelos-baratos-hermes-agent/) — comparacion completa de precios entre los cinco principales modelos open source
- [Guia de configuracion de OpenCode](/es/guia-configuracion-opencode/) — agente de codificacion en terminal compatible con cualquier modelo Qwen
- [Mejores modelos open source para OpenClaw](/es/mejores-modelos-opensource-openclaw/) — recomendaciones de modelos para agentes de IA autoalojados
</Notice>

## Preguntas frecuentes

<Accordion label="Qwen 3.6 Plus es gratis en algun lugar?" group="faq" expanded="true">
OpenRouter ofrece un tier gratuito para Qwen 3.6 Plus con limites de tasa. OpenCode Go ($10/mes) lo incluye sin cargos por token hasta el limite mensual de uso. Directamente de Alibaba, no hay tier gratuito pero el precio por token es competitivo.
</Accordion>

<Accordion label="Puedo ejecutar Qwen 3.6 localmente?" group="faq">
Si. Qwen 3.6 27B y Qwen 3.6 35B-A3B son modelos de pesos abiertos bajo Apache 2.0. El modelo denso de 27B necesita una GPU de 24GB o 64GB+ de RAM. El modelo MoE de 35B-A3B tiene solo 3B parametros activos y funciona con mucho menos. Descargalos con Ollama: `ollama pull qwen3.6:27b` o `ollama pull qwen3.6:35b-a3b`.
</Accordion>

<Accordion label="Como se compara Qwen 3.6 Plus con Claude Sonnet?" group="faq">
Qwen 3.6 Plus cuesta $0.33/M de entrada frente a Claude Sonnet a unos $3/M de entrada. Eso es unas 9 veces mas barato. En benchmarks de codificacion, Qwen 3.6 Plus saca 78.8% en SWE-bench Verified. Claude Sonnet saca mas en algunos benchmarks, pero por la diferencia de precio, Qwen 3.6 Plus es mejor valor para la mayoria de tareas de codificacion.
</Accordion>

<Accordion label="Que hay de Qwen 3.6 Max Preview?" group="faq">
Qwen 3.6 Max Preview es el modelo mas potente de Alibaba, alcanzando el numero uno en seis benchmarks de codificacion. Es de pesos cerrados y solo disponible a traves de APIs de Alibaba Cloud y Qwen Studio. Para la mayoria de desarrolladores, Plus es mejor para uso diario. Usa Max Preview cuando necesites maxima precision en un problema dificil especifico.
</Accordion>

<Accordion label="Qwen 3.6 funciona con servidores MCP?" group="faq">
Si. Qwen 3.6 Plus soporta llamadas a funciones y salida estructurada, que es lo que los servidores MCP usan bajo el capo. Cuando conectas servidores MCP a traves de OpenCode, Hermes Agent u OpenClaw, Qwen 3.6 Plus maneja las llamadas a herramientas como cualquier otro modelo compatible.
</Accordion>

Para mas comparaciones de modelos y guias de configuracion de agentes de IA, consulta nuestra [categoria de herramientas de IA](/category/ai/) y el resumen de [alternativas a OpenClaw](/es/alternativas-openclaw/).