Modelos Qwen 3.6 para Agentes de Codificacion con IA: Configuracion, Precios y Benchmarks

La serie Qwen 3.6 de Alibaba incluye Plus, 27B, 35B-A3B y Max Preview. Precios desde $0.33/M tokens de entrada, contexto de 1M, y fuertes benchmarks de codificacion. Como configurarlos con Hermes, OpenClaw y OpenCode.

Modelos Qwen 3.6 para Agentes de Codificacion con IA: Configuracion, Precios y Benchmarks

Alibaba lanzo la serie Qwen 3.6 en abril de 2026 y la comunidad de desarrollo lo noto rapido. El hilo de r/LocalLLaMA sobre Qwen 3.6 alcanzo 760 votos con comentarios como “el salto de rendimiento es real” y gente reportando que manejo tareas que normalmente solo confian a Opus y Codex. He estado probando Qwen 3.6 Plus y Qwen 3.6-27B con Hermes Agent, OpenCode y OpenClaw durante las ultimas dos semanas.

Lo que llamo mi atencion: Qwen 3.6 Plus saca 78.8 en SWE-bench Verified, cuesta $0.33/M de tokens de entrada, y tiene una ventana de contexto de 1M de tokens. Para referencia, eso lo pone en el mismo rango de rendimiento que modelos que cuestan entre tres y diez veces mas.

Lo que cubre esta guia

  • Cuatro modelos Qwen 3.6: Plus, 27B, 35B-A3B y Max Preview
  • Precios a traves de Alibaba directo, OpenRouter y OpenCode Go
  • Benchmarks: SWE-bench, Terminal-Bench, GPQA y pruebas de agentes
  • Configuracion con Hermes Agent, OpenClaw, OpenCode y Ollama
  • Cual modelo Qwen 3.6 elegir para diferentes tareas

Si aun estas decidiendo entre agentes de codificacion con IA, nuestra guia de configuracion de OpenCode cubre la alternativa open source a Claude Code, y el articulo de alternativas a GitHub Copilot desglosa las opciones despues del cambio de precios del 1 de junio.

La linea Qwen 3.6

Alibaba lanzo cuatro modelos en la serie 3.6. Cada uno apunta a un caso de uso diferente.

ModeloParametrosContextoEntrada $/MSalida $/MLicenciaMejor para
Qwen 3.6 PlusMoE propietario1M$0.33$1.95CerradaCodificacion diaria, agentes
Qwen 3.6 27B27B denso262K~$0.15~$0.60Apache 2.0Codificacion autoalojada
Qwen 3.6 35B-A3B35B total, 3B activos262K~$0.08~$0.30Apache 2.0Autoalojamiento economico
Qwen 3.6 Max Preview~1T MoE262KVariaVariaCerradaMaximo rendimiento

Qwen 3.6 Plus — El que mas uso

Este es el caballo de batalla. $0.33/M de tokens de entrada con una ventana de contexto de 1M. Alibaba lo optimizo especificamente para codificacion agente y desarrollo frontend.

En SWE-bench Verified saca 78.8. En el benchmark Design Arena para trabajo frontend, entra en el top 11% para escenas 3D, top 14% para juegos y top 16% para componentes de UI.

La ventana de 1M de tokens importa para el trabajo de agente. Cuando Hermes u OpenCode esta procesando un repo grande, el modelo necesita mantener la estructura completa del archivo, multiples archivos relacionados y el historial de la conversacion sin perder piezas.

Qwen 3.6 Plus en OpenRouter

Qwen 3.6 27B — Codificacion autoalojada

Un modelo denso de 27 mil millones de parametros bajo Apache 2.0. Si tienes una GPU con 24GB+ de VRAM (o 64GB+ de RAM para inferencia en CPU), puedes ejecutarlo localmente a traves de Ollama y pagar cero por token.

Acepta entrada de texto, imagen y video, tiene una ventana de contexto de 262K e incluye un modo de pensamiento integrado para razonamiento extendido.

Qwen 3.6 35B-A3B — La opcion economica autoalojada

Un modelo MoE con 35B parametros totales pero solo 3B activos por token. Eso significa que funciona rapido con mucho menos hardware que el modelo denso de 27B. Licencia Apache 2.0, contexto nativo de 262K (extensible a 1M via YaRN).

Si quieres autoalojar un modelo de codificacion en un VPS sin GPU, este es el que debes probar. Un modelo con 3B parametros activos puede ejecutarse en hardware solo con CPU a velocidades utilizables.

Qwen 3.6 Max Preview — Maximo rendimiento

El modelo frontera propietario de Alibaba. Alcanzo el numero uno en seis benchmarks de codificacion el 20 de abril de 2026. Aproximadamente 1 billon de parametros totales, 262K de contexto.

Es de pesos cerrados y solo disponible a traves de las APIs de Alibaba Cloud y Qwen Studio. Es el modelo Qwen mas potente pero cuesta mas que la variante Plus. Para la mayoria de casos de uso de agentes de codificacion, Plus es mejor valor.

Comparacion de precios

A traves de OpenRouter

ModeloEntrada $/MSalida $/MCache Read
Qwen 3.6 Plus$0.33$1.95$0.033
Qwen 3.6 35B-A3B~$0.08~$0.30Varia
Qwen 3.6 27B~$0.15~$0.60Varia

El precio efectivo promedio ponderado en OpenRouter para Qwen 3.6 Plus es de unos $0.40/M de entrada y $2.05/M de salida. El precio de lectura de cache de $0.033/M es muy bajo, lo que beneficia los flujos de trabajo de agentes donde el modelo lee repetidamente los mismos archivos del proyecto.

A traves de OpenCode Go

Qwen 3.6 Plus y Qwen 3.5 Plus estan incluidos en OpenCode Go a $10/mes. A ese precio, Qwen 3.6 Plus te da un estimado de 3,300 solicitudes por 5 horas y 16,300 solicitudes por mes.

Benchmarks

Rendimiento de codificacion

BenchmarkQwen 3.6 PlusQwen 3.6 Max Preview
SWE-bench Verified78.8%#1 (multiples benchmarks)
SWE-bench Pro#1
Terminal-Bench 2.0#1

Design Arena (frontend)

CategoriaQwen 3.6 Plus EloRanking
3D1321Top 11%
Categorias de Codigo1292Top 14%
Desarrollo de Juegos1293Top 14%
Componente UI1301Top 16%
Sitio Web1274Top 19%
SVG1249Top 16%
Visualizacion de Datos1270Top 18%

Configurar Qwen 3.6 con tus agentes

Hermes Agent

# Via OpenRouter (recomendado)
hermes config set model qwen/qwen3.6-plus
echo "OPENROUTER_API_KEY=your-key" >> ~/.hermes/.env

OpenCode

/connect
# Seleccionar OpenRouter o OpenCode Go

Luego /models para elegir Qwen 3.6 Plus.

OpenClaw

Edita tu configuracion:

{
  "agents": {
    "defaults": {
      "model": {
        "primary": "qwen/qwen3.6-plus",
        "fallback": ["minimax/minimax-m2.7"]
      }
    }
  }
}

Ollama (para autoalojar 27B o 35B-A3B)

ollama pull qwen3.6:27b
# O la variante MoE
ollama pull qwen3.6:35b-a3b

Luego configura tu agente para usar el endpoint local de Ollama. Consulta nuestra guia de Ollama con Docker para la configuracion.

Cual modelo Qwen 3.6 deberias elegir?

Codificacion diaria con agente: Qwen 3.6 Plus. El precio de $0.33/M de entrada, contexto de 1M y fuerte puntuacion en SWE-bench lo convierten en la opcion por defecto.

Autoalojamiento con GPU: Qwen 3.6 27B. Licencia Apache 2.0, 262K de contexto, fuerte rendimiento.

Autoalojamiento economico: Qwen 3.6 35B-A3B. Solo 3B parametros activos significa que funciona en hardware modesto.

Maxima precision sin importar el costo: Qwen 3.6 Max Preview. Numero uno en seis benchmarks de codificacion.

No quieres elegir: OpenCode Go incluye Qwen 3.6 Plus y Qwen 3.5 Plus a $10/mes. Consulta la guía de OpenCode Go para limites y benchmarks.

Qwen 3.6 vs la competencia

CaracteristicaQwen 3.6 PlusMiniMax M2.7GLM 5.1DeepSeek V4 Pro
Entrada $/M$0.33$0.30$1.05$0.435
Salida $/M$1.95$1.20$3.50$0.87
Contexto1M196K200K1M
SWE-bench Verified78.8%
Diseno/frontendFuertePromedioPromedioPromedio

Qwen 3.6 Plus se situa entre MiniMax M2.7 y GLM 5.1 en precio. Su contexto de 1M iguala a DeepSeek V4 Pro. Donde destaca es en trabajo de frontend y UI — los rankings de Design Arena son significativamente mas fuertes que cualquier otro modelo a este precio.

Para codificacion de backend y sistemas, GLM 5.1 sigue teniendo la ventaja. Para la opcion mas barata, MiniMax M2.7 a $0.30/M de entrada es dificil de superar.

Guias relacionadas

Preguntas frecuentes

Qwen 3.6 Plus es gratis en algun lugar?

OpenRouter ofrece un tier gratuito para Qwen 3.6 Plus con limites de tasa. OpenCode Go ($10/mes) lo incluye sin cargos por token hasta el limite mensual de uso. Directamente de Alibaba, no hay tier gratuito pero el precio por token es competitivo.

Puedo ejecutar Qwen 3.6 localmente?

Si. Qwen 3.6 27B y Qwen 3.6 35B-A3B son modelos de pesos abiertos bajo Apache 2.0. El modelo denso de 27B necesita una GPU de 24GB o 64GB+ de RAM. El modelo MoE de 35B-A3B tiene solo 3B parametros activos y funciona con mucho menos. Descargalos con Ollama: ollama pull qwen3.6:27b o ollama pull qwen3.6:35b-a3b.

Como se compara Qwen 3.6 Plus con Claude Sonnet?

Qwen 3.6 Plus cuesta $0.33/M de entrada frente a Claude Sonnet a unos $3/M de entrada. Eso es unas 9 veces mas barato. En benchmarks de codificacion, Qwen 3.6 Plus saca 78.8% en SWE-bench Verified. Claude Sonnet saca mas en algunos benchmarks, pero por la diferencia de precio, Qwen 3.6 Plus es mejor valor para la mayoria de tareas de codificacion.

Que hay de Qwen 3.6 Max Preview?

Qwen 3.6 Max Preview es el modelo mas potente de Alibaba, alcanzando el numero uno en seis benchmarks de codificacion. Es de pesos cerrados y solo disponible a traves de APIs de Alibaba Cloud y Qwen Studio. Para la mayoria de desarrolladores, Plus es mejor para uso diario. Usa Max Preview cuando necesites maxima precision en un problema dificil especifico.

Qwen 3.6 funciona con servidores MCP?

Si. Qwen 3.6 Plus soporta llamadas a funciones y salida estructurada, que es lo que los servidores MCP usan bajo el capo. Cuando conectas servidores MCP a traves de OpenCode, Hermes Agent u OpenClaw, Qwen 3.6 Plus maneja las llamadas a herramientas como cualquier otro modelo compatible.

Para mas comparaciones de modelos y guias de configuracion de agentes de IA, consulta nuestra categoria de herramientas de IA y el resumen de alternativas a OpenClaw.