GPT-5 explicado (2025): qué es, cómo funciona GPT-5 Thinking, precios, API y diferencias vs. GPT-4o y o3 (Guía completa)

🌟 Introducción: el nuevo “default” de ChatGPT
OpenAI presentó GPT-5, un salto claro en utilidad real: razona más cuando hace falta y responde rápido cuando no. Es el modelo predeterminado en ChatGPT (despliegue para Free/Plus/Pro/Team en marcha; Enterprise/Edu viene después). Además, con razonamiento activo (“Thinking”) reduce alucinaciones y conductas engañosas frente a modelos previos.
🔍 ¿Qué es exactamente GPT-5?
Un sistema unificado con enrutador en tiempo real. GPT-5 reúne:
- un modelo rápido para la mayoría de consultas,
- un modelo de razonamiento profundo (GPT-5 Thinking) para problemas difíciles,
- y un router que decide cuál usar según la complejidad, el uso de herramientas y tu intención (si pides “piensa a fondo”, lo tiene en cuenta).
En ChatGPT, el cambio entre modo Chat y Thinking es automático; en planes de pago puedes forzarlo desde el selector. La Voz de ChatGPT, por ahora, sigue montada en GPT-4o.
🧠 Rendimiento: números que importan
- AIME 2025 (sin herramientas): 94.6%
- SWE-bench Verified (código real): 74.9%
- Aider polyglot (edición de código): 88%
- MMMU (multimodal): 84.2%
- HealthBench Hard (salud): 46.2%
- GPQA (GPT-5 Pro, sin herramientas): 88.4% (SOTA)
En producción, con búsqueda web en prompts reales, GPT-5 tiene ~45% menos errores factuales que GPT-4o y, pensando, comete ~80% menos que OpenAI o3.
🧩 Para developers: tamaños, precios y parámetros nuevos
Tamaños API: gpt-5
, gpt-5-mini
, gpt-5-nano
.
Parámetros clave:
reasoning_effort
(incluye minimal para latencia baja),verbosity
(low
/medium
/high
) para controlar extensión,- Custom tools (entrada en texto con gramáticas, además de JSON),
- Preambles antes/entre tool calls para UX de agentes.
Precios (API):
gpt-5
→ $1.25/1M tokens input, $10/1M outputgpt-5-mini
→ $0.25/1M input, $2/1M outputgpt-5-nano
→ $0.05/1M input, $0.40/1M output
Contexto: hasta 400K tokens y 128K de salida máxima.
Nota: En ChatGPT usas un sistema auto-switch; en la API apuntas directamente al modelo de razonamiento (
gpt-5
) o sus variantes, y tienes el “minimal reasoning” para reducir latencia.
🛡️ Seguridad: de “rechazar” a respuestas seguras
Con GPT-5 llega safe-completions, un entrenamiento centrado en la salida: prioriza ser útil dentro de límites de seguridad (p. ej. bio/ciberseguridad).
Además, la System Card describe que GPT-5 Thinking se trata como Alta capacidad en bio/química bajo el Preparedness Framework, con salvaguardas en capas (clasificadores, monitores de razonamiento y revisión).
En pruebas internas, GPT-5 disminuye “decepción” (admitir límites cuando la tarea es imposible o carece de datos).
📦 Disponibilidad en ChatGPT
- GPT-5 es el nuevo default para usuarios con sesión iniciada.
- Modelos retirados al lanzar GPT-5: GPT-4o, GPT-4.1, GPT-4.5, o4-mini, o3, o3-pro, etc. Abrir chats antiguos migra a equivalentes GPT-5 (p. ej., o3 → GPT-5-Thinking).
- Voz: sigue en GPT-4o por ahora.
- Límites: el Free pasa a GPT-5-mini al agotar cupo; Plus/Pro tienen cuotas más generosas; Pro accede a GPT-5 Pro.
⚖️ Qué elegir y cuándo (rápido)
Modelo | Dónde destaca | Cuándo elegirlo |
---|---|---|
GPT-5 | Escritura, análisis, código, visión; menos alucinaciones; mejor seguimiento de instrucciones | Uso diario con calidad alta y razonamiento cuando conviene |
GPT-5 Thinking | Problemas complejos que requieren pasos y verificaciones | Pedidos “duros” (ciencia, bugs esquivos, informes largos); puedes forzarlo |
GPT-5 Pro | Razonamiento extendido (SOTA en GPQA) | Tareas críticas donde priorizas exactitud sobre latencia |
GPT-5 Mini/Nano | Coste/latencia menores | Integraciones y volúmenes altos con muy buena calidad |
GPT-4o (voz) | Experiencia de voz | Chats por voz (transitorio, mientras se migra la voz) |
🚀 Casos de uso que brillan
- Frontend y apps en una pasada (mejor “buen gusto” en UI/espaciado/typography).
- Agentes con herramientas: encadena docenas de tool calls (secuenciales/paralelos) con menos errores; 96.7% en τ²-bench telecom.
- Trabajo empresarial: mayor exactitud/razonamiento en análisis, documentación, soporte y decisiones.
🛠️ Recomendaciones prácticas
- Latencia primero →
reasoning_effort: "minimal"
o usa mini/nano. - Controla la extensión →
verbosity
(low
/high
). - Agentes más previsibles → usa preambles y define gramáticas en custom tools.
✅ Conclusión
GPT-5 no es “un modelo más”: es un sistema que decide cuándo pensar a fondo, mejora factualidad, reduce “decepción” y añade controles útiles para developers. Para empresas y devs, esto se traduce en menos prompts frágiles, agentes más estables y mejores resultados en lo que hacemos a diario: escribir, programar, investigar y decidir.
Dato curioso: este artículo fue generado en su mayoría por GPT-5 Thinking
📚 Fuentes
- OpenAI — Introducing GPT-5 (benchmarks, factualidad, sistema unificado, deprecaciones, disponibilidad) → https://openai.com/index/introducing-gpt-5/
- OpenAI — Introducing GPT-5 for developers (precios API,
reasoning_effort
,verbosity
, custom tools, τ²-bench, tablas de evals) → https://openai.com/index/introducing-gpt-5-for-developers - OpenAI — GPT-5 is here (landing con 400K de contexto, 128K output, precios visibles) → https://openai.com/gpt-5/
- OpenAI Help Center — GPT-5 in ChatGPT (auto-switch, selector de Thinking, voz en GPT-4o, deprecaciones) → https://help.openai.com/en/articles/11909943-gpt-5-in-chatgpt
- OpenAI — From hard refusals to safe-completions (paper y explicación del entrenamiento de seguridad en GPT-5) → https://openai.com/index/gpt-5-safe-completions/ | PDF: https://cdn.openai.com/pdf/be60c07b-6bc2-4f54-bcee-4141e1d6c69a/gpt-5-safe_completions.pdf
- OpenAI — GPT-5 System Card (router, evaluación de riesgos, salvaguardas y métricas de alucinación/decepción) → https://openai.com/index/gpt-5-system-card/ | PDF: https://cdn.openai.com/pdf/8124a3ce-ab78-4f06-96eb-49ea29ffb52f/gpt5-system-card-aug7.pdf