GPT-5 explicado (2025): qué es, cómo funciona GPT-5 Thinking, precios, API y diferencias vs. GPT-4o y o3 (Guía completa)

GPT-5 explicado (2025): qué es, cómo funciona GPT-5 Thinking, precios, API y diferencias vs. GPT-4o y o3 (Guía completa)

🌟 Introducción: el nuevo “default” de ChatGPT

OpenAI presentó GPT-5, un salto claro en utilidad real: razona más cuando hace falta y responde rápido cuando no. Es el modelo predeterminado en ChatGPT (despliegue para Free/Plus/Pro/Team en marcha; Enterprise/Edu viene después). Además, con razonamiento activo (“Thinking”) reduce alucinaciones y conductas engañosas frente a modelos previos.


🔍 ¿Qué es exactamente GPT-5?

Un sistema unificado con enrutador en tiempo real. GPT-5 reúne:

  • un modelo rápido para la mayoría de consultas,
  • un modelo de razonamiento profundo (GPT-5 Thinking) para problemas difíciles,
  • y un router que decide cuál usar según la complejidad, el uso de herramientas y tu intención (si pides “piensa a fondo”, lo tiene en cuenta).

En ChatGPT, el cambio entre modo Chat y Thinking es automático; en planes de pago puedes forzarlo desde el selector. La Voz de ChatGPT, por ahora, sigue montada en GPT-4o.


🧠 Rendimiento: números que importan

  • AIME 2025 (sin herramientas): 94.6%
  • SWE-bench Verified (código real): 74.9%
  • Aider polyglot (edición de código): 88%
  • MMMU (multimodal): 84.2%
  • HealthBench Hard (salud): 46.2%
  • GPQA (GPT-5 Pro, sin herramientas): 88.4% (SOTA)

En producción, con búsqueda web en prompts reales, GPT-5 tiene ~45% menos errores factuales que GPT-4o y, pensando, comete ~80% menos que OpenAI o3.


🧩 Para developers: tamaños, precios y parámetros nuevos

Tamaños API: gpt-5, gpt-5-mini, gpt-5-nano.
Parámetros clave:

  • reasoning_effort (incluye minimal para latencia baja),
  • verbosity (low/medium/high) para controlar extensión,
  • Custom tools (entrada en texto con gramáticas, además de JSON),
  • Preambles antes/entre tool calls para UX de agentes.

Precios (API):

  • gpt-5$1.25/1M tokens input, $10/1M output
  • gpt-5-mini$0.25/1M input, $2/1M output
  • gpt-5-nano$0.05/1M input, $0.40/1M output

Contexto: hasta 400K tokens y 128K de salida máxima.

Nota: En ChatGPT usas un sistema auto-switch; en la API apuntas directamente al modelo de razonamiento (gpt-5) o sus variantes, y tienes el “minimal reasoning” para reducir latencia.


🛡️ Seguridad: de “rechazar” a respuestas seguras

Con GPT-5 llega safe-completions, un entrenamiento centrado en la salida: prioriza ser útil dentro de límites de seguridad (p. ej. bio/ciberseguridad).
Además, la System Card describe que GPT-5 Thinking se trata como Alta capacidad en bio/química bajo el Preparedness Framework, con salvaguardas en capas (clasificadores, monitores de razonamiento y revisión).
En pruebas internas, GPT-5 disminuye “decepción” (admitir límites cuando la tarea es imposible o carece de datos).


📦 Disponibilidad en ChatGPT

  • GPT-5 es el nuevo default para usuarios con sesión iniciada.
  • Modelos retirados al lanzar GPT-5: GPT-4o, GPT-4.1, GPT-4.5, o4-mini, o3, o3-pro, etc. Abrir chats antiguos migra a equivalentes GPT-5 (p. ej., o3 → GPT-5-Thinking).
  • Voz: sigue en GPT-4o por ahora.
  • Límites: el Free pasa a GPT-5-mini al agotar cupo; Plus/Pro tienen cuotas más generosas; Pro accede a GPT-5 Pro.

⚖️ Qué elegir y cuándo (rápido)

Modelo Dónde destaca Cuándo elegirlo
GPT-5 Escritura, análisis, código, visión; menos alucinaciones; mejor seguimiento de instrucciones Uso diario con calidad alta y razonamiento cuando conviene
GPT-5 Thinking Problemas complejos que requieren pasos y verificaciones Pedidos “duros” (ciencia, bugs esquivos, informes largos); puedes forzarlo
GPT-5 Pro Razonamiento extendido (SOTA en GPQA) Tareas críticas donde priorizas exactitud sobre latencia
GPT-5 Mini/Nano Coste/latencia menores Integraciones y volúmenes altos con muy buena calidad
GPT-4o (voz) Experiencia de voz Chats por voz (transitorio, mientras se migra la voz)

🚀 Casos de uso que brillan

  • Frontend y apps en una pasada (mejor “buen gusto” en UI/espaciado/typography).
  • Agentes con herramientas: encadena docenas de tool calls (secuenciales/paralelos) con menos errores; 96.7% en τ²-bench telecom.
  • Trabajo empresarial: mayor exactitud/razonamiento en análisis, documentación, soporte y decisiones.

🛠️ Recomendaciones prácticas

  • Latencia primeroreasoning_effort: "minimal" o usa mini/nano.
  • Controla la extensiónverbosity (low/high).
  • Agentes más previsibles → usa preambles y define gramáticas en custom tools.

✅ Conclusión

GPT-5 no es “un modelo más”: es un sistema que decide cuándo pensar a fondo, mejora factualidad, reduce “decepción” y añade controles útiles para developers. Para empresas y devs, esto se traduce en menos prompts frágiles, agentes más estables y mejores resultados en lo que hacemos a diario: escribir, programar, investigar y decidir.


Dato curioso: este artículo fue generado en su mayoría por GPT-5 Thinking

📚 Fuentes

Read more