GPT-5 explicado (2025): qué es, cómo funciona GPT-5 Thinking, precios, API y diferencias vs. GPT-4o y o3 (Guía completa)

Salvador Alcázar

08 ago. 2025 — 3 min read

🌟 Introducción: el nuevo “default” de ChatGPT

OpenAI presentó GPT-5, un salto claro en utilidad real: razona más cuando hace falta y responde rápido cuando no. Es el modelo predeterminado en ChatGPT (despliegue para Free/Plus/Pro/Team en marcha; Enterprise/Edu viene después). Además, con razonamiento activo (“Thinking”) reduce alucinaciones y conductas engañosas frente a modelos previos.

🔍 ¿Qué es exactamente GPT-5?

Un sistema unificado con enrutador en tiempo real. GPT-5 reúne:

un modelo rápido para la mayoría de consultas,
un modelo de razonamiento profundo (GPT-5 Thinking) para problemas difíciles,
y un router que decide cuál usar según la complejidad, el uso de herramientas y tu intención (si pides “piensa a fondo”, lo tiene en cuenta).

En ChatGPT, el cambio entre modo Chat y Thinking es automático; en planes de pago puedes forzarlo desde el selector. La Voz de ChatGPT, por ahora, sigue montada en GPT-4o.

🧠 Rendimiento: números que importan

AIME 2025 (sin herramientas): 94.6%
SWE-bench Verified (código real): 74.9%
Aider polyglot (edición de código): 88%
MMMU (multimodal): 84.2%
HealthBench Hard (salud): 46.2%
GPQA (GPT-5 Pro, sin herramientas): 88.4% (SOTA)

En producción, con búsqueda web en prompts reales, GPT-5 tiene ~45% menos errores factuales que GPT-4o y, pensando, comete ~80% menos que OpenAI o3.

🧩 Para developers: tamaños, precios y parámetros nuevos

Tamaños API: gpt-5, gpt-5-mini, gpt-5-nano.
Parámetros clave:

reasoning_effort (incluye minimal para latencia baja),
verbosity (low/medium/high) para controlar extensión,
Custom tools (entrada en texto con gramáticas, además de JSON),
Preambles antes/entre tool calls para UX de agentes.

Precios (API):

gpt-5 → $1.25/1M tokens input, $10/1M output
gpt-5-mini → $0.25/1M input, $2/1M output
gpt-5-nano → $0.05/1M input, $0.40/1M output

Contexto: hasta 400K tokens y 128K de salida máxima.

Nota: En ChatGPT usas un sistema auto-switch; en la API apuntas directamente al modelo de razonamiento (gpt-5) o sus variantes, y tienes el “minimal reasoning” para reducir latencia.

🛡️ Seguridad: de “rechazar” a respuestas seguras

Con GPT-5 llega safe-completions, un entrenamiento centrado en la salida: prioriza ser útil dentro de límites de seguridad (p. ej. bio/ciberseguridad).
Además, la System Card describe que GPT-5 Thinking se trata como Alta capacidad en bio/química bajo el Preparedness Framework, con salvaguardas en capas (clasificadores, monitores de razonamiento y revisión).
En pruebas internas, GPT-5 disminuye “decepción” (admitir límites cuando la tarea es imposible o carece de datos).

📦 Disponibilidad en ChatGPT

GPT-5 es el nuevo default para usuarios con sesión iniciada.
Modelos retirados al lanzar GPT-5: GPT-4o, GPT-4.1, GPT-4.5, o4-mini, o3, o3-pro, etc. Abrir chats antiguos migra a equivalentes GPT-5 (p. ej., o3 → GPT-5-Thinking).
Voz: sigue en GPT-4o por ahora.
Límites: el Free pasa a GPT-5-mini al agotar cupo; Plus/Pro tienen cuotas más generosas; Pro accede a GPT-5 Pro.

⚖️ Qué elegir y cuándo (rápido)

Modelo	Dónde destaca	Cuándo elegirlo
GPT-5	Escritura, análisis, código, visión; menos alucinaciones; mejor seguimiento de instrucciones	Uso diario con calidad alta y razonamiento cuando conviene
GPT-5 Thinking	Problemas complejos que requieren pasos y verificaciones	Pedidos “duros” (ciencia, bugs esquivos, informes largos); puedes forzarlo
GPT-5 Pro	Razonamiento extendido (SOTA en GPQA)	Tareas críticas donde priorizas exactitud sobre latencia
GPT-5 Mini/Nano	Coste/latencia menores	Integraciones y volúmenes altos con muy buena calidad
GPT-4o (voz)	Experiencia de voz	Chats por voz (transitorio, mientras se migra la voz)

🚀 Casos de uso que brillan

Frontend y apps en una pasada (mejor “buen gusto” en UI/espaciado/typography).
Agentes con herramientas: encadena docenas de tool calls (secuenciales/paralelos) con menos errores; 96.7% en τ²-bench telecom.
Trabajo empresarial: mayor exactitud/razonamiento en análisis, documentación, soporte y decisiones.

🛠️ Recomendaciones prácticas

Latencia primero → reasoning_effort: "minimal" o usa mini/nano.
Controla la extensión → verbosity (low/high).
Agentes más previsibles → usa preambles y define gramáticas en custom tools.

✅ Conclusión

GPT-5 no es “un modelo más”: es un sistema que decide cuándo pensar a fondo, mejora factualidad, reduce “decepción” y añade controles útiles para developers. Para empresas y devs, esto se traduce en menos prompts frágiles, agentes más estables y mejores resultados en lo que hacemos a diario: escribir, programar, investigar y decidir.

Dato curioso: este artículo fue generado en su mayoría por GPT-5 Thinking

📚 Fuentes

OpenAI — Introducing GPT-5 (benchmarks, factualidad, sistema unificado, deprecaciones, disponibilidad) → https://openai.com/index/introducing-gpt-5/
OpenAI — Introducing GPT-5 for developers (precios API, reasoning_effort, verbosity, custom tools, τ²-bench, tablas de evals) → https://openai.com/index/introducing-gpt-5-for-developers
OpenAI — GPT-5 is here (landing con 400K de contexto, 128K output, precios visibles) → https://openai.com/gpt-5/
OpenAI Help Center — GPT-5 in ChatGPT (auto-switch, selector de Thinking, voz en GPT-4o, deprecaciones) → https://help.openai.com/en/articles/11909943-gpt-5-in-chatgpt
OpenAI — From hard refusals to safe-completions (paper y explicación del entrenamiento de seguridad en GPT-5) → https://openai.com/index/gpt-5-safe-completions/ | PDF: https://cdn.openai.com/pdf/be60c07b-6bc2-4f54-bcee-4141e1d6c69a/gpt-5-safe_completions.pdf
OpenAI — GPT-5 System Card (router, evaluación de riesgos, salvaguardas y métricas de alucinación/decepción) → https://openai.com/index/gpt-5-system-card/ | PDF: https://cdn.openai.com/pdf/8124a3ce-ab78-4f06-96eb-49ea29ffb52f/gpt5-system-card-aug7.pdf