Forbes Ecuador
ia corriendo inteligencia artificial
Innovacion

Por qué GPT-5 no es solo una versión mejorada y qué significa para la batalla por la supremacía tecnológica

Ron Schmelzer

Share

El nuevo modelo de OpenAI no solo sube la apuesta técnica, también desafía el equilibrio entre velocidad, precisión y costo, en una carrera global donde cada mejora redefine quién lidera y quién queda atrás.

11 Agosto de 2025 14.00

OpenAI lanzó su nuevo modelo GPT-5 y ya está dando que hablar en el mundo de la inteligencia artificial. No se trata solo de una mejora más: la empresa busca que este sistema combine razonamiento, funciones multimodales, eficiencia en costos y facilidad de uso.

Sam Altman, CEO de la compañía, aseguró que GPT-5 "representa un paso significativo hacia la inteligencia artificial general" y lo describió como el modelo "más inteligente, rápido y útil" hasta ahora. Para explicar la diferencia con la versión anterior, lo comparó con el salto de un recién graduado a alguien con doctorado.

El lanzamiento llega en un contexto de fuerte competencia. Google, Anthropic, DeepSeek, xAI y otras firmas sacan modelos a ritmo acelerado, todos con promesas de más inteligencia, mayor velocidad o menores costos.

Pero, ¿qué implica realmente tener a disposición un experto con doctorado para tareas personales o de trabajo, gracias a la inteligencia artificial? La comparación que hizo Altman no es menor. Habla de un salto en la capacidad del modelo para entender, razonar y resolver problemas complejos con una precisión mucho mayor que antes.

En términos concretos, esto puede traducirse en asistentes virtuales mucho más eficientes, herramientas de análisis que entienden mejor el contexto y una automatización más fina de tareas que antes requerían intervención humana constante.

El impacto para el mercado es claro. No solo porque empuja la vara tecnológica más arriba, sino porque obliga al resto de las empresas a acelerar sus desarrollos. La inteligencia artificial ya no es una promesa futura: es una herramienta que se vuelve más poderosa y accesible cada vez que aparece una nueva versión como esta.

Qué trae GPT-5 bajo el brazo

La gran apuesta de OpenAI con este nuevo modelo es la integración. A diferencia de versiones anteriores como GPT-4, GPT-4o y otros motores de razonamiento de la serie o, GPT-5 concentra todo en una sola arquitectura capaz de adaptarse sola a cada tarea. Esta decisión busca simplificarle la vida a los desarrolladores, que ya no tienen que elegir entre distintos modelos para cada necesidad.

Además, garantiza un rendimiento más parejo y permite que el sistema use los recursos de forma más eficiente. Si el problema es complejo, el modelo profundiza. Si se trata de algo más liviano, responde sin consumir de más.

El diseño unificado no se limita a reordenar lo que ya existía. En el centro de esta nueva estructura hay componentes clave que hacen la diferencia. El núcleo se llama GPT-5-main. Es el encargado de manejar la mayoría de las consultas generales y charlas con usuarios. Está pensado para ser rápido y eficiente. En pruebas propias, puedo decir que responde mucho más ágil que las versiones anteriores.

Por otro lado, aparece el componente de pensamiento GPT-5. Está preparado para resolver problemas complejos que exigen lógica de varios pasos y análisis en profundidad. Es una evolución clara respecto a las series o3 y o4, con un foco más preciso en desafíos que requieren mayor elaboración.

Además, GPT-5 incorpora una capa interna que toma decisiones en tiempo real para elegir qué variante del modelo usar según la consulta. Evalúa la complejidad, qué herramientas se necesitan y hasta las preferencias del usuario. Con este enrutador automático, ya no hace falta que uno elija entre un "modo rápido" o un "modo de razonamiento". El sistema decide solo, lo que simplifica la experiencia, sobre todo para quienes no tienen conocimientos técnicos, y evita gastar recursos de más en preguntas simples.

Chat GPT
GPT-5 concentra todo en una sola arquitectura capaz de adaptarse sola a cada tarea.

Aunque el enrutador apunta a simplificar las decisiones sobre qué modelo usar, GPT-5 sigue ofreciendo un abanico de variantes escalonadas para el uso público. La versión Estándar está pensada para tareas complejas y de uso general, con un nivel completo de razonamiento. GPT-5 Mini, en cambio, apunta a respuestas muy rápidas, ideal para asistentes virtuales o atención al cliente en tiempo real. Más chico todavía, GPT-5 Nano está optimizado para operar a alta velocidad y bajo costo, pensado para tareas de gran volumen y sensibles al presupuesto.

También está disponible GPT-5 Chat, que permite conversaciones multimodales de varios turnos, y GPT-5 Pro, una versión premium con procesamiento profundo, orientada a usos educativos, empresariales y de mayor escala.

Todos estos modelos pueden trabajar con contextos más amplios. Aceptan entradas de hasta 400.000 tokens y pueden generar salidas de hasta 128.000 tokens. En el caso de Chat, la entrada llega hasta los 128.000 tokens, lo que permite mantener hilos de conversación extensos.

Si bien el enrutador interno ayuda a tomar decisiones automáticas en muchos casos, la cantidad de opciones sigue siendo suficiente como para generar cierta confusión entre algunos usuarios.

¿Funciona el modelo?

Claro, todas estas mejoras no significan nada si el rendimiento cae frente a versiones anteriores. Por eso, OpenAI se encargó de mostrar que GPT-5 está a la altura.

En matemáticas, el modelo alcanzó una precisión del 100 % en la competencia AIME 2025 usando herramientas de Python. Sin esas herramientas, en modo de pensamiento, pasó del 71 % al 99,6 %. En ciencias, respondió correctamente el 85,7 % de las preguntas del GPQA —a nivel de doctorado— y subió al 89,4 % con apoyo de Python. GPT-4o, en comparación, quedó bastante atrás, con un 70,1 %.

En codificación, los avances también son fuertes. En el benchmark SWE-bench Verified, GPT-5 llegó al 74,9 % en modo de pensamiento, más del doble del 30,8 % que logró GPT-4o. Y en pruebas con varios lenguajes de programación (Aider Polyglot), alcanzó el 88 %, un salto de más del 60 % gracias al razonamiento activo.

Sobre confiabilidad, si bien todavía hay margen de mejora, los datos muestran avances claros. Las tasas de alucinaciones bajaron a menos del 1 % en indicaciones abiertas y a 1,6 % en casos médicos complejos. Además, los errores en tareas de tráfico cayeron del 11,6 % al 4,8 % usando el modo de pensamiento.

Desde el lado del comportamiento, uno de los puntos que más se vigila es la llamada "adulación", cuando los modelos responden con halagos exagerados o con un tono demasiado empalagoso. Según OpenAI, GPT-5 logró reducir ese tipo de respuestas entre un 69 % y un 75 % en comparación con GPT-4o. También bajó la tasa de engaños: pasó del 4,8 % que tenía la versión o3 al 2,1 %.

Cómo se compara GPT-5 con el resto del mercado

La competencia en inteligencia artificial no afloja. Google tiene en marcha nuevas actualizaciones y su modelo Gemini 2.5 Pro encabeza el ranking de LMArena desde agosto de 2025. También ofrece un modo agente para desarrolladores y ventanas de contexto que llegan al millón de tokens, con la promesa de duplicar esa cifra. Sin embargo, en pruebas como SWE-bench, el rendimiento queda por debajo: marca un 63,8 %, mientras que GPT-5 y Claude 4.1 lo superan.

Anthropic sigue mejorando su modelo Claude, que muestra buenos resultados en programación y conversaciones. Sus puntos fuertes están en tareas de horizonte largo, con memoria más sólida y capacidad para búsquedas agénticas. Aunque una pelea con OpenAI por el acceso a la API dejó en evidencia la tensión que hay entre las grandes compañías por las capacidades de sus modelos.

Los modelos chinos de DeepSeek también están ganando terreno y metiendo presión. Son completamente open source bajo licencia MIT, y destacan por su bajo costo: solo US$ 0,07 por millón de tokens de entrada. En rendimiento, son competitivos en MMLU-Pro (81,2) y obtienen buenos resultados en GPQA Diamond y AIME 2024. Sin embargo, hay críticas sobre sus medidas de seguridad y persisten dudas sobre su origen y posibles usos.

Por su parte, xAI asegura que su modelo Grok 4 supera a GPT-5. Pero evaluaciones independientes muestran que rinde casi igual en programación y queda un escalón abajo en razonamiento complejo. De todos modos, se destaca en tareas de codificación, razonamiento avanzado, uso de datos en tiempo real y maneja una ventana de contexto amplia. También puede generar audio de voz de alta calidad, lo que lo hace ideal para herramientas basadas en voz.

Al mismo tiempo, empieza a crecer una camada de modelos alternativos y de código abierto que va a obligar a los grandes jugadores a mantenerse atentos, incluso si tienen más visibilidad y mayor presupuesto.

El precio como arma de competencia

OpenAI busca ganar terreno también por el lado de los costos. Los nuevos precios de GPT-5 apuntan directamente a superar tanto a los modelos cerrados como a los de código abierto. La versión estándar cuesta US$ 1,25 por millón de tokens de entrada y US$ 10 por millón de salida. La opción Mini baja a US$ 0,25 por entrada y US$ 2 por salida, y la versión Nano lleva la pelea al mínimo: US$ 0,05 por entrada y US$ 0,40 por salida. Además, ofrecen un 90 % de descuento en tokens almacenados en caché para chats.

Si se los compara con los US$ 2,50 de entrada y US$ 10 de salida de GPT-4o, o los US$ 0,55 y US$ 2,19 de DeepSeek R1, el nivel Nano marca una diferencia clave. Para quienes desarrollan a gran escala, esto puede ser el punto que separa a la IA como experimento puntual de su integración como herramienta diaria en el flujo de trabajo.

Un dato llamativo de esta nueva versión es que parte del entrenamiento se hizo con datos sintéticos generados por el modelo o3 de la propia OpenAI. Eso permite crear grandes volúmenes de datos específicos sin depender del etiquetado manual, que suele ser costoso y sesgado.

Bien manejado, este enfoque podría acelerar el desarrollo y darle a la empresa una ventaja cada vez mayor. Pero si el proceso no se controla con cuidado, el riesgo es alto: puede llevar a que el modelo se deteriore o amplifique sesgos, lo que deja claro que avanzar más rápido no siempre significa avanzar mejor.

¿Qué implica esto para empresas y startups?

Con una arquitectura unificada, mejoras en seguridad y una estructura de precios más competitiva, OpenAI quiere que GPT-5 funcione en entornos de producción reales. En el comunicado oficial y los documentos que lo acompañan, la compañía destaca varios usos concretos.

En el mundo legal, promete analizar décadas de jurisprudencia con razonamientos claros en cuestión de minutos. Para el sector financiero, apunta a modelar escenarios de mercado en tiempo real a bajo costo. También pisa fuerte en atención al cliente, con agentes de inteligencia artificial que manejan texto, voz e imágenes en múltiples idiomas.

En desarrollo de software, GPT-5 acelera todavía más los procesos. Puede generar aplicaciones completas desde cero, con documentación, pruebas y scripts de implementación incluidos.

Para las empresas, las ventajas están a la vista. Pero el interrogante es otro: ¿hay margen para que una startup logre crecer en este escenario? ¿Queda espacio para jugadores nuevos?

chat gpt palo alto - pexels
Lo que viene es claro: un ritmo de actualizaciones y mejoras que no va a frenar. 

El negocio de entrenar modelos grandes ya mueve miles de millones de dólares, aunque todavía hay oportunidades. Una de ellas es para los que trabajan en modelos más enfocados, capaces de adaptarse a sectores con regulaciones estrictas o necesidades específicas.

También hay lugar para quienes desarrollan nuevas formas de interactuar con la IA: asistentes de voz, integraciones con realidad virtual o aumentada y tableros adaptados a industrias puntuales.

A eso se suman los negocios que se pueden construir sobre IA. Así como Internet cambió todos los sectores, la inteligencia artificial está mostrando su potencial para transformar cualquier industria que uno pueda imaginar.

Quienes tienen datos valiosos también están en una buena posición. Los conjuntos de datos únicos pueden ser la clave para ajustar modelos con una precisión difícil de igualar. Y lo mismo vale para quienes ofrecen infraestructura: monitoreo, herramientas de cumplimiento o sistemas para implementar IA a gran escala de forma segura.

Como pasó con la nube, los gigantes controlan la base. Pero en esa larga lista de servicios más especializados, las startups todavía tienen mucho margen para crecer.

¿Qué viene después?

Hoy, tener el "mejor modelo" ya no alcanza. La competencia se mide en múltiples frentes: precisión, razonamiento, velocidad, costos, seguridad e integración con otras herramientas. GPT-5 marca la diferencia en varias de esas categorías, pero no es el único. Google ofrece un ecosistema sólido, Anthropic destaca en capacidades específicas, DeepSeek se posiciona con precios bajos y otros modelos ganan puntos por su velocidad. Cada empresa elige según sus propias necesidades. Ya no importa tanto el promedio en los benchmarks, sino qué modelo resuelve mejor cada caso puntual.

Con GPT-5, OpenAI no apunta solo a una mejora técnica. Busca que la inteligencia artificial pueda usarse con confianza en tareas de alto riesgo, como diagnósticos médicos, auditorías legales o reescritura masiva de código, sin depender todo el tiempo del control humano.

Lo que viene es claro: un ritmo de actualizaciones y mejoras que no va a frenar. En muchos aspectos, los desarrolladores de modelos ya corren por delante de la demanda real. Y esa carrera apenas empieza.

 

Nota publicada por Forbes US

 

 

10