OpenAI amplía su oferta con dos versiones compactas de su familia GPT-5.4 pensadas para quienes necesitan respuestas rápidas, consumo eficiente y costes más contenidos. Estas variantes buscan equilibrar potencia y economía: prometen menor latencia sin sacrificar las capacidades esenciales que hoy demandan asistentes inteligentes y herramientas automatizadas.
Los nuevos modelos están orientados a integraciones prácticas: desde automatizar tareas sencillas hasta servir como núcleo de agentes que requieren comprensión multimodal y acceso a recursos externos. A continuación se detalla qué traen, cuánto cuestan y dónde se podrán usar.
Qué novedades introducen GPT-5.4 mini y GPT-5.4 nano
OpenAI presenta dos alternativas reducidas de su última arquitectura: GPT-5.4 mini y GPT-5.4 nano. Ambos están diseñados para escenarios que priorizan velocidad y eficiencia, pero cada uno apunta a casos de uso distintos.
- GPT-5.4 mini: Modelo con capacidades multimodales, capaz de procesar texto e imágenes. Incluye soporte para funciones de búsqueda en la web y control limitado del entorno del ordenador, lo que lo hace apropiado para asistentes que necesitan consultar información externa o razonar sobre contenidos visuales.
- GPT-5.4 nano: Versión aún más ligera, orientada a tareas repetitivas y poco complejas, como extracción automática de datos, clasificación masiva o respuestas rápidas dentro de pipelines de back-end.
Ambas variantes han sido optimizadas para integrarse como agentes y subagentes de IA, es decir, componentes que pueden formar parte de sistemas más amplios donde la latencia y el coste por consulta son factores críticos.
Precios y rendimiento: cuánto costarán y en qué contextos convienen
La estrategia de precios de OpenAI distingue claramente entre las dos versiones para facilitar decisiones de adopción según volumen y presupuesto. Las tarifas, calculadas por millón de tokens de entrada y salida, reducen la barrera de entrada respecto a utilizar la versión completa de GPT-5.4 desde la API.
- GPT-5.4 mini: Precio de $0.75 por millón de tokens de entrada y $4.50 por millón de tokens de salida. Equilibrio entre coste y capacidad, indicado para asistentes que manejan interacciones multimedia y requieren salida más elaborada.
- GPT-5.4 nano: Más económico, con tarifas de $0.20 (entrada) y $1.25 (salida) por millón de tokens. Ideal para operaciones en gran escala donde prima la eficiencia sobre la complejidad del razonamiento.
En la práctica, esto significa que proyectos con grandes volúmenes de consultas automatizadas (por ejemplo, clasificación de formularios o pipelines de ETL basados en texto) podrían reducir costes sustancialmente utilizando la variante nano, mientras que aplicaciones que combinan texto e imagen o requieren navegación web se beneficiarían más de la mini.
Dónde estarán disponibles y cómo acceder a cada modelo
No todas las versiones se liberan por los mismos canales: OpenAI ha optado por una disponibilidad segmentada para acomodar tanto a desarrolladores como a usuarios finales.
- GPT-5.4 nano: Acceso exclusivo a través de la API. Está pensada para integraciones programáticas en servidores, servicios en la nube y pipelines automatizados.
- GPT-5.4 mini: Disponible en ChatGPT (tanto en la opción gratuita como en planes de pago). Para usuarios sin suscripción, el modelo puede activarse mediante la función conocida como Thinking o su variante en español —una opción que extiende el tiempo de razonamiento de la sesión—. En planes de pago, la mini se utiliza para continuar respuestas cuando la instancia principal de GPT-5.4 alcanza límites de uso.
- Además, la mini se integra en Codex y estará accesible desde aplicaciones de escritorio, la interfaz web, la línea de comandos y extensiones en entornos de desarrollo como VSCode, Windsurf y Cursor.
Implicaciones prácticas para desarrolladores y equipos de producto
La llegada de estas alternativas reduce la fricción para incorporar capacidades avanzadas de IA en soluciones comerciales y pilotos. Algunos efectos esperados:
- Menor coste por transacción para servicios con alto volumen de peticiones (chatbots, automations, pipelines de datos).
- Mejor latencia en escenarios interactivos donde la rapidez de respuesta mejora la experiencia de usuario.
- Flexibilidad para orquestar jerarquías de modelos: usar nano para filtrado y preprocesado, y mini o la versión completa para tareas de mayor riqueza contextual.
Ejemplos de uso concreto
- Asistentes de programación que generan y corrigen fragmentos de código en entornos integrados (usando mini desde Codex y extensiones).
- Clasificación automática de tickets y extracción de metadatos a gran escala empleando nano para mantener costes bajos.
- Sistemas de revisión de imágenes y documentos que combinan entrada visual y textual, aprovechando la capacidad multimodal de mini.
Con estas opciones, OpenAI pretende cubrir desde microservicios de alta eficiencia hasta asistentes más versátiles que requieren percepción visual y acceso a información en tiempo real, sin forzar a los equipos a pagar por potencia que no necesitan.
Artículos similares
- OpenAI lanza GPT-5.3 Codex Spark: IA que programa en una fracción de segundo
- Microsoft lanza nueva IA que genera imágenes un 40% más rápido que Gemini
- GPT-5.1-Codex-Max de OpenAI: IA que programa sola durante 24 horas
- GPT 5.6 llega este mes con mejoras que superan a Gemini y Claude
- Clawdbot: qué es la IA que hace todo por ti, cómo funciona y riesgos

Tomás Villalba es un periodista especializado en ciencia y tecnología. Sus artículos destacan la inteligencia artificial, el espacio, la robótica y las innovaciones digitales que están transformando el mundo. Con un estilo claro y preciso, ayuda a los lectores a comprender los avances que influyen en su vida diaria.






