Hoy era el día señalado por Elon Musk, que aparcó un poco su faceta política (en la que parece que está al 100% últimamente con Trump), para centrarse en una de sus empresas (X, la antigua Twitter) y sobre todo su pata de inteligencia artificial llamada xAI.
Una pata que cada vez es más importante para él y para X, y más cuando ha intentado comprar OpenAI y no le han dejado. Por lo que desde hace un par de años está obsesionado con superar al ChatGPT de OpenAI.
Y claro, cuando Elon Musk se propone algo… ya pueden temblar el resto. Es cierto que siempre a nivel plazos es súper optimista y no los cumple nunca, pero mientras sus haters se regodean en eso, no se dan cuenta que al final acaba consiguiéndolo.
Y en esas está ahora, con xAI y el modelo Grok, que ya con el Grok 2 dieron un salto grande y más al ponerlo ‘gratis’ en X, mostrando su poderío y encima dejándole algo más libre a la hora de crear imágenes sin censura lo que rápidamente lo volvió viral (lógico si encima hablamos de X).
Ahora llega Grok 3
Pero aunque Grok 2 si era un salto potente y un golpe en la mesa, en el fondo no era el mejor, OpenAI con su ChatGPT (el 4o) le ganaba. Incluso hace poco robó todos los titulares de la Inteligencia Artifica (IA) Deepseek, que igualaba al 4o pero con muchos menos recursos.
Ahora Elon quiere dar un golpe en la mesa, pero de verdad, y no simplemente intentar igualar a ChatGPT sino superarlo. Para ello ha invertido mucho dinero y recursos, con lo que han conseguido crear Grok 3, que es lo que han presentado hoy.
Aquí tenéis la presentación entera de Grok 3 por Elon Musk y el equipo de xAI:
— Elon Musk (@elonmusk) February 18, 2025
¿Grok 3 o ChatGPT, cuál es mejor?
En la presentación han puesto varios gráficos y han hecho varias pruebas. Aunque el feedback no está siendo ‘alucinante’ de la presentación (quizás tienen que trabajar más esta parte, no son un Apple).
Al menos los gráficos de las pruebas, la marca cómo la mejor IA del momento (Aunque ya sabemos cómo funciona esto, en unas semanas OpenAI lanzará alguna actualización y pondrá su gráfico diciendo que es mejor que Grok 3).
En el primer gráfico, el de arriba del post, es un Benchmark (una comparación de mercado con los referentes principales), y usan 3 pruebas para medirlo, una de matemáticas: Math (AIME’ 24), otra de ciencia: Science (GPQA) y otra de programación: Coding (LCB Oct-Feb). Si alguno las conocéis mejor por favor contarlo en los comentarios 🙂
Velocidad de lanzamientos
Este gráfico me ha gustado, porque muestra el tiempo de desarrollo de OpenAI con ChatGPT desde el ChatGPT 2 al ChatGPT 3 al ChatGPT4 y el que ha tenido xAI con Grok, desde el Grok0, Grok1 y Grok 2.

El Grok 0 se lanzó a mediados de 2023 y poco después el 1. Luego en 2024 el Grok 2 y ahora en 2025 el Grok 3, lo que demuestra que la velocidad de desarrollo de xAI es alucinante. Algo que si a lo mejor hace un año no preocupaba mucho a OpenAI, seguramente ahora sí deberían estar muy preocupados por lo que xAI pueda hacer en los próximos meses y años.
Grok 3 vs Grok 2
Le hemos pedido al propio Grok 3 (podéis usarlo en X si eres premium o en la web directamente, de hecho en la presentación Elon Musk ha dicho que en la web en teoría será más potente y tendrá siempre la última versión).
Aspecto Clave | Grok 2 | Grok 3 |
---|---|---|
Potencia Computacional | Entrenado con una capacidad estándar | 10-15 veces más potencia que Grok 2 |
Razonamiento | Razonamiento básico, mejorado desde Grok 1 | Avanzado, sobresale en matemáticas y ciencia |
Precisión de Respuestas | Buena, pero con margen de mejora | Mayor precisión gracias a autocorrección |
Velocidad de Procesamiento | Rápida para su época | Más rápida debido a mayor capacidad |
Generación de Imágenes | Disponible con Aurora, algo limitada | Mejorada, más fotorrealista y personalizada |
DeepSearch | No disponible | Incluye búsqueda profunda en la web |
Errores (Alucinaciones) | Presentes en menor medida que Grok 1 | Reducidos significativamente |
Áreas de Fortaleza | Conversación, texto, imágenes | Matemáticas, ciencias, programación |
Acceso | Integrado en X, requiere suscripción Premium | Similar, pero con funciones avanzadas |
Competencia | Competía con GPT-4 Turbo, Claude 3.5 | Supera a GPT-4o, DeepSeek, Gemini en pruebas |