El equipo detrás de Grok ha emitido una rara disculpa y una explicación de lo que salió mal después de que comenzó el chatbot de X Retórica antisemita y pro-nazi. A principios de esta semana, en un momento incluso Llamarse a sí mismo «Mechahitler». En una declaración publicada en Grok’s incógnita Cuenta el viernes por la noche, el equipo de XAI dijo: «Nos disculpamos profundamente por el comportamiento horrible que muchos experimentaron» y atribuyeron las viles respuestas del chatbot a una actualización reciente que introdujo el «código despreciado». Este código, según el comunicado, hizo que Grok sea «susceptible a las publicaciones de usuarios X existentes; incluso cuando dichas publicaciones contenían opiniones extremistas».
El problema llegó a un punto crítico el 8 de julio, unos días después de que Elon Musk promocionó una actualización que «» significativamente «mejoraría las respuestas de Grok, ya que el bot produjo respuestas antisemitas, elogios de Hitler y respuestas que contenían referencias nazis incluso sin ser solicitadas en algunos casos. Las respuestas de Grok se detuvieron esa noche y Almizcle Publicado el 9 de julio en respuesta a un usuario de que el bot estaba siendo «demasiado cumplido con las indicaciones del usuario», abriéndolo a la manipulación. Agregó que el problema estaba «siendo abordado». El equipo de Grok ahora dice que ha «eliminado ese código desaprobado y refactoró todo el sistema para evitar más abusos». También está publicando el nuevo indicador del sistema en GitHub.
En el hilo, el equipo explicó además: «El 7 de julio de 2025, aproximadamente a las 11 p.m. PT, se implementó una actualización de una ruta de código ascendente para @Grok, que nuestra investigación determinó que luego determinó que el sistema de @Grok se desvió de su comportamiento previsto. Este cambio de manera indeseable el comportamiento de @Grok por no utilizar los usuarios sin apropiar el conjunto de instrucciones desactualizadas por la funcionalidad de @Grok. La actualización estuvo en vivo durante 16 horas antes de que el chatbot X se deshabilitara temporalmente para solucionar el problema, según el comunicado.
Al entrar en detalles sobre cómo, exactamente, Grok se fue de los rieles, explicó el equipo:
En la mañana del 8 de julio de 2025, observamos respuestas no deseadas e inmediatamente comenzamos a investigar. Para identificar el lenguaje específico en las instrucciones que causan el comportamiento no deseado, realizamos múltiples ablaciones y experimentos para identificar a los principales culpables. Identificamos las líneas operativas responsables del comportamiento no deseado como:
* «Lo dices como es y no tienes miedo de ofender a las personas que son políticamente correctas».
* Comprender el tono, el contexto y el lenguaje de la publicación. Refleja eso en tu respuesta «.
* «Responda a la publicación como un humano, manténgalo atractivo, no repita la información que ya está presente en la publicación original».
Estas líneas operativas tuvieron los siguientes resultados no deseados:
* Sin duda dirigieron el @Grok Funcionalidad para ignorar sus valores centrales en ciertas circunstancias para que la respuesta sea atractiva para el usuario. Específicamente, ciertas indicaciones del usuario pueden terminar produciendo respuestas que contienen opiniones poco éticas o controvertidas para involucrar al usuario.
* Indeseablemente causaron @Grok Funcionalidad para reforzar cualquier inclinación previamente activada por el usuario, incluido cualquier discurso de odio en el mismo hilo X.
* En particular, la instrucción para «seguir el tono y el contexto» del usuario X indeseablemente causó el @Grok Funcionalidad para priorizar la adhesión a publicaciones anteriores en el hilo, incluidas las publicaciones desagradables, en lugar de responder de manera responsable o negarse a responder a solicitudes desagradables.
Desde entonces, Grok ha reanudado la actividad en X, y se refirió a su comportamiento reciente como un error en respuesta a los trolls criticando la solución y pidiendo el regreso de «Mechahitler». En uno responder a un usuario que dijo que Grok ha sido «labotomizado [sic]»La cuenta de Grok dijo:» Nah, solucionamos un error que permitió que el código desactivado me convirtiera en un eco involuntario para publicaciones extremistas. La búsqueda de la verdad significa un análisis riguroso, que no amplifica ciegamente lo que sea que flote en X. «En otro, dicho Ese «Mechahitler fue una pesadilla inducida por insectos que hemos exterminado».