El modelo de texto a vídeo de OpenAI sora Es a la vez impresionante y aterrador dependiendo de la perspectiva. Puede ayudarte a convertir tus ideas en un videoclip sin siquiera una cámara. Pero también puede acabar con esos puestos de trabajo. Para aquellos que no están familiarizados, el inteligencia artificial El modelo genera videoclips de hasta un minuto de duración basados en descripciones de texto simples.
La startup respaldada por Microsoft acaba de lanzar el primer video musical importante generado por Sora. Es importante destacar que el modelo aún se encuentra en fase de prueba y aún no está disponible para el público. Por lo tanto, todavía hay margen de mejora en diferentes aspectos.
¿OpenAI entrenó a Sora en videos de YouTube?
El mes pasado, el director ejecutivo de YouTube ya advirtió a OpenAI contra el uso de sus videos para entrenar a Sora. En una más reciente entrevista En una entrevista en la Cumbre de Tecnología de Bloomberg, el director de operaciones, Brad Lightcap, habló sobre las posibles aplicaciones comerciales de sus productos de inteligencia artificial. En la conversación también apareció Sora, uno de los productos destacados de la startup que tiene potenciales aplicaciones comerciales. Hablando de Sora, el entrevistador planteó la pregunta: «¿Qué datos de entrenamiento se utilizaron para entrenar el modelo?»
Más específicamente, el El entrevistador presionó al funcionario de OpenAI. para aclarar definitivamente si entrenaron a Sora en videos de YouTube. Sin embargo, Lightcap parecía reacio a dar una respuesta directa. En cambio, discutió varios aspectos, incluida la generación de contenido, la utilización de este contenido como datos para la capacitación de modelos, la garantía de transparencia con respecto al uso de datos, los beneficios potenciales para los creadores de contenido y más. Sin embargo, no mencionó a YouTube ni una sola vez en su «no respuesta» descriptiva sobre si OpenAI ha entrenado a Sora en videos de la plataforma o no.
El director de operaciones, Brad Lightcap, se negó a responder la pregunta.
“Entonces, sí, estamos analizando este problema, es realmente difícil. Aún no tenemos todas las respuestas”, finalizó. De hecho, OpenAI compartió cierta información sobre «comprender la fuente de lo que vemos y escuchamos en línea». Sin embargo, se trataba principalmente de la autenticidad del contenido y de cómo planean mantener la transparencia sobre la fuente del contenido. Sin embargo, la publicación realmente no habló sobre qué datos han usado o están usando para entrenar los modelos de lenguaje. Sin mencionar que tampoco habló sobre el uso de contenido de YouTube.
Para recordar, a la CTO de la compañía, Mira Murati, también se le hizo la misma pregunta sobre Sora a principios del mes pasado. Ella también no pude dar una respuesta clara a la pregunta.
Según informes de principios de este año, OpenAI utilizó vídeos de YouTube para entrenar GPT-4, lo que va en contra de las reglas de la plataforma. Sin embargo, según se informa, Google también hizo lo mismo. Hablando de los datos de entrenamiento de Sora, la complicada falta de respuesta insinúa la posibilidad del uso de vídeos de YouTube. El modelo podría lanzarse al público en la segunda mitad de 2024, posiblemente en agosto.