La tecnología siempre ha sido un gran nivelador. De la era industrial a la era de la Internet, ha mejorado la calidad de vida de las masas y ha hecho más accesibles cosas que antes eran inimaginables. Basta echar un vistazo a su teléfono inteligente para comprender cómo comunicarse con alguien sentado a miles de kilómetros de distancia se ha vuelto tan común que la mayoría ni siquiera piensa mucho en ello. Antes de Graham Bell, este tipo de comunicación a larga distancia solo estaba disponible para los ricos e influyentes debido a los altos costos asociados.
Ejemplos de este tipo son innumerables. Desde las redes sociales que brindan verdadera conectividad en todo el mundo, las aplicaciones para teléfonos inteligentes que digitalizan tareas que requerían presencia física y quitaban horas al día, y el trabajo remoto que brinda mejores oportunidades de ingresos a las personas que viven lejos de los centros corporativos, la tecnología ha democratizado la accesibilidad misma. En muchos sentidos, generativo. inteligencia artificial (AI) se ha convertido en el próximo abanderado de ampliar la accesibilidad a nuevas fronteras.
Una de esas áreas donde la accesibilidad puede tener un gran impacto es la industria de la música. A pesar de la llegada de plataformas de streaming independientes como Spotifynube de sonido, música de manzana, y más, abaratar la distribución de música, el planteamiento del problema que queda es la creación de música. Hoy en día, la música de fondo original es un bien muy necesario. Desde artistas profesionales hasta creadores de redes sociales y podcasters, todo el mundo necesita pistas musicales para su contenido, preferiblemente originales, para evitar cualquier ataque por derechos de autor por parte de las plataformas (los creadores de contenido de YouTube son muy conscientes de su efecto) o una demanda.
Pero crear música no es del agrado de todos. Probablemente, si no se ha entrenado durante años para dominar uno o varios instrumentos musicales, pero desea música original y única para sus necesidades profesionales, se encontrará atrapado con sólo dos soluciones costosas: contratar a un productor musical o un músico de sesión, o pagar en línea para comprar música de archivo. Pero ya no, porque aquí es donde ha entrado la IA.
Tomemos el ejemplo de Beatoven.ai, una plataforma india de generación de música impulsada por IA que permite a los usuarios escribir un mensaje de texto simple para generar música de fondo nueva y única en diez segundos. Para comprender cómo funciona esta tecnología, sus diversas implicaciones y la experiencia de dirigir una startup tan innovadora, en Gadgets 360 hablamos con Mansoor Rahimat Khan, cofundador y director ejecutivo de Beatoven.ai.
El inicio y el viaje de Beatoven.ai
Mansoor Rahimat Khan proviene de Gwalior-Indore-Dharwad Gharana de Sitar, una famosa familia de músicos que han tocado y dado forma a la música de Sitar moderna durante siete generaciones. Khan no fue diferente, pero eligió un camino diferente debido a otra de sus pasiones: la tecnología. “Completé mi graduación del Instituto Nacional de Tecnología (NIT), Goa, en ingeniería electrónica y de comunicaciones. También fue entonces cuando comencé a profundizar en el espacio que se encuentra en la intersección de la música y la tecnología”, nos dijo Khan.
Después de trabajar durante algunos años, Khan conoció a Siddharth Bhardwaj, un alumno del Instituto Indio de Tecnología (IIT) de Allahabad (ahora conocido como Prayagraj) y un entusiasta de la música. El dúo, que compartía intereses similares, identificó el problema de las licencias musicales en el contenido y quería construir algo que pudiera hacer que la música fuera más accesible para millones de creadores, ya sea en las redes sociales o siguiendo una carrera profesional. Esa fue la génesis de Beatoven.ai.
Pero había un problema. Incluso cuando el dúo comenzó a trabajar en el producto y la startup en 2021, su solución al problema requería IA generativa, que todavía estaba a un año de llegar a la corriente principal (en noviembre de 2022, ChatGPT podría decirse que inició la carrera de la IA gen.).
“Inicialmente, el prototipo que construimos en 2021 era una plataforma muy básica. Los usuarios podrían seleccionar un género y un tempo y especificar una duración, y generaríamos una pieza musical original. En aquel entonces, no existían grandes modelos de lenguaje (LLM), por lo que tuvimos que construir toda nuestra pila tecnológica desde cero. Hoy tenemos nuestra propia tecnología patentada que comenzamos a desarrollar en aquel entonces”, dijo Khan.
Las cosas se volvieron más fáciles una vez que surgió la ola de IA, y Beatoven.ai se benefició de la disponibilidad de LLM en el mercado, con los cuales pudieron equipar mejor su plataforma para atender a su base actual de un millón de usuarios.
La plataforma Beatoven.ai
La plataforma solo web es una herramienta de generación de música impulsada por IA para creadores de contenido. Los usuarios, una vez que se hayan registrado, pueden escribir un mensaje de texto para generar música de fondo original. Alternativamente, la plataforma también permite a los usuarios elegir un tempo, duración, género y estado de ánimo para crear música.
Una vez que el usuario ha agregado la entrada, la IA toma el control y genera cuatro pistas separadas. La plataforma también ofrece funciones de edición de posgeneración donde los usuarios pueden cambiar un instrumento, reducir o aumentar el volumen en partes específicas o recomponer una sección completa de la pista. Khan dijo que una sola pista puede durar hasta 15 minutos, aunque no hay un límite superior y el valor sugerido existe para mantener el tiempo de renderizado corto. Una pista de una duración promedio de 1 a 2 minutos tardará unos 10 segundos en generarse. Según los datos compartidos por la empresa, desde sus inicios, Beatoven ha generado 15 lakh de bandas sonoras y cuenta con 3 lakh de descargas.
Actualmente, la plataforma no permite a los usuarios crear pistas fusionadas en las que se combinen dos o más géneros, pero Khan le dijo a Gadgets 360 exclusivamente que la compañía pronto lanzará una nueva actualización que agregará esta función.
También probamos la plataforma y descubrimos que la música era bastante realista. La siguiente canción se creó utilizando el mensaje «Crea un himno EDM de alta energía con un ritmo que sea perfecto para una fiesta de baile».
La pila tecnológica de Beatoven.ai
La plataforma Beatoven tiene dos componentes. El primero es el LLM, que permite a los usuarios escribir indicaciones en lenguaje natural y luego procesar esa información en un formato que la IA pueda entender para convertirla en música. La startup utiliza GPT Modelos para esta pieza.
El segundo componente comprende la intención del usuario y genera una pista que cumple con el parámetro. Esta arquitectura fue creada por la empresa de forma nativa. El modelo de IA utiliza una arquitectura de aprendizaje contrastante para que esto suceda. Khan destaca que la inspiración para esta técnica provino del modelo CLIP de OpenAI, pero rápidamente señala que el AbiertoAI El modelo fue construido para texto e imágenes, y Beatoven fue el primero en usarlo para sonido y música. Al ser un trabajo propio, la empresa también pudo optimizar el proceso. Por ejemplo, Khan nos dijo que la plataforma utiliza inferencia de CPU en lugar de inferencia de GPU. Esto es notable dado que incluso los LLM pequeños requieren inferencia de GPU para ejecutarse.
La startup ha obtenido casi 100.000 muestras de datos de artistas independientes para entrenar el modelo de IA. La compañía colaboró con casi 250 artistas en todo el mundo y les pagó por pistas exclusivas. Khan afirmó que la empresa había obtenido de forma ética todos sus datos de formación y no los buscó en Internet. Curiosamente, se informa que Adobe está haciendo lo mismo en la actualidad para crear un modelo de generación de vídeo con IA.
Sin embargo, hoy en día, los datos se han convertido en un recurso increíblemente costoso que se requiere continuamente para actualizar los modelos de IA y mejorarlos. Si bien Beatoven continúa su práctica de colaborar con artistas para obtener datos incluso hoy, en el futuro planea reducir costos mediante la introducción de un modelo de reparto de ingresos, donde los artistas recibirían pagos en función de la cantidad de pistas generadas en las que la IA usó la canción. muestra o los datos.
Cómo Beatoven.ai planea lidiar con la competencia
La generación de música basada en IA no es una propuesta totalmente única en la actualidad. Muchos jugadores han entrado en el segmento reconociendo el potencial. Algunos incluyen Google con MusicLM, OpenAI con Jukebox y Adobe con Project Music GenAI Control. Sin embargo, ninguno de estos modelos está disponible para el público en la actualidad y siguen en desarrollo. Pero todavía existe competencia para Beatoven. Un gran rival para ellos sería La IA está llamandoque no solo crea música sino que también agrega voces generadas por IA a la música para ofrecer una canción completa.
En respuesta a la inquietud, Khan destacó que la empresa ofrece generación de música ilimitada sin agregar un límite de tarifa. Además, destaca que la empresa está construyendo un ecosistema completo. Si bien, por un lado, atiende a los usuarios generando música, por otro lado, también ofrece un lugar para que los artistas vendan su música original. Todo el conjunto de ofertas, junto con la promesa de “música única de origen ético y libre de derechos de autor”, es lo que Khan cree que le da a Beatoven la ventaja en el mercado.
Una mirada hacia el futuro
Beatoven ahora está buscando expandir su plataforma para atender a una base de usuarios global. La startup ya ha comenzado a incorporar artistas de diferentes partes del mundo, ya que el 70 por ciento de su base de usuarios reside fuera del país. Khan cree que esta perspectiva global, además de centrarse en mejorar el modelo de IA, será la clave para alcanzar su objetivo de cinco millones de usuarios en los próximos dos años.
La tecnología a menudo puede ser un arma de doble filo. Si bien no se pueden subestimar los beneficios de la música generada por IA, la pregunta que surge es si una creación musical tan fácil y asequible puede tener un impacto adverso en los aspirantes a músicos. ¿Es realmente la mercantilización de la música el camino correcto a seguir?
Khan cree que si bien la creación musical se convertirá en la próxima gran disrupción en la industria, es poco probable que acabe con los sueños y el sustento de los músicos y cantantes. «Creo que los artistas seguirán estando en el centro de esta disrupción porque la IA no puede competir con la creatividad humana», afirmó.