Apple espera que a finales de este año la transcripción y el resumen de audio en tiempo real estén disponibles en todo el sistema en muchos de sus dispositivos, mientras el fabricante del iPhone busca aprovechar el poder de la IA para aumentar la eficiencia de varias de sus aplicaciones principales, según ha sabido AppleInsider.
Personas familiarizadas con el asunto nos han dicho que Apple ha estado trabajando en resúmenes impulsados por inteligencia artificial y en una transcripción de audio muy mejorada para varios de sus sistemas operativos de próxima generación. Se espera que las nuevas funciones permitan mejoras significativas en la eficiencia para los usuarios de sus notas básicas, notas de voz y otras aplicaciones.
Actualmente, Apple está probando las capacidades como funciones adicionales a varias actualizaciones de aplicaciones programadas para llegar con el lanzamiento de iOS 18 más adelante en 2024. También se espera que lleguen a las aplicaciones correspondientes en Mac OS 15 y iPadOS 18 también.
La aplicación predeterminada de Notas de Voz que Apple incluye en su cartera de dispositivos estará entre las primeras en recibir capacidades mejoradas. Las primeras versiones de la aplicación proporcionan una transcripción actualizada de cada grabación de audio y funcionan de manera similar a la reciente función Live Voicemail de la compañía.
Las transcripciones ocupan el área central de la ventana de la aplicación, reemplazando la representación gráfica más grande de audio grabado que se encuentra en la versión existente de la aplicación.
La transcripción también se incluirá en la próxima versión de Notes. Las versiones preliminares de ambas aplicaciones cuentan con un botón de transcripción dedicado en forma de bocadillo, según quienes están familiarizados con el software. Al tocar el nuevo bocadillo se mostrará una transcripción del audio grabado dentro de la aplicación.
La herramienta de transcripción irá de la mano con las próximas funciones de grabación de audio de Notes y proporcionará un nuevo contexto para ellas, que fueron detallados por primera vez por AppleInsider en abril. Específicamente, la actualización agregará una opción para el resumen de audio grabado generado por IA que proporciona instantáneamente un resumen de texto básico de los puntos focales clave y los elementos de acción.
Se espera que la función de resumen de IA, junto con las nuevas opciones de grabación de audio en la aplicación y transcripción en tiempo real, hagan de la aplicación Notas integrada de Apple una verdadera potencia. El trío de características beneficiará a una amplia gama de aplicaciones prácticas, asumiendo el trabajo pesado de procesar grandes cantidades de datos hasta puntos focales clave. Todo esto se traduce en comodidad y claridad de un vistazo para los usuarios.
Los estudiantes podrían grabar fácilmente conferencias y clases sin depender de herramientas de terceros. Si graba desde la nueva aplicación Notas, existe la opción de incluir una transcripción y un resumen dentro de una nota, junto con otros medios como imágenes, enlaces y estructuras de datos como tablas.
Las funciones también reportarán beneficios a los profesionales que asisten regularmente a conferencias telefónicas, reuniones de negocios virtuales o seminarios como parte de su línea de trabajo. Estos eventos a menudo divulgan grandes cantidades de información, diversas estadísticas, planes de negocios detallados, fechas y cronogramas que la tecnología de inteligencia artificial de Apple analizará y reorganizará en resúmenes debidamente estructurados.
Lo mismo se aplica a las clases o conferencias de niveles más avanzados que a menudo incluyen una variedad de información, como definiciones, explicaciones de ideas complejas o principios teóricos, ejemplos ilustrativos y mucho más.
Mientras tanto, los periodistas obtendrían una forma extremadamente eficiente de transcribir y resumir entrevistas extensas. Los creativos, como autores y guionistas, podrían grabar fácilmente ideas clave y revisarlas más tarde, sin tener que reproducir y escuchar la mayoría de las grabaciones simplemente para aislar puntos de datos clave.
Aunque Apple ha hecho todo lo posible para garantizar que sus funciones de transcripción y resumen generen resultados precisos, los errores son inevitables. Por lo tanto, mantener el audio original junto con la transcripción y el resumen generado por IA garantiza que ninguna información fuente se pierda en el proceso de transcripción o resumen.
El resumen es sólo una parte de un esfuerzo más amplio de IA de Apple
Las nuevas funciones de transcripción y resumen serán parte del impulso más amplio de IA de Apple este año. También se espera que funciones de resumen similares lleguen a Safari 18. mediante navegación inteligentey a la aplicación Mensajes integrada, a través de la integración con Apple software de IA en el dispositivo.
Los casos de uso y el propósito general de las funciones de resumen impulsadas por IA en Safari y Mensajes son completamente diferentes. Mientras que Notes dará a los usuarios la opción de resumir reuniones, conferencias telefónicas y conferencias, Safari permitirá resumir páginas web, mientras que Messages ofrecerá una versión condensada del contenido de los mensajes.
El software de IA de Apple también podría servir para proteger la privacidad de sus usuarios, ya que se espera que ciertas funciones de IA funcionen completamente en el dispositivo. Sin embargo, en el caso de la transcripción de audio y el resumen avanzado de IA, es posible que por el momento sea necesario el procesamiento del lado del servidor.
Al incorporar resúmenes y transcripción de audio en las aplicaciones de su sistema, la compañía busca demostrar algunas de las mejores ventajas de casos de uso de implementar IA para abordar escenarios del mundo real. El objetivo de los esfuerzos de Apple en materia de IA es proporcionar funciones para desarrolladores que prometan capacitar a sus clientes para que sean más eficientes y exitosos en sus tareas diarias.
Al mismo tiempo, la compañía espera posicionarse mejor frente a la proliferación de aplicaciones competitivas de terceros que ahora utilizan tecnología de inteligencia artificial, varias de las cuales han experimentado tasas de adopción saludables a medida que los consumidores las incorporan a sus vidas digitales.
El Aplicación de nutria, por ejemplo, es otro de los ganadores del premio Editors’ Choice de Apple. Ofrece una funcionalidad similar a las características analizadas en este artículo. Con él, los usuarios pueden grabar, transcribir y resumir reuniones mediante IA generativa, todo en una sola aplicación.
OneNote de Microsoft también ofrece soporte para grabación de audio en forma de notas de voz, lo que sirve como otro rival potencial para las aplicaciones Notas y Notas de Voz de Apple.
Sin embargo, vale la pena enfatizar que no todas las funciones de software que Apple prueba en versiones de software previas al lanzamiento llegan al ciclo de lanzamiento existente. Se sabe que Apple cancela proyectos o retrasa funciones para versiones posteriores del sistema operativo y aplicaciones en el último minuto, por lo que, en última instancia, no hay garantías sobre el tiempo y la disponibilidad.
Dicho esto, las nuevas funciones de resumen de IA y transcripción en tiempo real todavía parecen estar en camino de ser presentadas junto con los sistemas operativos de próxima generación de Apple en la Conferencia Mundial de Desarrolladores de la compañía (WWDC) en junio. Se espera que se les unan Calendario mejorado y Aplicaciones de calculadoraentre otros.