Mishaal Rahman / Autoridad de Android
TL;DR
- Actualmente, las únicas aplicaciones que puede iniciar mediante comando de voz en Android son el Asistente de Google y cualquier asistente de voz que su OEM precargue, como Bixby.
- Una página oculta en la última versión beta de Android sugiere una función de “activación por voz” que podría expandir esta capacidad a más aplicaciones.
- Aún no está del todo claro cómo funciona, pero la función supuestamente mantendrá la privacidad de sus datos a través de sensores adaptativos protegidos.
Los asistentes de voz son servicios útiles que te permiten consultar el clima, configurar una alarma, reproducir música o buscar algo totalmente con manos libres. Android te da la libertad de elegir entre varios asistentes de voz, incluidos Asistente de Google, alexa amazonay, si tienes un teléfono Samsung, bixby. Sin embargo, si bien Android permite que cualquier aplicación se convierta en la aplicación de asistente predeterminada, no permite que cualquier aplicación responda a palabras de activación como «Hola Google» en segundo plano. Esto se debe principalmente a razones de privacidad, ya que su teléfono tiene que escuchar constantemente el audio a través del micrófono para poder captar la palabra de activación designada. Una nueva función en Android 15 llamada “activación por voz” podría resolver este problema mediante el uso de una tecnología de “detección adaptativa” que preserva la privacidad.
Mishaal Rahman / Autoridad de Android
Una captura de pantalla de la página de aplicaciones predeterminadas de Android para configurar la aplicación de asistente digital predeterminada.
Mientras investigaba la versión beta de Android 14 QPR2, descubrimos una página oculta para aplicaciones de activación por voz (que se muestra a continuación). Esta página aparece bajo Configuración > Aplicaciones > Acceso a aplicaciones especiales y le permite designar qué aplicaciones otorgar el nuevo permiso de activación por voz. Según la descripción del permiso, la activación por voz “activa aplicaciones aprobadas, manos libres, mediante comandos de voz. La detección adaptativa incorporada garantiza que los datos permanezcan privados solo para usted”.
Mishaal Rahman / Autoridad de Android
Actualmente, ninguna aplicación solicita el permiso de activación por voz, por lo que tuvimos que crear una aplicación simple para solicitarlo y poder producir la captura de pantalla anterior.
Al final de la descripción hay un enlace que ofrece brindarle “más información sobre la detección adaptativa protegida”, pero el enlace conduce a una página de soporte de Google que aún no está disponible. Por lo tanto, no estamos seguros de cómo la detección adaptativa protegida mantendrá la privacidad de sus datos de voz. Es posible que esta característica se ejecute bajo Private Compute Core (PCC) de Android, que consiste en la aplicación del sistema Android System Intelligence para todo el procesamiento de datos fuera de línea más Private Compute Services para todas las actividades que requieren acceso a la red. De esta manera, las aplicaciones que solicitan el permiso de activación por voz no necesitarán procesar ningún dato del micrófono por sí mismas; el PCC recogería las palabras de activación y luego activaría la aplicación en cuestión. Sin embargo, esta es principalmente nuestra especulación.
Al profundizar en el código del sistema operativo, encontramos una mención de un mensaje de registro que vincula este nuevo permiso y API con la detección de palabras activas. Este registro indica que el servicio de detección de palabras activas se cerrará cada vez que se revoque el permiso de activación por voz desde una aplicación. No estamos seguros de si esta función de activación por voz permitirá que las aplicaciones se activen con palabras de activación personalizadas o solo con palabras preestablecidas, pero al menos parece haber un vínculo entre las palabras de activación y esta nueva función.
Lo más interesante de esta función es que el nuevo permiso de activación por voz puede estar en manos de aplicaciones de terceros. El permiso subyacente, RECEIVE_SANDBOX_TRIGGER_AUDIO
, tiene un nivel de protección de “aplicación|privilegiada|firma”. El nivel de protección «appop» significa que el permiso no se puede otorgar cuando la aplicación está instalada o mediante un cuadro de diálogo de permiso en tiempo de ejecución, pero se puede otorgar si el usuario navega a la aplicación de Android. Acceso especial a la aplicación página, como se muestra arriba.
En versiones anteriores de Android, las aplicaciones de terceros podían activarse cuando se detectaban las palabras de activación «OK Google» o «Hey Google». Sin embargo, Google eliminó esta capacidad en Android 12 e incluso respaldó un parche para Android 10-11, alegando que es una vulnerabilidad de seguridad. La API actual y el permiso utilizado para capturar y responder a las palabras de activación siguen siendo accesibles solo para las aplicaciones del sistema, pero este nuevo permiso de activación por voz actualmente no está tan restringido. Sin embargo, eso podría cambiar antes de que se lance la función de activación por voz.
Son escasos los detalles adicionales sobre esta próxima función, ya que aún está en desarrollo y probablemente esté destinada a lanzarse con Android 15. Si Google termina abriendo esta función de activación por voz a aplicaciones de terceros, entonces tal vez aplicaciones como ChatGPT podrían usarla para despertar por voz. La aplicación ChatGPT se está preparando para agregar soporte para Estar configurado como la aplicación de asistente predeterminada., pero incluso como asistente predeterminado, no podrás usar ChatGPT totalmente con manos libres como puedes hacerlo con el Asistente de Google. La función de activación por voz de Android 15 podría hacerlo posible.
Amazon Alexa podría ser otro beneficiario de esta función, si funciona como lo describimos. Actualmente, la aplicación solo responde a la palabra de activación «Alexa» mientras está abierta. Un puñado de teléfonos «Alexa integrados» admitían activar a Alexa en cualquier pantalla, pero ese programa duró poco, ya que requería que el fabricante del dispositivo integrara específicamente la compatibilidad con la palabra de activación de Alexa. Hoy en día, Google Assistant y Bixby en los teléfonos Samsung son los únicos asistentes virtuales en Android que admiten la activación por voz con manos libres, pero esta función de Android 15 podría llevar esa capacidad a más servicios.