Apple está construyendo un sistema de aprendizaje automático para gobernarlos a todosI
Con Siri listo para ver mejoras significativas una vez que se lance iOS 13, Apple está apareciendo en una feria clave de IA de voz y ha publicado un estudio que explica algunos de los detalles de una tecnología de aprendizaje automático (ML) primera en su tipo que llama «Overton».»
Definiendo una ventana de aprendizaje automático
Esta semana, Apple patrocina la mayor conferencia de procesamiento del lenguaje hablado del mundo, Interspeech 2019.
Como parte de su trabajo en el evento, ha presentado múltiples documentos de investigación – y los miembros de sus crecientes equipos de aprendizaje automático se reunirán con los asistentes allí.
Entre otros temas (véalos todos aquí), Apple presentará ponencias sobre la detección de la expresión/intento a través de la voz, la mejora del reconocimiento de voz, el desarrollo de herramientas más precisas para entender los matices del habla, el uso de mirroring para construir relaciones entre los usuarios humanos y los asistentes de voz y el uso de la tecnología para optimizar la mejora del habla.
Podremos saber un poco más sobre lo que la compañía está haciendo en ML en el nuevo portal de Youtube Interspeech, aunque no sabemos si aparecerá allí algún vídeo de Apple.
No es una sorpresa que los científicos de Apple se comprometan con la comunidad científica en general. La compañía ha publicado artículos y anuncios esporádicos sobre aprendizaje automático en su propio portal de Machine Learning desde 2017.
Presentación de Overton
Apple afirma tener una solución pionera con Overton: su objetivo es permitir que gran parte de la personalización de los modelos de ML sea administrada por la máquina, no por el ser humano.
La interacción con la voz es solo la parte inicial de lo que ocurre cuando le haces una pregunta a Siri. Los modelos de aprendizaje automático deben tratar de entender la pregunta, contextualizarla y averiguar la respuesta más precisa. Dar una respuesta de alta calidad es en realidad más difícil de lo que parece.
Seguro que para algunas preguntas todo lo que obtendrás de Siri serán datos que ha encontrado en una página de Wikipedia, (aunque incluso entonces podría haber comprobado varias de esas páginas para elegir la respuesta más relevante). Pero el objetivo final debe ser que Siri se convierta en una fuente eficaz de respuestas complejas a problemas complejos, incluso hasta el punto de predecirlas.
Estos pasos siguientes son difíciles de lograr.
¿Cómo pueden los científicos estar más seguros de que la respuesta que tiene que dar Siri es la más precisa disponible?
Ese es el tipo de reto que Apple está abordando con Overton, que «automatiza el ciclo de vida de la construcción, el despliegue y la supervisión de los modelos».
En términos humanos, eso significa que la propia máquina corrige y ajusta los modelos de aprendizaje automático en respuesta a estímulos externos, haciéndolos más precisos y reparando los fallos lógicos que podrían llevar a una conclusión incorrecta. La idea es que los humanos puedan entonces centrarse en la supervisión de alto nivel de los modelos de aprendizaje automático.
Esto (creo) significa que en lugar de tener que adentrarse en un código cada vez más complejo para hacer ajustes menores pero necesarios, los humanos pueden solicitar un conjunto de cambios que Overton luego aplica.
Literalmente, están controlando la ventana de Overton.
¿Cómo utilizará esto Apple?
Creo que las ambiciones de Apple para Siri van más allá de ser el equivalente digital del amigo un poco inútil al que a veces consultas aunque sabes que no vas a obtener una respuesta útil.
Siri pretende ser un ayudante dirigido por la voz capaz de aportar información de alto nivel, análisis contextualizados y aumento de las tareas que ya haces. Siri Suggestions muestra esa dirección, aunque las implementaciones siguen siendo limitadas.
Apple dice: «Una de las principales direcciones del trabajo en curso son los sistemas que se basan en Overton para ayudar a gestionar el aumento de datos, la supervisión programática y la colaboración».
También creo que Overton tiene implicaciones para la privacidad del usuario.
Piénsalo así:
Los científicos de Apple construyen modelos que creen que son muy precisos. Estos modelos se ejecutan en el dispositivo iOS. Overton dota a esos modelos de cierto grado de independencia y los sistemas de ML ajustan los modelos en función de su precisión y relevancia, todo ello sin dar a los investigadores una visión granular de las acciones individuales.
Esto significa que los gestores de datos (en este caso, los científicos que crean esos modelos en primer lugar) ocupan papeles estratégicos más generalizados en los que la información relativa a los usuarios individuales no se pone a su disposición.
Apple crea máquinas de ML para que se encarguen de ciertas tareas definidas, al tiempo que equipa a las propias máquinas para que personalicen los modelos que utilizan. Esto parece ser lo que Overton es – y fue sin duda parte de lo que llevó a Apple a comprar Silk Labs.
Apple dice que Overton es el primer sistema de gestión de aprendizaje automático creado para mejorar y supervisar la calidad de las aplicaciones. Leyendo entre líneas, puede (y subrayo «puede», ya que no lo sé mejor) ser también la tecnología utilizada para identificar cuando apuntas la cámara de tu iPhone 11 a una mascota para hacer un retrato de la misma.
El mundo de mañana es un trabajo en progreso.
Por favor, sígueme en Twitter, o únete a mí en la barra de AppleHolic &grupos de discusión de Apple en MeWe.