Apple bouwt machine learning-systeem
In het vooruitzicht van aanzienlijke verbeteringen voor Siri zodra iOS 13 beschikbaar is, is Apple aanwezig op een belangrijke spraak-AI-beurs en heeft het een studie gepubliceerd waarin het enkele details uitlegt van een unieke machine learning-technologie (ML) die het “Overton” noemt.”
Defining a machine learning window
Deze week sponsort Apple ’s werelds grootste conferentie voor gesproken taalverwerking, Interspeech 2019.
Als onderdeel van zijn werk op het evenement heeft het meerdere onderzoekspapers ingediend – en leden van zijn groeiende machine learning-teams zullen de aanwezigen daar ontmoeten.
Met andere onderwerpen (zie ze allemaal hier), zal Apple papers presenteren over het detecteren van expressie / intentie via spraak, het verbeteren van spraakherkenning, het ontwikkelen van nauwkeuriger tools om spraaknuances te begrijpen, het gebruik van mirroring om relaties op te bouwen tussen menselijke gebruikers en spraakassistenten en het gebruik van tech om spraakverbetering te optimaliseren.
We kunnen iets meer te weten komen over waar het bedrijf mee bezig is in ML op het gloednieuwe Interspeech Youtube-portaal, hoewel we niet weten of er Apple-video’s zullen verschijnen.
Het is geen verrassing dat Apple’s wetenschappers zich bezighouden met de bredere wetenschappelijke gemeenschap. Het bedrijf publiceert sinds 2017 sporadisch machine learning papers en aankondigingen op zijn eigen Machine Learning portal.
Introducing Overton
Apple beweert met Overton een first-of-its kind oplossing te hebben – het is erop gericht om veel van de personalisatie van ML-modellen door de machine te laten beheren, niet door de mens.
Voice-interactie is slechts de front-end van wat er gebeurt als je Siri een vraag stelt. Machine learning-modellen moeten vervolgens proberen de vraag te begrijpen, deze in de juiste context te plaatsen en het meest nauwkeurige antwoord te vinden. Een antwoord van hoge kwaliteit geven is in feite moeilijker dan het lijkt.
Zeker, voor sommige vragen zal alles wat je van Siri krijgt gegevens zijn die het heeft gevonden op een Wikipedia pagina, (hoewel zelfs dan kan het meerdere van dergelijke pagina’s hebben gecontroleerd om het meest relevante antwoord te kiezen). Maar het uiteindelijke doel moet zijn dat Siri een effectieve bron wordt voor complexe antwoorden op complexe problemen – zelfs in de mate van het voorspellen ervan.
Deze volgende stappen zijn moeilijk te verwezenlijken.
Hoe kunnen wetenschappers er meer vertrouwen in krijgen dat het antwoord dat Siri moet geven, het meest accurate is dat beschikbaar is?
Dat is het soort uitdaging dat Apple aangaat met Overton, dat “de levenscyclus van modelbouw, implementatie en monitoring automatiseert.”
In menselijke termen betekent dit dat de machine zelf machine-leermodellen repareert en aanpast in reactie op externe stimuli, waardoor het nauwkeuriger wordt en logische fouten repareert die tot een onjuiste conclusie zouden kunnen leiden. Het idee is dat mensen zich dan kunnen richten op de high-end supervisie van machine learning modellen.
Dit betekent (denk ik) dat in plaats van diep in steeds complexere code te moeten kruipen om kleine maar noodzakelijke aanpassingen te doen, mensen een set wijzigingen kunnen aanvragen die Overton vervolgens toepast.
Quite letterlijk, ze controleren het Overton-venster.
Hoe gaat Apple dit gebruiken?
Ik denk dat Apple’s ambities voor Siri verder gaan dan het zijn van het digitale equivalent van de enigszins nutteloze vriend die je soms vraagt, ook al weet je dat je misschien geen nuttig antwoord krijgt.
Siri is bedoeld als een spraakgestuurde helper die in staat is om informatie op hoog niveau, gecontextualiseerde analyse en augmentatie van de taken die je al doet te brengen. Siri Suggestions toont die richting, hoewel de implementaties beperkt blijven.
Apple zegt: “Een belangrijke richting van lopend werk zijn de systemen die voortbouwen op Overton om te helpen bij het beheer van data augmentation, programmatisch toezicht en samenwerking.”
Ik denk ook dat Overton implicaties heeft voor de privacy van gebruikers.
Denk er als volgt over:
Apple’s wetenschappers bouwen modellen waarvan ze denken dat ze zeer nauwkeurig zijn. Deze modellen draaien op het iOS-apparaat. Overton biedt die modellen een zekere mate van onafhankelijkheid en ML-systemen passen modellen aan op nauwkeurigheid en relevantie – allemaal zonder onderzoekers granulair inzicht te geven in individuele acties.
Dit betekent dat datamanagers (in dit geval de wetenschappers die die modellen in de eerste plaats maken) meer gegeneraliseerde strategische rollen bekleden waarin informatie over individuele gebruikers niet voor hen beschikbaar wordt gemaakt.
Apple creëert ML-machines om bepaalde gedefinieerde taken uit te voeren, terwijl het de machines zelf ook uitrust om de modellen die ze gebruiken te personaliseren. Dit lijkt te zijn waar Overton over gaat – en was zeker een deel van wat Apple dreef om Silk Labs te kopen.
Apple zegt dat Overton het eerste machine learning management systeem is dat is opgezet om de kwaliteit van applicaties te verbeteren en te bewaken. Tussen de regels door lezend, kan het (en ik benadruk “kan,” omdat ik niet beter weet) ook de technologie zijn die wordt gebruikt om te identificeren wanneer je je iPhone 11-camera op een huisdier richt voor een huisdierportret.
De wereld van morgen is een werk in uitvoering.
Volg me op Twitter, of voeg je bij me in de AppleHolic’s bar & grill en Apple Discussions groepen op MeWe.