Az Apple egy olyan gépi tanulási rendszert épít, amely mindannyiukat uralja

Mivel a Siri jelentős fejlesztéseken fog átesni, amint az iOS 13 megjelenik, az Apple megjelenik egy fontos hangalapú mesterséges intelligencia kiállításon, és közzétett egy tanulmányt, amely elmagyarázza az első olyan gépi tanulási (ML) technológia néhány részletét, amelyet “Overton”-nak nevez.”

A gépi tanulás ablakának meghatározása

Az Apple ezen a héten szponzorálja a világ legnagyobb beszéltnyelv-feldolgozó konferenciáját, az Interspeech 2019-et.

A rendezvényen végzett munkája részeként több kutatási tanulmányt is benyújtott – és növekvő gépi tanulási csapatainak tagjai ott találkoznak majd a résztvevőkkel.

A többi téma mellett (az összeset itt találja) az Apple előadásokat tart a kifejezés/szándék hangon keresztüli érzékeléséről, a hangfelismerés javításáról, a beszéd árnyalatait pontosabban megértő eszközök fejlesztéséről, a tükrözés alkalmazásáról az emberi felhasználók és a beszédasszisztensek közötti kapcsolatok kiépítésére, valamint a beszédjavítás optimalizálására szolgáló technológia alkalmazásáról.

A teljesen új Interspeech Youtube portálon megtudhatunk még egy kicsit többet arról, hogy mire készül a vállalat az ML-ben, bár nem tudjuk, hogy megjelenik-e ott bármilyen Apple videó.

Nem meglepő, hogy az Apple tudósai a szélesebb tudományos közösséggel is kapcsolatba lépnek. A vállalat 2017 óta tesz közzé szórványosan gépi tanulási tanulmányokat és bejelentéseket a saját Machine Learning portálján.

Az Overton bemutatása

Az Apple azt állítja, hogy az Overtonnal a maga nemében első megoldást kínál – célja, hogy az ML modellek személyre szabásának nagy részét a gép, ne pedig az ember kezelje.

A hangalapú interakció csak a front-endje annak, ami akkor történik, amikor a Siritől kérdést teszünk fel. A gépi tanulási modelleknek ezután meg kell próbálniuk megérteni a kérdést, kontextusba helyezni azt, és kitalálni a legpontosabb választ. A jó minőségű válasz megadása valójában nehezebb, mint amilyennek látszik.

Néhány kérdés esetén a Siri csak olyan adatokat kap, amelyeket egy Wikipedia-oldalon talált (bár még ekkor is előfordulhat, hogy több ilyen oldalt is megnézett, hogy kiválassza a legmegfelelőbb választ). De a végső célnak annak kell lennie, hogy a Siri hatékony forrássá váljon az összetett problémákra adott komplex válaszok tekintetében – akár olyannyira, hogy meg is tudja jósolni azokat.

Ezek a következő lépések nehezen megvalósíthatóak.

Hogyan lehetnek a tudósok biztosabbak abban, hogy a Siri által adandó válasz az elérhető legpontosabb?

Ez az a fajta kihívás, amelyet az Apple az Overtonnal old meg, amely “automatizálja a modellépítés, a telepítés és a felügyelet életciklusát.”

Emberi nyelven ez azt jelenti, hogy a gép maga javítja és módosítja a gépi tanulási modelleket külső ingerekre reagálva, pontosabbá téve azokat, és kijavítva a logikai hibákat, amelyek helytelen következtetéshez vezethetnek. Az ötlet lényege, hogy az emberek ezután a gépi tanulási modellek magas szintű felügyeletére koncentrálhatnak.

Ez (szerintem) azt jelenti, hogy ahelyett, hogy az embereknek az egyre összetettebb kódok mélyére kellene hatolniuk, hogy apró, de szükséges módosításokat végezzenek, az emberek kérhetnek egy sor módosítást, amit aztán az Overton-ablak alkalmaz.

A szó szoros értelmében ők irányítják az Overton ablakot.

Hogyan fogja ezt használni az Apple?

Az Apple céljai a Sirivel kapcsolatban szerintem túlmutatnak azon, hogy az a kissé haszontalan barát digitális megfelelője legyen, akit néha megkérdezel, bár tudod, hogy nem biztos, hogy hasznos választ kapsz.

A Sirit olyan hangvezérelt segítőnek szánják, amely képes magas szintű információkkal, kontextuális elemzésekkel és a már elvégzett feladatok bővítésével szolgálni. A Siri Suggestions ezt az irányt mutatja, bár a megvalósítások még korlátozottak.

Az Apple szerint: “A folyamatban lévő munka egyik fő iránya az Overtonra épülő rendszerek, amelyek segítik az adatbővítés, a programfelügyelet és az együttműködés kezelését.”

Az Overtonnak szerintem is vannak felhasználói adatvédelmi vonatkozásai.

Gondoljunk csak bele:

Az Apple tudósai olyan modelleket építenek, amelyekről úgy gondolják, hogy nagyon pontosak. Ezek a modellek az iOS eszközön futnak. Overton bizonyos fokú függetlenséget biztosít ezeknek a modelleknek, és az ML-rendszerek beállítják a modelleket a pontosság és a relevancia érdekében – mindezt anélkül, hogy a kutatóknak részletes betekintést adnának az egyéni cselekvésekbe.

Ez azt jelenti, hogy az adatkezelők (ebben az esetben a modelleket eleve létrehozó tudósok) általánosabb stratégiai szerepeket töltenek be, amelyekben az egyes felhasználókra vonatkozó információk nem állnak rendelkezésükre.

Az Apple ML-gépeket hoz létre bizonyos meghatározott feladatok elvégzésére, miközben magukat a gépeket is felszereli az általuk használt modellek személyre szabására. Úgy tűnik, erről szól az Overton – és minden bizonnyal részben ez volt az, ami az Apple-t a Silk Labs megvásárlására ösztönözte.

Az Apple szerint az Overton az első olyan gépi tanulási menedzsmentrendszer, amelyet az alkalmazások minőségének javítására és ellenőrzésére hoztak létre. A sorok között olvasva ez lehet (és hangsúlyozom, hogy “lehet”, mivel nem tudok jobbat) az a technológia is, amellyel azonosítani lehet, ha az iPhone 11 kameráját egy háziállatra irányítja a háziállat-portré elkészítéséhez.

A holnap világa egy folyamatban lévő munka.

Kérem, kövessenek a Twitteren, vagy csatlakozzanak hozzám az AppleHolic’s bar & grill és Apple Discussions csoportokban a MeWe-n.