Apple rakentaa koneoppimisjärjestelmää, joka hallitsee niitä kaikkia
Siriin on tulossa merkittäviä parannuksia iOS 13:n toimituksen jälkeen, joten Apple osallistuu tärkeimpään äänitekoälyä käsittelevään messutapahtumaan ja on julkaissut tutkimuksen, jossa se selittää joitakin yksityiskohtia ensimmäisestä koneoppimisesta (ML), jota se kutsuu Overtoniksi.”
Koneoppimisen ikkunan määrittely
Tällä viikolla Apple sponsoroi maailman suurinta puhutun kielen prosessointikonferenssia, Interspeech 2019:tä.
Osana tapahtumassa tehtävää työtään se on toimittanut useita tutkimuspapereita – ja sen kasvavien koneoppimistiimien jäsenet tapaavat siellä osallistujia.
Muun muassa (katso ne kaikki täältä) Apple esittelee papereita, jotka käsittelevät ilmaisun/tarkoituksen havaitsemista äänen avulla, puheentunnistuksen parantamista, tarkempien työkalujen kehittämistä puheen vivahteiden ymmärtämiseen, peilauksen käyttämistä ihmiskäyttäjien ja puheavustajien välisten suhteiden rakentamiseen sekä tekniikan käyttämistä puheenkorostuksen optimointiin.
Voi olla, että saamme tietää hieman enemmän siitä, mitä yhtiö puuhaa ML:ssä täysin uudessa Interspeech Youtube -portaalissa, vaikka emme tiedä, ilmestyykö sinne yhtään Applen videota.
Ei ole mikään yllätys, että Applen tutkijat ovat tekemisissä laajemman tiedeyhteisön kanssa. Yhtiö on julkaissut satunnaisia koneoppimispapereita ja -ilmoituksia omassa Machine Learning -portaalissaan vuodesta 2017 lähtien.
Overtonin esittely
Apple väittää, että Overton on ensimmäinen laatuaan oleva ratkaisu – sen tavoitteena on mahdollistaa se, että suuren osan ML-mallien personoinnista hallinnoi kone, ei ihminen.
Huomiovuorovaikutus on vain etupää siinä, mitä tapahtuu, kun kysyt Siriltä kysymyksen. Koneoppimismallien on sen jälkeen yritettävä ymmärtää kysymys, kontekstualisoida se ja keksiä tarkin vastaus. Laadukkaan vastauksen antaminen on itse asiassa vaikeampaa kuin miltä se näyttää.
Joidenkin kysymysten kohdalla Siri ei saa muuta kuin tietoja, jotka se on löytänyt Wikipedian sivulta (vaikka tällöinkin se on saattanut tarkistaa useita tällaisia sivuja valitakseen olennaisimman vastauksen). Mutta lopullisena tavoitteena on oltava se, että Siristä tulee tehokas lähde monimutkaisten ongelmien monimutkaisten vastausten löytämiseksi – jopa niin pitkälle, että se pystyy ennustamaan niitä.
Nämä seuraavat askeleet ovat vaikeita toteuttaa.
Miten tiedemiehet voivat tulla varmemmiksi siitä, että vastaus, jonka Siri joutuu antamaan, on tarkin mahdollinen?
Tällaiseen haasteeseen Apple vastaa Overtonilla, joka ”automatisoi mallien rakentamisen, käyttöönoton ja seurannan elinkaaren.”
Inhimillisessä mielessä tämä tarkoittaa, että kone itse korjaa ja säätää koneoppimisen malleja vastauksena ulkoisiin ärsykkeisiin tehden niistä tarkempia ja korjaten loogisia virheitä, jotka saattavat johtaa virheelliseen johtopäätökseen. Ajatuksena on, että ihminen voi sitten keskittyä koneoppimismallien huippuluokan valvontaan.
Tämä tarkoittaa (mielestäni) sitä, että sen sijaan, että ihmisen tarvitsisi tunkeutua syvälle yhä monimutkaisempaan koodiin tehdäkseen pieniä, mutta välttämättömiä säätöjä, hän voi pyytää joukon muutoksia, joita Overton sitten soveltaa.
Suorastaan kirjaimellisesti he kontrolloivat Overton-ikkunaa.
Kuinka Apple käyttää tätä?
Olen sitä mieltä, että Applen tavoitteet Sirin suhteen ulottuvat pidemmälle kuin siihen, että se on digitaalinen vastine hieman hyödyttömälle ystävälle, jota joskus kyselet, vaikka tiedät, ettet ehkä saa hyödyllistä vastausta.
Siristä on tarkoitus tulla ääniohjattu apuri, joka pystyy tuomaan korkeatasoista tietoa, kontekstisidonnaista analyysiä ja täydentämään jo tekemiäsi tehtäviä. Siri Suggestions osoittaa tätä suuntaa, vaikka toteutukset ovatkin vielä rajallisia.
Apple sanoo: ”Tärkeä meneillään olevan työn suunta ovat järjestelmät, jotka rakentuvat Overtonin varaan auttaakseen datan lisäämisen, ohjelmallisen valvonnan ja yhteistyön hallinnassa.”
Overtonilla on mielestäni myös vaikutuksia käyttäjien yksityisyyteen.
Ajattele asiaa näin:
Applen tutkijat rakentavat malleja, joiden he uskovat olevan erittäin tarkkoja. Nämä mallit toimivat iOS-laitteessa. Overton antaa näille malleille tietynasteisen riippumattomuuden, ja ML-järjestelmät säätävät malleja tarkkuuden ja tarkoituksenmukaisuuden mukaan – kaikki tämä ilman, että tutkijat saavat yksityiskohtaista tietoa yksittäisistä toimista.
Tämä tarkoittaa, että datan hallinnoijat (tässä tapauksessa ne tutkijat, jotka alun perin luovat nämä mallit) ovat yleisemmissä strategisissa rooleissa, joissa yksittäisiä käyttäjiä koskevia tietoja ei anneta heidän käyttöönsä.
Apple luo ML-koneita hoitamaan tiettyjä määriteltyjä tehtäviä ja samalla varustaa myös itse koneet, jotta ne pystyvät mukauttamaan yksilöllisesti käyttämiensä mallien sisältöä. Tästä Overtonissa näyttäisi olevan kyse – ja se oli varmasti osa sitä, mikä sai Applen ostamaan Silk Labsin.
Applen mukaan Overton on ensimmäinen koneoppimisen hallintajärjestelmä, joka on perustettu parantamaan ja valvomaan sovellusten laatua. Rivien välistä luettuna se saattaa (ja korostan ”saattaa”, koska en tiedä paremmasta) olla myös teknologia, jota käytetään tunnistamaan, milloin osoitat iPhone 11:n kameralla lemmikkiä lemmikkieläinmuotokuvaa varten.
Tomorrow’s world is a work in progress.
Seuratkaa minua Twitterissä tai liittykää mukaan AppleHolicin baarin & grilli- ja Apple-keskusteluryhmiin MeWe:ssä.