Itt van, miért hiszi az Apple, hogy az AI vezető – és miért mondja, hogy a kritikusok tévednek

A gépi tanulás (ML) és a mesterséges intelligencia (AI) ma már szinte minden funkciót áthat az iPhone-on, de az Apple nem reklámozza ezeket a technológiákat, mint néhány versenytársa. Szerettem volna többet megtudni az Apple megközelítéséről , ezért egy órán át beszélgettem az Apple két vezetőjével a vállalat stratégiájáról – és az AI-n és ML-en alapuló új funkciók adatvédelmi vonatkozásairól.

Történelmileg az Apple-nek nem az a hírneve, hogy vezető szerepet tölt be ezen a területen. Ez részben azért van, mert az emberek az AI-t a digitális asszisztensekkel azonosítják, és a kritikusok gyakran nevezik a Sirit kevésbé hasznosnak, mint a Google Assistantot vagy az Amazon Alexát. Az ML esetében pedig sok techrajongó azt mondja, hogy a több adat jobb modelleket jelent, de az Apple nem olyan adatgyűjtésről ismert, mint mondjuk a Google.

Ennek ellenére az Apple a legtöbb készülékébe dedikált hardvert épített a gépi tanulási feladatokhoz. A gépi intelligencia által vezérelt funkciók egyre inkább uralják a keynote-okat, amelyeken az Apple vezetői lépnek színpadra, hogy bemutassák az iPhone-ok, iPadek vagy az Apple Watch új funkcióit. Az Apple szilíciummal ellátott Mac-ek még az idén történő bevezetése a vállalat laptopjain és asztali számítógépein is számos gépi intelligencia-fejlesztést hoz majd.

Az Apple szilícium bejelentése után hosszasan beszélgettem John Giannandreával, az Apple gépi tanulási és AI-stratégiáért felelős alelnökével, valamint Bob Borcherrel, a termékmarketingért felelős alelnökkel. Leírták az Apple AI filozófiáját, elmagyarázták, hogy a gépi tanulás hogyan vezérel bizonyos funkciókat, és szenvedélyesen érveltek az Apple készüléken belüli AI/ML stratégiája mellett.

Mi az Apple AI stratégiája?

Mind Giannandrea, mind Borchers az elmúlt néhány évben csatlakozott az Apple-höz; korábban mindketten a Google-nél dolgoztak. Borchers tulajdonképpen egy hosszabb kihagyás után csatlakozott újra az Apple-höz; 2009-ig az iPhone marketingért felelős vezető igazgatója volt. Giannandrea 2018-as átigazolásáról a Google-től az Apple-hez pedig széles körben beszámoltak; korábban a Google mesterséges intelligenciáért és keresésért felelős vezetője volt.

A Google és az Apple meglehetősen különböző vállalatok. A Google arról híres, hogy részt vesz a mesterséges intelligencia kutatói közösségben, sőt egyes esetekben annak vezetője, míg az Apple korábban zárt ajtók mögött végezte munkájának nagy részét. Ez az elmúlt években megváltozott, mivel a gépi tanulás számos funkciót működtet az Apple készülékeiben, és az Apple fokozta elkötelezettségét az AI közösséggel.

“Amikor csatlakoztam az Apple-höz, már iPad-felhasználó voltam, és imádtam a Pencilt” – mondta Giannandrea (akit a kollégák csak “J.G.-nek” hívnak). “Ezért felkerestem a szoftvercsapatokat, és azt kérdeztem: “Oké, hol van a gépi tanulási csapat, amelyik a kézíráson dolgozik?”. És nem találtam.” Kiderült, hogy a csapat, amit keresett, nem létezik – ami szerinte meglepő volt, tekintve, hogy a gépi tanulás ma az egyik legjobb eszköz a funkcióhoz.

“Tudtam, hogy annyi gépi tanulás van, amit az Apple-nek meg kellene csinálnia, hogy meglepő volt, hogy valójában nem mindent csináltak meg. És ez drámaian megváltozott az elmúlt két-három évben” – mondta. “Tényleg őszintén úgy gondolom, hogy nincs olyan szeglete az iOS-nek vagy az Apple-élményeknek, amelyet ne alakítana át a gépi tanulás az elkövetkező néhány évben.”

Tovább

Megkérdeztem Giannandreát, miért érezte úgy, hogy az Apple a megfelelő hely számára. Válasza egyben a vállalat AI-stratégiájának tömör összefoglalása is volt:

Az Apple szerintem mindig is a kreativitás és a technológia metszéspontját képviselte. És úgy gondolom, hogy amikor intelligens élmények építésében gondolkodunk, a vertikális integráció, egészen az alkalmazásoktól kezdve a keretrendszereken át a szilíciumig, nagyon fontos… Szerintem ez egy utazás, és úgy gondolom, hogy ez a számítástechnikai eszközök jövője, hogy intelligensek legyenek, és hogy az intelligensek eltűnjenek.”

Borchers is beszállt, és hozzátette: “Ez egyértelműen a mi megközelítésünk, mindenben, amit csinálunk, az, hogy ‘Koncentráljunk arra, hogy mi az előny, és ne arra, hogy hogyan jutottunk oda’. És a legjobb esetben ez automatikus mágiává válik. Eltűnik… és csak arra koncentrálsz, hogy mi történt, nem pedig arra, hogy hogyan történt.”

A kézírás példájáról szólva Giannandrea ismét kifejtette, hogy az Apple van a legjobb helyzetben ahhoz, hogy “élen járjon az iparágban” a gépi intelligencia által vezérelt funkciók és termékek létrehozásában:

Mi készítettük a Pencilt, mi készítettük az iPadet, mi készítettük a szoftvert mindkettőhöz. Egyszerűen egyedülálló lehetőségek, hogy nagyon-nagyon jó munkát végezzünk. Miben végzünk igazán, igazán jó munkát? Lehetővé tesszük, hogy valaki jegyzetelhessen, és kreatív gondolatait digitális papírra vetítve produktív legyen. Engem az érdekel, hogy ezeket a tapasztalatokat hogyan használják a világban.”

Ezzel szembeállította a Google-t. “A Google egy csodálatos vállalat, és néhány igazán nagyszerű technológus dolgozik ott” – mondta. “De alapvetően más az üzleti modelljük, és nem arról híresek, hogy olyan fogyasztói élményeket szállítanak, amelyeket több százmillió ember használ.”

Hogyan használja ma az Apple a gépi tanulást?

Az Apple szokása, hogy a közelmúltban tartott marketingbemutatóin a gépi tanulást az iPhone, az Apple Watch vagy az iPad egyes funkcióinak javításával magyarázza, de ritkán megy bele a részletekbe – és a legtöbb iPhone-vásárló amúgy sem nézte meg ezeket a bemutatókat. Ezzel szemben például a Google, amely a fogyasztóknak szóló üzenetei nagy részében a mesterséges intelligenciát helyezi a középpontba.

A gépi tanulás alkalmazására számos példa van az Apple szoftvereiben és eszközeiben, amelyek többsége csak az elmúlt néhány évben jelent meg.

A gépi tanulást arra használják, hogy az iPad szoftvere megkülönböztesse, hogy a felhasználó véletlenül a képernyőhöz nyomja-e a tenyerét, miközben az Apple Pencil-lel rajzol, vagy szándékosan nyomja, hogy inputot adjon. A rendszer a felhasználók használati szokásait figyeli, hogy optimalizálja a készülék akkumulátorának élettartamát és töltését, egyrészt a felhasználók által két töltés között eltölthető idő növelése, másrészt az akkumulátor hosszú távú életképességének védelme érdekében. Alkalmazásajánlások készítésére is használják.

Reklám

Aztán ott van a Siri, amely talán az egyetlen dolog, amit minden iPhone-felhasználó azonnal mesterséges intelligenciaként érzékel. A gépi tanulás a Siri számos aspektusát vezérli, a beszédfelismeréstől kezdve a Siri azon kísérleteiig, hogy hasznos válaszokat adjon.

A hozzáértő iPhone-tulajdonosok azt is észrevehetik, hogy a gépi tanulás áll a Fotók alkalmazás azon képessége mögött, hogy automatikusan előre elkészített galériákba rendezi a képeket, vagy hogy pontosan kiadja a Jane nevű barátnő fényképeit, ha a nevét beírjuk az alkalmazás keresőmezőjébe.

Más esetekben talán kevés felhasználó veszi észre, hogy a gépi tanulás dolgozik. Az iPhone például gyors egymásutánban több képet is készíthet, valahányszor megérinti az exponáló gombot. Egy ML-tréninggel képzett algoritmus ezután minden egyes képet elemez, és képes az egyes képek általa legjobbnak ítélt részeit egyetlen eredménnyé összeállítani.

AI áll az Apple Apple Watch kézmosást segítő funkciója mögött.
Nagyítás / AI is behind Apple’s handwashing assistance feature in the Apple Watch.
Sam Machkovech

A telefonok már régóta tartalmaznak képjelfeldolgozó processzorokat (ISP) a fényképek minőségének digitális és valós idejű javítására, de az Apple 2018-ban felgyorsította a folyamatot azzal, hogy az iPhone-ban lévő ISP szorosan együttműködik a Neural Engine-nel, a vállalat nemrég hozzáadott, gépi tanulásra összpontosító processzorával.

Megkértem Giannandreát, hogy nevezzen meg néhányat azok közül, amelyekkel az Apple a gépi tanulást használja a legújabb szoftverekben és termékekben. Egy mosodai listát adott a példákról:

Egy csomó új élmény van, amelyet a gépi tanulás hajt. És ezek olyan dolgok, mint a nyelvi fordítás, vagy a készüléken történő diktálás, vagy az egészséggel kapcsolatos új funkcióink, mint az alvás és a kézmosás, és olyan dolgok, amiket a múltban már kiadtunk a szív egészségével és hasonló dolgokkal kapcsolatban. Azt hiszem, egyre kevesebb és kevesebb olyan hely van az iOS-ben, ahol nem használunk gépi tanulást.

Nehéz olyan részét találni az élménynek, ahol nem használunk valamilyen előrejelzést. Például az alkalmazás-előrejelzések, vagy a billentyűzet-előrejelzések, vagy a modern okostelefon-kamerák rengeteg gépi tanulást végeznek a színfalak mögött, hogy kitalálják, amit “saliency”-nek hívnak, ami azt jelenti, hogy mi a legfontosabb része a képnek. Vagy ha elképzeli, hogy elmosja a hátteret, akkor portré módot csinál.

Mindezek a dolgok hasznát veszik az Apple platformjába épített alapvető gépi tanulási funkcióknak. Szinte olyan, mintha azt kérdeznénk: “Találj nekem valamit, ahol nem használunk gépi tanulást.”

Borchers a hozzáférhetőségi funkciókat is fontos példaként említette. “Ezek alapvetően emiatt válnak elérhetővé és lehetővé” – mondta. “Az olyan dolgok, mint a hangfelismerő képesség, ami játékmegváltó az adott közösség számára, az időbeli befektetések és a beépített képességek miatt vált lehetségessé.”

Továbbiakban talán észrevették, hogy az Apple szoftver- és hardverfrissítései az elmúlt néhány évben a kiterjesztett valóság funkciókra helyezték a hangsúlyt. Ezen funkciók többsége a gépi tanulásnak köszönhetően vált lehetővé. Per Giannandrea:

A gépi tanulást sokat használják a kiterjesztett valóságban. A nehéz probléma ott az úgynevezett SLAM, azaz Simultaneous Localization And Mapping. Tehát próbáljuk megérteni, hogy ha van egy iPaded egy lidar szkennerrel, és mozogsz, mit lát? És felépíteni egy 3D modellt arról, amit valójában lát.

Ez ma már mély tanulást használ, és ezt az eszközön kell tudni elvégezni, mert valós időben kell tudni elvégezni. Nem lenne értelme, ha az iPaddel hadonászna, majd esetleg az adatközpontban kellene ezt megtennie. Szóval általánosságban azt mondanám, hogy én úgy gondolkodom erről, hogy a mélytanulás különösen lehetővé teszi számunkra, hogy a nyers adatokból az adatok szemantikájába lépjünk.”

A gépi tanulási feladatokat az Apple egyre inkább helyben, az eszközön végzi, olyan hardvereken, mint az Apple Neural Engine (ANE) vagy a vállalat saját tervezésű GPU-in (grafikus feldolgozó egység). Giannandrea és Borchers szerint ez a megközelítés az, ami megkülönbözteti az Apple stratégiáját a versenytársak közül.

Miért a készüléken végezzük?

A beszélgetésünk során Giannandrea és Borchers is szenvedélyesen érvelt amellett, hogy az imént ismertetett funkciók azért lehetségesek, mert – és nem annak ellenére – minden munka helyben, a készüléken történik.

Van egy általános narratíva, amely a gépi tanulást arra az elképzelésre egyszerűsíti, hogy a több adat jobb modelleket jelent, ami viszont jobb felhasználói élményt és termékeket jelent. Ez az egyik oka annak, hogy a szemlélők gyakran a Google-t, az Amazont vagy a Facebookot jelölik meg a mesterséges intelligenciával foglalkozó kakasülő valószínűsíthető uralkodójaként; ezek a vállalatok hatalmas adatgyűjtő motorokat működtetnek, részben azért, mert ők működtetik és teljes rálátásuk van arra, ami a világ nagy része számára kulcsfontosságú digitális infrastruktúrává vált. Ezzel a mércével mérve az Apple-t egyesek nem tartják valószínűnek, hogy ugyanolyan jól teljesít, mert az üzleti modellje más, és nyilvánosan elkötelezte magát az adatgyűjtés korlátozása mellett.

Amikor ezeket a perspektívákat ismertettem Giannandreával, nem fogta vissza magát:

Igen, megértem ezt a felfogást, hogy az adatközpontok nagyobb modelljei valahogy pontosabbak, de ez valójában téves. Ez valójában technikailag téves. Jobb a modellt az adatokhoz közel futtatni, mint az adatokat mozgatni. És legyen szó akár helymeghatározási adatokról – például arról, hogy mit csinálsz -, edzési adatokról – mit csinál a gyorsulásmérő a telefonodban -, egyszerűen jobb közel lenni az adatok forrásához, és így az adatvédelem is megmarad.

Borchers és Giannandrea is többször rámutatott arra, hogy az adatközpontban végzett munka milyen hatással van az adatvédelemre, de Giannandrea szerint a helyi feldolgozás a teljesítményről is szól.

“Az egyik másik nagy dolog a késleltetés” – mondta. “Ha valamit egy adatközpontba küldünk, nagyon nehéz valamit képkockasebességgel elvégezni. Ezért rengeteg alkalmazásunk van az alkalmazásboltban, amelyek olyan dolgokat csinálnak, mint például a pózbecslés, például kitalálják, hogy az ember mozog, és azonosítják, hogy hol vannak a lábai és a karjai, például. Ez egy magas szintű API, amit mi kínálunk. Ez csak akkor hasznos, ha ezt lényegében képkocka sebességgel tudod megtenni.”

Reklám

Egy másik fogyasztói felhasználási példát hozott:

Fotózol, és a fényképezés előtti pillanatokban a kamera mindent valós időben lát. Segíthet meghozni a döntést arról, hogy mikor készítsd el a fényképet. Ha ezt a döntést a szerveren akarnád meghozni, akkor minden egyes képkockát el kellene küldened a szervernek, hogy eldönthesd, hogyan készítsd el a fényképet. Ennek semmi értelme, igaz? Szóval rengeteg olyan élményt szeretnénk létrehozni, amit jobban meg lehet csinálni az eszközön.”

A kérdésre, hogy az Apple hogyan választja ki, hogy mikor csináljon valamit az eszközön, Giannandrea válasza egyszerű volt: “

Továbbá mindkét Apple-vezető az Apple egyedi szilíciumát – konkrétan az Apple Neural Engine (ANE) szilíciumot, amely az iPhone 8 és az iPhone X óta szerepel az iPhone-okban – az eszközön történő feldolgozás előfeltételeként említette. A Neural Engine egy okta-magos neurális feldolgozó egység (NPU), amelyet az Apple bizonyos típusú gépi tanulási feladatok megoldására tervezett.

Hirdetés

“Ez egy többéves út, mert öt évvel ezelőtt még nem állt rendelkezésre a hardver, hogy ezt az élen elvégezzük” – mondta Giannandrea. “Az ANE kialakítása teljesen skálázható. Egy iPadben nagyobb ANE van, mint egy telefonban, mint egy Apple Watch-ban, de a CoreML API réteg az alkalmazásainkhoz és a fejlesztői alkalmazásokhoz is alapvetően ugyanaz az egész termékcsaládban.”

Amikor az Apple nyilvánosan beszélt a Neural Engine-ről, a vállalat teljesítményszámokat osztott meg, például 5 billió műveletet másodpercenként a 2018-as A12 chipben. De a chip architektúrájáról nem lett pontosabb. Ez szó szerint egy fekete doboz az Apple prezentációinak diáin.

Apple's Neural Engine from the presentation stage.
Apple’s Neural Engine from the presentation stage.

Ezek ismeretében szerettem volna tudni, hogy Giannandrea többet árul-e el arról, hogyan működik a Neural Engine a motorháztető alatt, de nem volt hajlandó részletekbe bocsátkozni. Ehelyett azt mondta, hogy az alkalmazásfejlesztők mindent megtudhatnak a CoreML-ből – egy szoftverfejlesztői API-ból, amely hozzáférést biztosít a fejlesztőknek az iPhone gépi tanulási képességeihez.

A CoreML fejlesztői API nagyon világosan leírja, hogy milyen gépi tanulási modelleket, futásidejű modelleket támogatunk… Egyre több magot támogatunk. És a CoreML-t bármelyik népszerű gépi tanulási dologból, mint például a PyTorch vagy a TensorFlow, megcélozod, majd lényegében lefordítod a modelled, és átadod a CoreML-nek.

A CoreML feladata, hogy kitalálja, hol futtassa a modellt. Lehet, hogy az a helyes, ha a modellt az ANE-n futtatjuk, de az is lehet, hogy az a helyes, ha a modellt a GPU-n vagy a CPU-n futtatjuk. És a CPU-nk is rendelkezik optimalizációkkal a gépi tanuláshoz.”

A beszélgetésünk során mindkét vezető ugyanúgy utalt harmadik féltől származó fejlesztői alkalmazásokra, mint az Apple sajátjaira. A stratégia itt nem csak az Apple által készített szolgáltatások és funkciók meghajtásáról szól, hanem arról is, hogy a képességek legalább egy részét megnyitják a fejlesztők nagy közössége előtt. Az Apple az App Store 2008-as megnyitása óta a fejlesztőkre támaszkodik a platformjain történő innovációban. A vállalat gyakran kölcsönöz ötleteket, amelyekkel ezek a fejlesztők álltak elő, amikor saját, saját fejlesztésű alkalmazásait frissíti.

Természetesen nem az Apple készülékei az egyetlenek, amelyekbe gépi tanulási chipeket építettek be. A Samsung, a Huawei és a Qualcomm például mind tartalmaz NPU-t a system-on-a-chip rendszereiben. És a Google is kínál gépi tanulási API-kat a fejlesztőknek. A Google stratégiája és üzleti modellje mégis jelentősen különbözik. Az androidos telefonok közel sem végeznek olyan széles körű gépi tanulási feladatokat helyben.

Macsok Apple-szilíciummal

A Giannandreával és Borchersszel készített interjúm középpontjában nem az a nagy bejelentés állt, amelyet a vállalat néhány hete tett a WWDC-n – az Apple-szilíciummal ellátott Macek közelgő bevezetése. De amikor azt találgattam, hogy az Apple számos oka közül az egyik, amiért a Mac-eket a saját chipjei köré tervezi, a Neural Engine beépítése lehet, Borchers azt mondta:

Először lesz közös platformunk, egy olyan szilíciumplatform, amely támogatni tudja azt, amit mi akarunk, és amit a fejlesztőink akarnak….. Ez a képesség felszabadít néhány érdekes dolgot, amire mi is gondolhatunk, de ami valószínűleg még fontosabb, hogy sok mindent felszabadít majd más fejlesztők számára is, ahogy haladnak előre.

Az első Mac az Apple szilíciummal, technikailag: a fejlesztői átmeneti készlet.
Nagyítás / The first Mac with Apple silicon, technically: the developer transition kit.
Sam Machkovech

Giannandrea egy konkrét példát mondott arra, hogyan fogják használni az Apple gépi tanulási eszközeit és hardverét a Mac-en:

Nem tudom, láttad-e azt a demót az State of the Unionban, de alapvetően az volt az ötlet: adott egy videó, menj végig a videón képkockánként vagy képkockánként, és végezz objektumfelismerést. És ezt több mint egy nagyságrenddel gyorsabban meg lehet csinálni a mi szilíciumunkon, mint a hagyományos platformon.

És akkor azt mondod: “Nos, ez érdekes. Nos, miért hasznos ez?” Képzelj el egy videószerkesztőt, ahol van egy keresőmező, és azt mondhatod: “Keresd meg nekem a pizzát az asztalon”. És a képkocka csak átmászna arra a képkockára… Ezek azok a fajta tapasztalatok, amelyekkel szerintem az emberek elő fognak állni. Nagyon szeretnénk, ha a fejlesztők használnák ezeket a keretrendszereket, és meglepnének minket azzal, hogy mire képesek vele.

Az Apple a fejlesztői konferenciáján elmondta, hogy még ebben az évben saját szilíciummal ellátott Mac-eket tervez szállítani.

Mi lesz az adatvédelemmel?

Az elmúlt néhány évben az Apple a felhasználóknak szóló üzeneteinek középpontjában az adatvédelem állt. Újra és újra szóba került a keynote-előadásokon és a marketinganyagokban, az iOS-ben mindenhol emlékeztetők vannak róla, és gyakran szóba kerül az interjúkban is – így volt ez most is.

“Az emberek aggódnak az AI miatt, mert nem tudják, mi az” – mondta Giannandrea. “Azt hiszik, hogy többre képes, mint amennyire valójában, vagy a mesterséges intelligenciáról alkotott sci-fi nézetre gondolnak, és olyan befolyásos emberek, mint Bill Gates, Elon Musk és mások azt mondják, hogy ez egy veszélyes technológia.”

Úgy véli, hogy a más nagy technológiai cégek mesterséges intelligencia körüli felhajtása negatív, nem pedig pozitív hatással van e cégek marketingtevékenységére, “mert az emberek aggódnak e technológia miatt.”

A “AI” kifejezés itt talán nem segít. Olyan rosszindulatú szintetikus gonosztevőket idéz a popkultúrából, mint a Skynet vagy a HAL 9000. De az alkalmazott mesterséges intelligencia legtöbb szakértője azt fogja mondani, hogy ez a sötét végkifejlet távol áll a valóságtól. A gépi tanulás által vezérelt technológia számos kockázatot hordoz – például az emberi előítéletek átörökítését és felerősítését -, de a közeljövőben nem tűnik valószínűnek, hogy a gépek elszabadulnak és erőszakosan megtámadják az emberiséget.

Hirdetés

A gépi tanulás valójában nem teszi a gépeket ugyanolyan intelligenssé, mint az embereket. Emiatt és más okok miatt sok AI-szakértő (köztük Giannandrea is) olyan alternatív kifejezéseket javasolt, mint a “gépi intelligencia”, amelyek nem vonnak párhuzamot az emberi intelligenciával.

Bármilyen nevezéktanról is legyen szó, a gépi tanulás egy nagyon is valós és jelenlévő veszélyt hozhat magával: a felhasználók magánéletének aláásását. Egyes vállalatok agresszívan gyűjtik a felhasználók személyes adatait, és feltöltik azokat adatközpontokba, a gépi tanulással és képzéssel indokolva ezt.

Amint fentebb említettük, az Apple ennek a gyűjtésnek és feldolgozásnak nagy részét helyben, a felhasználó készülékén végzi. Giannandrea kifejezetten adatvédelmi aggályokhoz kötötte ezt a döntést. “Úgy gondolom, hogy nagyon világos álláspontunk van ezzel kapcsolatban, miszerint ezt a gépi tanulással kapcsolatos fejlett technológiát a lehető legtöbb esetben a készülékeden fogjuk elvégezni, és az adatok nem fogják elhagyni a készülékedet” – mondta. “Van egy nagyon világos nyilatkozatunk arról, hogy miért gondoljuk, hogy az eszközeink biztonságosabbak vagy jobbak, vagy miért kell jobban megbízni bennük.”

Hirdetés

Ez a filozófia konkrét példájaként a szövegről beszédre történő átvitelt hozta fel:

Ha valami olyasmit mondasz, hogy “Olvasd fel nekem az üzeneteimet Bobtól”. A szöveg beszéddé alakítása az eszközön, a Neural Engine-en – a Neural Engine és a CPU kombinációján – történik. És emiatt sosem láttuk a Bobtól kapott üzeneted tartalmát, mert a telefonod olvassa fel – nem a szerverek olvassák fel. Tehát az üzenet tartalma soha nem jutott el a szerverre…

Ez tehát egy nagyszerű példa arra, hogy a fejlett technológia ténylegesen javítja mind a felhasználói hasznosságot, mert a hangot a készülék szintetizálja, így még akkor is működik, ha nincs összekapcsolva. De az adatvédelmi történet is. Ezt valójában nagyon nehéz megcsinálni. Rengeteg igazán kemény mérnöki munka ment bele abba, hogy a modern, kiváló minőségű hangot egy olyan eszközön szintetizálják, amelyet a zsebébe tehet.

Természetesen sok esetben fel kell használni a felhasználói adatokat a gépi tanuláshoz. Tehát pontosan hogyan használja fel az Apple az általa kezelt felhasználói adatokat? Giannandrea elmagyarázta:

Általánosságban elmondható, hogy kétféleképpen építünk modelleket. Az egyik, amikor adatokat gyűjtünk és címkézünk, ami sok-sok esetben megfelelő. És van az az eset, amikor megkérjük a felhasználókat, hogy adományozzák az adataikat. A legjelentősebb példa erre a Siri, ahol az iPhone beállításakor azt kérdezzük: “Szeretne segíteni a Siri jobbá tételében?”

Ez egy olyan eset, amikor bizonyos mennyiségű adatot adományoznak nekünk, majd ennek egy nagyon kis százalékát felhasználhatjuk a képzéshez. De sok-sok dologról beszélünk itt – például a kézírásról – elegendő adatot tudunk gyűjteni ahhoz, hogy a modellt úgy képezzük ki, hogy alapvetően mindenki kézírásával tudjon dolgozni, anélkül, hogy bármilyen fogyasztói adatot felhasználnánk.

Néhány ilyen, az adatok felhasználását kérő kérés a közelmúltban került be. Tavaly nyáron egy jelentés jelezte, hogy a Siri véletlen aktiválások után rögzítette, amit a felhasználók mondtak; a Siri funkcióinak minőségbiztosításával megbízott vállalkozók hallhatták e felvételek egy részét.

Az Apple válaszul kötelezettséget vállalt arra, hogy csak akkor tárolja a Sirivel kapcsolatos hangokat, ha a felhasználók kifejezetten úgy döntöttek, hogy a felvételek megosztásával jobbá teszik a Sirit (ezt a viselkedést az iOS 13.2-ben vezették be), majd az összes minőségbiztosítást házon belülre vitték. Megkérdeztem, mit csinál az Apple másképp, mint a vállalkozók tették ezekkel az adatokkal. Giannandrea válaszolt:

Egy csomó biztosítékunk van. Például van egy folyamat annak azonosítására, hogy a hangot az asszisztensnek szánták-e vagy sem, ami teljesen elkülönül a hang tényleges felülvizsgálatának folyamatától. Tehát rengeteg belső dolgot teszünk annak érdekében, hogy megbizonyosodjunk arról, hogy nem rögzítünk – és aztán tulajdonképpen el is dobunk – semmilyen véletlen hangfelvételt.

De ha nem hajlandóak ténylegesen minőségbiztosítást végezni, hogy a lényegre térjek, a funkciót, akkor a véletlen felvételek soha nem lesznek jobbak. Mint tudod, a gépi tanulás megköveteli, hogy folyamatosan javítsd. Tehát mi valójában átdolgoztuk egy csomó munkafolyamatainkat és folyamatainkat azzal egy időben, amikor a munkát házon belülre hoztuk. Nagyon biztos vagyok benne, hogy az egyik legjobb folyamatunk van az asszisztens adatvédelmi szempontból történő fejlesztésére.”

Egyértelmű, hogy az Apple az adatvédelmi védelmet a készülékei egyik legfontosabb funkciójaként kívánja előtérbe helyezni; Giannandrea részéről ez valódi meggyőződésnek tűnt. De ez segíthet az Apple-nek a piacon is, mivel a legnagyobb versenytársának a mobil térben sokkal rosszabb az előélete az adatvédelem terén, és ez nyitva hagyja a lehetőséget, mivel a felhasználók egyre jobban aggódnak az AI adatvédelmi vonatkozásai miatt.

A beszélgetésünk során Giannandrea és Borchers is visszatért az Apple stratégiájának két pontjára: 1) a gépi tanulási feladatok helyben történő elvégzése nagyobb teljesítményt nyújt, és 2) ez “adatvédelemmel” jár – ezt a konkrét megfogalmazást Giannandrea többször is megismételte a beszélgetésünk során.

A fekete doboz belsejében

Miután az Apple sokáig többnyire a sötétben dolgozott a mesterséges intelligencia funkciókon, az elmúlt néhány évben jelentősen kibővült a gépi tanulásra helyezett hangsúly.

A vállalat rendszeresen publikál, tudományos támogatásokat vállal, ösztöndíjai vannak, laboratóriumokat szponzorál, AI/ML konferenciákra jár. Nemrégiben újraindított egy gépi tanulási blogot, ahol megosztja kutatásainak egy részét. A vállalat emellett bőszen alkalmazza a mérnököket és másokat is a gépi tanulás területén – köztük magát Giannandreát is, alig két évvel ezelőtt.

Hirdetés

Nem vezet a kutatói közösségben úgy, mint a Google, de az Apple azt állítja, hogy legalább abban vezet, hogy a gépi tanulás gyümölcseit több felhasználóhoz juttatja el.

Emlékszel, amikor Giannandrea azt mondta, meglepte, hogy a gépi tanulást nem használják a kézírásra a Pencil segítségével? A továbbiakban megnézte annak a csapatnak az alkotását, amelyik ezt megvalósította. És más csapatokkal együtt haladtak előre a gépi tanulással vezérelt kézírással – ez az iPadOS 14 sarokköve.

“Rengeteg csodálatos gépi tanulással foglalkozó szakemberünk van az Apple-nél, és továbbra is alkalmazzuk őket” – mondta Gianandrea. “Nagyon könnyűnek találom, hogy világszínvonalú embereket vonzzunk az Apple-hez, mert a termékeinkben egyre nyilvánvalóbbá válik, hogy a gépi tanulás kritikus fontosságú azokhoz az élményekhez, amelyeket a felhasználók számára szeretnénk létrehozni.”

Egy rövid szünet után hozzátette: “Azt hiszem, a legnagyobb problémám az, hogy a legambiciózusabb termékeink közül sok olyan, amelyről nem beszélhetünk, és így egy kis értékesítési kihívás azt mondani valakinek, hogy ‘Gyere és dolgozz a valaha volt legambiciózusabb dolgon, de nem mondhatom el, mi az’.'”

Hirdetés

Ha hinni lehet a nagy technológiai vállalatoknak és a kockázati tőkebefektetéseknek, az AI és a gépi tanulás az elkövetkező években csak még inkább mindenütt jelen lesz. Bárhogy is alakuljon, Giannandrea és Borchers egy dolgot világossá tettek: a gépi tanulás már most szerepet játszik az Apple termékeinek nagy részében, és számos olyan funkcióban, amelyet a fogyasztók naponta használnak. És mivel a Neural Engine idén ősztől érkezik a Mac számítógépekre, a gépi tanulás szerepe az Apple-nél valószínűleg tovább fog nőni.