Iată de ce Apple crede că este lider în materie de inteligență artificială – și de ce spune că criticii se înșeală
Învățarea mașinilor (ML) și inteligența artificială (AI) se regăsesc acum în aproape toate funcțiile de pe iPhone, dar Apple nu a promovat aceste tehnologii așa cum au făcut-o unii dintre concurenții săi. Am vrut să înțeleg mai multe despre abordarea Apple , așa că am petrecut o oră discutând cu doi directori Apple despre strategia companiei – și despre implicațiile asupra vieții private ale tuturor noilor caracteristici bazate pe AI și ML.
Din punct de vedere istoric, Apple nu a avut o reputație publică de lider în acest domeniu. Acest lucru se datorează parțial faptului că oamenii asociază AI cu asistenții digitali, iar recenzenții numesc frecvent Siri mai puțin util decât Google Assistant sau Amazon Alexa. Iar în cazul ML, mulți pasionați de tehnologie spun că mai multe date înseamnă modele mai bune – dar Apple nu este cunoscută pentru colectarea de date în același mod ca, de exemplu, Google.
În ciuda acestui fapt, Apple a inclus hardware dedicat pentru sarcinile de învățare automată în majoritatea dispozitivelor pe care le livrează. Funcționalitățile bazate pe inteligența mașinilor domină din ce în ce mai mult discursurile cheie în care directorii Apple urcă pe scenă pentru a prezenta noi caracteristici pentru iPhone-uri, iPad-uri sau Apple Watch. Introducerea Mac-urilor cu siliciu Apple în cursul acestui an va aduce multe dintre aceleași dezvoltări ale inteligenței automate și pe laptopurile și desktop-urile companiei.
În urma anunțului privind siliciul Apple, am discutat îndelung cu John Giannandrea, vicepreședinte senior al Apple pentru învățare automată și strategie AI, precum și cu Bob Borchers, vicepreședinte al departamentului de marketing al produselor. Aceștia au descris filozofia Apple în materie de inteligență artificială, au explicat modul în care învățarea automată determină anumite caracteristici și au susținut cu pasiune strategia Apple privind AI/ML pe dispozitiv.
Care este strategia Apple în materie de inteligență artificială?
Atât Giannandrea, cât și Borchers s-au alăturat Apple în ultimii doi ani; fiecare a lucrat anterior la Google. Borchers s-a reîntors de fapt la Apple după o perioadă de absență; el a fost director senior de marketing pentru iPhone până în 2009. Iar defecțiunea lui Giannandrea de la Google la Apple în 2018 a fost raportată pe scară largă; el fusese șeful departamentului de inteligență artificială și căutare al Google.
Google și Apple sunt companii destul de diferite. Google are reputația de a participa și, în unele cazuri, de a conduce comunitatea de cercetare în domeniul IA, în timp ce Apple obișnuia să își desfășoare cea mai mare parte a activității în spatele ușilor închise. Acest lucru s-a schimbat în ultimii ani, deoarece învățarea automată alimentează numeroase funcții ale dispozitivelor Apple, iar Apple și-a sporit angajamentul față de comunitatea AI.
„Când m-am alăturat companiei Apple, eram deja un utilizator de iPad și îmi plăcea mult Creionul”, mi-a spus Giannandrea (căruia colegii îi spun „J.G.”). „Așa că am dat de urma echipelor de software și am întrebat: „Bine, unde este echipa de învățare automată care lucrează la scrisul de mână?”. Și nu am putut să o găsesc”. S-a dovedit că echipa pe care o căuta nu exista – o surpriză, a spus el, având în vedere că învățarea automată este unul dintre cele mai bune instrumente disponibile pentru această funcție în prezent.
„Știam că sunt atât de multe lucruri de învățare automată pe care Apple ar trebui să le facă, încât era surprinzător faptul că nu se făcea chiar totul. Iar acest lucru s-a schimbat dramatic în ultimii doi-trei ani”, a spus el. „Cred sincer că nu există niciun colț din iOS sau din experiențele Apple care să nu fie transformat de învățarea automată în următorii câțiva ani.”
L-am întrebat pe Giannandrea de ce a simțit că Apple a fost locul potrivit pentru el. Răspunsul său s-a dublat de un rezumat succint al strategiei AI a companiei:
Cred că Apple a reprezentat întotdeauna acea intersecție între creativitate și tehnologie. Și cred că atunci când te gândești să construiești experiențe inteligente, să ai o integrare verticală, de la aplicații, la cadre, la siliciu, este cu adevărat esențial… Cred că este o călătorie, și cred că acesta este viitorul dispozitivelor de calcul pe care le avem, este ca acestea să fie inteligente, și că, acest tip de inteligență să dispară.
Borchers a intervenit și el, adăugând: „Aceasta este în mod clar abordarea noastră, cu tot ceea ce facem, care este: „Să ne concentrăm pe ceea ce este beneficiul, nu pe modul în care ai ajuns acolo”. Și, în cele mai bune cazuri, devine automagic. Dispare… și te concentrezi doar pe ceea ce s-a întâmplat, spre deosebire de cum s-a întâmplat.”
Vorbind din nou despre exemplul scrisului de mână, Giannandrea a argumentat că Apple este cel mai bine poziționată pentru a „conduce industria” în crearea de caracteristici și produse bazate pe inteligența mașinilor:
Am făcut creionul, am făcut iPad-ul, am făcut software-ul pentru ambele. Sunt doar oportunități unice de a face o treabă foarte, foarte bună. La ce facem o treabă foarte, foarte bună? În a permite cuiva să ia notițe și să fie productiv cu gândurile sale creative pe hârtie digitală. Ceea ce mă interesează este să văd cum aceste experiențe sunt folosite la scară largă în lume.
El a făcut un contrast cu Google. „Google este o companie uimitoare și acolo lucrează niște tehnologi foarte buni”, a spus el. „Dar, în mod fundamental, modelul lor de afaceri este diferit și nu sunt cunoscuți pentru expedierea de experiențe de consum care sunt folosite de sute de milioane de oameni.”
Cum folosește Apple învățarea automată în prezent?
Apple și-a făcut un obicei din a atribui învățarea automată meritul de a fi îmbunătățit unele caracteristici ale iPhone, Apple Watch sau iPad în prezentările sale recente de marketing, dar rareori intră în prea multe detalii – și majoritatea oamenilor care cumpără un iPhone nu au urmărit niciodată aceste prezentări, oricum. Comparați acest lucru cu Google, de exemplu, care plasează inteligența artificială în centrul multora dintre mesajele sale către consumatori.
Există numeroase exemple de învățare automată utilizată în software-ul și dispozitivele Apple, cele mai multe dintre ele fiind noi doar în ultimii doi ani.
Învățarea automată este utilizată pentru a ajuta software-ul iPad-ului să facă distincția între un utilizator care își apasă accidental palma pe ecran în timp ce desenează cu Apple Pencil și o apăsare intenționată menită să ofere o intrare. Este utilizată pentru a monitoriza obiceiurile de utilizare ale utilizatorilor pentru a optimiza durata de viață a bateriei și încărcarea dispozitivului, atât pentru a îmbunătăți timpul pe care utilizatorii îl pot petrece între încărcări, cât și pentru a proteja viabilitatea pe termen lung a bateriei. Este folosit pentru a face recomandări de aplicații.
Apoi, mai există Siri, care este probabil singurul lucru pe care orice utilizator de iPhone îl percepe imediat ca fiind inteligență artificială. Învățarea automată conduce mai multe aspecte ale Siri, de la recunoașterea vorbirii până la încercările lui Siri de a oferi răspunsuri utile.
Proprietarii de iPhone pricepuți ar putea observa, de asemenea, că învățarea automată se află în spatele capacității aplicației Photos de a sorta automat fotografiile în galerii predefinite sau de a vă oferi cu exactitate fotografiile unei prietene pe nume Jane atunci când numele acesteia este introdus în câmpul de căutare al aplicației.
În alte cazuri, puțini utilizatori își pot da seama că învățarea automată este la lucru. De exemplu, iPhone-ul dvs. poate face mai multe fotografii în succesiune rapidă de fiecare dată când apăsați pe butonul declanșator. Un algoritm antrenat de ML analizează apoi fiecare imagine și poate compune ceea ce consideră a fi cele mai bune părți din fiecare imagine într-un singur rezultat.
Phone-urile au inclus de mult timp procesoare de semnal de imagine (ISP) pentru a îmbunătăți calitatea fotografiilor în mod digital și în timp real, dar Apple a accelerat procesul în 2018, făcând ca ISP-ul din iPhone să lucreze îndeaproape cu Neural Engine, procesorul recent adăugat de companie, axat pe învățare automată.
L-am rugat pe Giannandrea să numească câteva dintre modalitățile prin care Apple folosește învățarea automată în software-ul și produsele sale recente. El a dat o listă de exemple:
Există o mulțime de experiențe noi care sunt alimentate de machine learning. Și acestea sunt lucruri cum ar fi traducerea de limbi străine, sau dictarea pe dispozitiv, sau noile noastre caracteristici în materie de sănătate, cum ar fi somnul și spălarea mâinilor, și lucruri pe care le-am lansat în trecut în legătură cu sănătatea inimii și lucruri de acest gen. Cred că sunt din ce în ce mai puține și mai puține locuri în iOS în care nu folosim învățarea automată.
Este greu să găsești o parte a experienței în care să nu faci ceva predictiv . Cum ar fi predicțiile aplicațiilor, sau predicțiile tastaturii, sau camerele moderne pentru smartphone-uri fac o tonă de învățare automată în spatele scenei pentru a-și da seama de ceea ce ei numesc „saliență”, care este de genul: care este cea mai importantă parte a imaginii? Sau, dacă vă imaginați că faceți estomparea fundalului, faceți modul portret.
Toate aceste lucruri beneficiază de caracteristicile de bază ale învățării automate care sunt încorporate în platforma principală Apple. Așadar, este aproape ca și cum ai spune: „Găsește-mi ceva în care nu folosim învățarea automată.”
Borchers a subliniat, de asemenea, caracteristicile de accesibilitate ca exemple importante. „Ele sunt în mod fundamental făcute disponibile și posibile datorită acestui lucru”, a spus el. „Lucruri precum capacitatea de detectare a sunetelor, care schimbă regulile jocului pentru acea anumită comunitate, este posibilă datorită investițiilor în timp și a capacităților care sunt încorporate.”
În plus, poate ați observat că actualizările software și hardware ale Apple din ultimii doi ani au pus accentul pe funcțiile de realitate augmentată. Cele mai multe dintre aceste caracteristici sunt posibile datorită învățării automate. Per Giannandrea:
Învățarea mașinilor este folosită foarte mult în realitatea augmentată. Problema dificilă acolo este ceea ce se numește SLAM, adică Simultaneous Localization And Mapping (localizare și cartografiere simultană). Deci, încercând să înțelegi dacă ai un iPad cu un scanner lidar pe el și te miști în jur, ce vede acesta? Și construirea unui model 3D a ceea ce vede de fapt.
În prezent, acest lucru folosește învățarea profundă și trebuie să puteți face acest lucru pe dispozitiv, deoarece doriți să o puteți face în timp real. Nu ar avea sens dacă ți-ai flutura iPad-ul și apoi poate că ar trebui să faci asta în centrul de date. Așa că, în general, aș spune că modul în care mă gândesc la acest lucru este că învățarea profundă, în special, ne oferă capacitatea de a trece de la datele brute la semantica despre acele date.
Creșterea numărului de sarcini de învățare automată efectuate de Apple la nivel local, pe dispozitiv, pe hardware precum Apple Neural Engine (ANE) sau pe GPU (unități de procesare grafică) personalizate ale companiei. Giannandrea și Borchers au susținut că această abordare este ceea ce face ca strategia Apple să se distingă printre concurenți.
De ce să o facă pe dispozitiv?
Atât Giannandrea, cât și Borchers au susținut cu pasiune, în conversația noastră, că funcțiile pe care tocmai le-am trecut în revistă sunt posibile datorită – și nu în ciuda – faptului că toată munca este efectuată local pe dispozitiv.
Există o narațiune comună care reduce învățarea automată la ideea că mai multe date înseamnă modele mai bune, care la rândul lor înseamnă experiențe și produse mai bune pentru utilizatori. Este unul dintre motivele pentru care curioșii indică adesea Google, Amazon sau Facebook ca fiind conducătorii probabili ai cuibului de inteligență artificială; aceste companii operează motoare masive de colectare a datelor, în parte pentru că operează și au vizibilitate totală în ceea ce a devenit infrastructura digitală cheie pentru o mare parte a lumii. După această măsură, Apple este considerată de unii ca fiind puțin probabil să performeze la fel de bine, deoarece modelul său de afaceri este diferit și s-a angajat public să își limiteze colectarea de date.
Când i-am prezentat aceste perspective lui Giannandrea, acesta nu s-a abținut:
Da, înțeleg această percepție că modelele mai mari din centrele de date sunt cumva mai precise, dar este de fapt greșită. Este de fapt greșită din punct de vedere tehnic. Este mai bine să rulați modelul aproape de date, decât să mutați datele. Și fie că este vorba de date de localizare – cum ar fi ce faci – date de exerciții fizice – ce face accelerometrul din telefonul tău – este pur și simplu mai bine să fie aproape de sursa datelor, și astfel se protejează și confidențialitatea.
Borchers și Giannandrea au subliniat în repetate rânduri implicațiile pentru confidențialitate ale efectuării acestei activități într-un centru de date, dar Giannandrea a spus că procesarea locală este, de asemenea, despre performanță.
„Unul dintre celelalte lucruri importante este latența”, a spus el. „Dacă trimiteți ceva către un centru de date, este foarte greu să faceți ceva la o rată de cadre. Așadar, avem o mulțime de aplicații în magazinul de aplicații care fac lucruri, cum ar fi estimarea poziției, cum ar fi să ne dăm seama că o persoană se mișcă și să identificăm unde sunt picioarele și brațele, de exemplu. Acesta este un API de nivel înalt pe care îl oferim. Aceasta este utilă doar dacă o puteți face la o rată de cadre, în esență.”
A dat un alt exemplu de utilizare pentru consumatori:
Faceți o fotografie, iar în momentele dinaintea fotografierii cu aparatul foto, aparatul vede totul în timp real. Te poate ajuta să iei o decizie cu privire la momentul în care să faci o fotografie. Dacă ați dori să luați această decizie pe server, ar trebui să trimiteți fiecare cadru la server pentru a lua o decizie cu privire la modul de a face o fotografie. Asta nu are niciun sens, nu-i așa? Așadar, există pur și simplu o mulțime de experiențe pe care ai vrea să le construiești și care sunt mai bine realizate la dispozitivul de margine.
Întrebat cum alege Apple când să facă ceva pe dispozitiv, răspunsul lui Giannandrea a fost simplu: „Atunci când putem să atingem sau să depășim calitatea a ceea ce am putea face pe server.”
În plus, ambii directori Apple au creditat siliciul personalizat al Apple – în special siliciul Apple Neural Engine (ANE) inclus în iPhone-uri începând cu iPhone 8 și iPhone X – ca fiind o condiție prealabilă pentru această procesare pe dispozitiv. Neural Engine este o unitate de procesare neuronală (NPU) octa-core pe care Apple a conceput-o pentru a gestiona anumite tipuri de sarcini de învățare automată.
„Este o călătorie de mai mulți ani, deoarece hardware-ul nu era disponibil pentru a face acest lucru la limită acum cinci ani”, a spus Giannandrea. „Designul ANE este în întregime scalabil. Există un ANE mai mare într-un iPad decât într-un telefon, decât într-un Apple Watch, dar stratul API CoreML pentru aplicațiile noastre și, de asemenea, pentru aplicațiile dezvoltatorilor este practic același în întreaga linie de produse.”
Când Apple a vorbit în mod public despre Neural Engine, compania a împărtășit cifre de performanță, cum ar fi 5 trilioane de operații pe secundă în cipul A12 din 2018. Dar nu a devenit specifică în ceea ce privește arhitectura cipului. Este literalmente o cutie neagră pe diapozitivele din prezentările Apple.
Dat fiind acest lucru, am vrut să știu dacă Giannandrea va face mai multă lumină asupra modului în care funcționează Motorul Neural sub capotă, dar a refuzat să intre în multe detalii. În schimb, el a spus că dezvoltatorii de aplicații pot culege tot ceea ce trebuie să știe din CoreML – un API de dezvoltare software care oferă dezvoltatorilor acces la capacitățile de învățare automată ale iPhone.
Apli-ul pentru dezvoltatori CoreML descrie foarte clar tipurile de modele de învățare automată, modelele de execuție pe care le suportăm… Avem un set tot mai mare de nuclee pe care le suportăm. Și vă adresați CoreML de la oricare dintre lucrurile populare de învățare automată, cum ar fi PyTorch sau TensorFlow, și apoi, în esență, vă compilați modelul și apoi îl dați lui CoreML.
Slujba lui CoreML este să își dea seama unde să ruleze acel model. S-ar putea ca lucrul corect să fie să ruleze modelul pe ANE, dar ar putea fi, de asemenea, corect să ruleze modelul pe GPU sau să ruleze modelul pe CPU. Iar CPU-ul nostru are și el optimizări pentru machine learning.
De-a lungul conversației noastre, ambii directori au indicat atât aplicațiile dezvoltatorilor terți, cât și pe cele proprii ale Apple. Strategia în acest caz nu este doar de a impulsiona serviciile și funcțiile create de Apple, ci și de a deschide cel puțin o parte din aceste capacități către marea comunitate de dezvoltatori. Apple s-a bazat pe dezvoltatori pentru a inova pe platformele sale încă de la deschiderea App Store în 2008. Compania împrumută adesea ideile cu care au venit acei dezvoltatori atunci când își actualizează propriile aplicații realizate la nivel intern.
Dispozitivele Apple nu sunt singurele cu cipuri de învățare automată încorporate, bineînțeles. Samsung, Huawei și Qualcomm, de exemplu, includ toate NPU în sistemele lor pe un cip. Iar Google, de asemenea, oferă API-uri de învățare automată dezvoltatorilor. Cu toate acestea, strategia și modelul de afaceri al Google sunt net diferite. Telefoanele Android nu fac nici pe departe o gamă la fel de largă de sarcini de învățare automată la nivel local.
Mac-uri cu siliciu Apple
Interviul meu cu Giannandrea și Borchers nu s-a axat pe marele anunț pe care compania l-a făcut la WWDC cu doar câteva săptămâni în urmă – lansarea iminentă a Mac-urilor cu siliciu Apple. Dar când am speculat că unul dintre numeroasele motive pentru care Apple a proiectat Mac-urile în jurul propriilor sale cipuri ar putea fi includerea Neural Engine, Borchers a spus:
Pentru prima dată vom avea o platformă comună, o platformă de siliciu care poate susține ceea ce vrem să facem și ceea ce vor dezvoltatorii noștri…. Această capacitate va debloca unele lucruri interesante la care ne putem gândi, dar, probabil, mai important, va debloca o mulțime de lucruri pentru alți dezvoltatori pe parcurs.
Giannandrea a dat un exemplu specific pentru modul în care instrumentele de învățare automată și hardware-ul Apple vor fi folosite pe Mac:
Nu știu dacă ați văzut acea demonstrație din State of the Union, dar, în esență, ideea era: dat fiind un videoclip, treceți prin cadrul video sau cadru cu cadru și faceți detectarea obiectelor. Și puteți face acest lucru cu mai mult de un ordin de mărime mai rapid pe siliciul nostru decât ați putea face pe platforma tradițională.
Și apoi, spuneți: „Ei bine, este interesant. Ei bine, de ce este asta util?” Imaginați-vă un editor video în care ați avea o casetă de căutare și ați putea spune: „Găsiți-mi pizza de pe masă”. Și ar fi doar o să se frece la acel cadru… Acestea sunt genul de experiențe pe care cred că veți vedea că oamenii le vor crea. Ne dorim foarte mult ca dezvoltatorii să folosească aceste cadre și să ne surprindă prin ceea ce pot face cu ele.
Apple a declarat la conferința sa pentru dezvoltatori că intenționează să livreze Mac-uri cu propriul său siliciu începând cu sfârșitul acestui an.
Cum rămâne cu confidențialitatea?
Confidențialitatea a fost în prim-planul mesajelor pe care Apple le-a transmis utilizatorilor în ultimii doi ani. Este adusă în discuție din nou și din nou în keynotes și în materialele de marketing, există memento-uri despre aceasta presărate în iOS și deseori apare în interviuri – ceea ce a fost și cazul acestuia.
„Oamenii sunt îngrijorați în legătură cu inteligența artificială în general, deoarece nu știu ce este”, mi-a spus Giannandrea. „Ei cred că este mai capabilă decât este, sau se gândesc la această viziune științifico-fantastică a IA, iar tu ai oameni influenți precum Bill Gates și Elon Musk și alții care spun că aceasta este o tehnologie periculoasă.”
El crede că hype-ul din jurul IA din partea altor companii mari de tehnologie este negativ, nu pozitiv, pentru eforturile de marketing ale acestor companii „pentru că oamenii sunt îngrijorați de această tehnologie.”
Termenul „IA” ar putea să nu fie de ajutor aici. El evocă răufăcătorii sintetici rău intenționați din cultura pop, precum Skynet sau HAL 9000. Dar majoritatea experților în inteligență artificială aplicată vă vor spune că acest deznodământ sumbru este departe de realitate. Tehnologia condusă de învățarea mașinilor comportă multe riscuri – moștenind și amplificând prejudecățile umane, de exemplu – dar să devină necinstită și să atace violent umanitatea nu pare probabil în viitorul imediat.
Învățarea mașinilor nu face, de fapt, mașinile inteligente în același mod în care sunt oamenii. Din acest motiv și din altele, mulți experți în inteligență artificială (inclusiv Giannandrea) au sugerat termeni alternativi, cum ar fi „inteligența mașinilor”, care nu fac paralele cu inteligența umană.
Indiferent de nomenclatură, învățarea automată poate aduce cu ea un pericol foarte real și prezent: subminarea vieții private a utilizatorilor. Unele companii colectează în mod agresiv date cu caracter personal de la utilizatori și le încarcă în centre de date, folosind ca justificare învățarea automată și instruirea.
Cum s-a menționat mai sus, Apple face o mare parte din această colectare și procesare la nivel local, pe dispozitivul utilizatorului. Giannandrea a legat în mod explicit această decizie de preocupările legate de confidențialitate. „Cred că avem o poziție foarte clară în această privință, și anume că vom face această tehnologie avansată de învățare automată în cât mai multe cazuri posibile pe dispozitivul dumneavoastră, iar datele nu vor părăsi dispozitivul dumneavoastră”, a spus el. „Avem o declarație foarte clară cu privire la motivul pentru care credem că dispozitivele noastre sunt mai sigure sau mai bune sau ar trebui să fie mai de încredere.”
El a folosit text-to-speech ca un exemplu specific al acestei filosofii în acțiune:
Dacă spuneți ceva de genul: „Citește-mi mesajele mele de la Bob”. Sinteza textului în vorbire are loc pe dispozitiv, pe motorul neural – combinația dintre motorul neural și CPU. Și, din această cauză, nu am văzut niciodată conținutul mesajului tău de la Bob, pentru că telefonul tău îl citește – nu serverele îl citesc. Așadar, conținutul acelui mesaj nu a ajuns niciodată la server…
Așa că acesta este un exemplu excelent de tehnologie avansată care îmbunătățește de fapt atât utilitatea utilizatorului, deoarece vocea este sintetizată pe dispozitiv, astfel încât, chiar dacă sunteți deconectat, va funcționa în continuare. Dar, de asemenea, și povestea confidențialității. De fapt, este foarte greu de realizat. A fost nevoie de multă inginerie foarte grea pentru a face ca o calitate modernă de înaltă calitate să fie sintetizată pe un dispozitiv pe care îl puteți pune în buzunar.
Desigur, în multe cazuri trebuie să folosiți unele date ale utilizatorului pentru învățarea automată. Deci, cum anume folosește Apple datele de utilizator pe care le gestionează? Giannandrea a explicat:
În general vorbind, avem două moduri în care construim modele. Unul este cel în care colectăm și etichetăm datele, care este adecvat în foarte multe circumstanțe. Și apoi există cazul în care le cerem utilizatorilor să doneze datele lor. Cel mai notabil exemplu ar fi Siri, unde, atunci când configurați un iPhone, spunem: „Doriți să ne ajutați să facem Siri mai bun?”
Este un caz în care o anumită cantitate de date ne este donată și apoi un procent foarte mic din acestea poate fi folosit pentru instruire. Dar multe, multe lucruri despre care vorbim aici – cum ar fi, să zicem, scrisul de mână – putem aduna suficiente date pentru a antrena acel model pentru a funcționa practic cu scrisul de mână al tuturor, fără a fi nevoie să folosim niciun fel de date ale consumatorilor.
Unele dintre aceste solicitări prin care se cere utilizarea datelor dumneavoastră au fost adăugate recent. Vara trecută, un raport a indicat faptul că Siri înregistra ceea ce spuneau utilizatorii după activări accidentale; contractorii care erau însărcinați cu asigurarea calității pentru funcționalitatea Siri auzeau unele dintre aceste înregistrări.
Apple a reacționat angajându-se să stocheze numai înregistrările audio legate de Siri după ce utilizatorii au optat în mod explicit pentru a face Siri mai bună prin partajarea înregistrărilor (acest comportament a fost implementat în iOS 13.2) și apoi a adus toată asigurarea calității în cadrul companiei. Am întrebat ce face Apple diferit față de ceea ce făceau contractorii cu aceste date. Giannandrea a răspuns:
Avem o mulțime de măsuri de protecție. De exemplu, există un proces pentru a identifica dacă materialul audio a fost sau nu destinat asistentului, care este complet separat de procesul de revizuire efectivă a materialului audio. Așadar, facem o mulțime de lucruri pe plan intern pentru a ne asigura că nu capturăm – și apoi aruncăm, de fapt – orice înregistrare audio accidentală.
Dar dacă nu sunteți dispuși să asigurați de fapt QA, la punctul dvs. de vedere, funcția, atunci nu veți face niciodată ca înregistrările accidentale să fie mai bune. După cum știți, învățarea automată necesită să o îmbunătățiți în mod continuu. Așa că, de fapt, am revizuit o mare parte din fluxurile și procesele noastre de lucru în același timp în care am adus munca în cadrul companiei. Sunt foarte încrezător că avem unul dintre cele mai bune procese pentru îmbunătățirea asistentului într-un mod care să păstreze confidențialitatea.
Este clar că Apple caută să impună protecția confidențialității ca o caracteristică cheie a dispozitivelor sale; din partea lui Giannandrea, acest lucru a reieșit ca o convingere autentică. Dar acest lucru ar putea, de asemenea, să ajute Apple pe piață, deoarece cel mai mare concurent al său în spațiul mobil are un istoric mult mai prost în ceea ce privește confidențialitatea, iar acest lucru lasă o deschidere pe măsură ce utilizatorii devin din ce în ce mai preocupați de implicațiile inteligenței artificiale asupra confidențialității.
De-a lungul conversației noastre, atât Giannandrea, cât și Borchers au revenit asupra a două puncte ale strategiei Apple: 1) este mai performant să faci sarcini de învățare automată la nivel local și 2) este mai bine să „păstrezi confidențialitatea” – o formulare specifică pe care Giannandrea a repetat-o de câteva ori în conversația noastră – pentru a face acest lucru.
În interiorul cutiei negre
După o lungă perioadă de timp în care a lucrat mai ales în întuneric la funcții de inteligență artificială, accentul pus de Apple pe învățarea automată s-a extins foarte mult în ultimii ani.
Compania publică în mod regulat, face sponsorizări academice, are burse, sponsorizează laboratoare, merge la conferințe AI/ML. Recent, a relansat un blog de învățare automată unde împărtășește o parte din cercetările sale. De asemenea, a fost în plină campanie de angajări, preluând ingineri și alte persoane din domeniul învățării automate – inclusiv pe Giannandrea însuși în urmă cu doar doi ani.
Nu conduce comunitatea de cercetare în modul în care o face Google, dar Apple susține că este lider cel puțin în ceea ce privește aducerea fructelor învățării automate la mai mulți utilizatori.
Vă amintiți când Giannandrea a spus că a fost surprins de faptul că învățarea automată nu a fost folosită pentru scrisul de mână cu Creionul? El a continuat să vadă crearea echipei care a făcut să se întâmple acest lucru. Și, în tandem cu alte echipe, au mers mai departe cu scrisul de mână bazat pe învățare automată – o piatră de temelie în iPadOS 14.
„Avem o mulțime de practicieni extraordinari în domeniul învățării automate la Apple și continuăm să îi angajăm”, a spus Gianandrea. „Mi se pare foarte ușor să atrag oameni de talie mondială la Apple, deoarece devine din ce în ce mai evident în produsele noastre că învățarea automată este esențială pentru experiențele pe care dorim să le construim pentru utilizatori.”
După o scurtă pauză, el a adăugat: „Cred că cea mai mare problemă pe care o am este că multe dintre cele mai ambițioase produse ale noastre sunt cele despre care nu putem vorbi și, prin urmare, este o mică provocare de vânzări să spui cuiva: „Vino și lucrează la cel mai ambițios lucru din toate timpurile, dar nu-ți pot spune despre ce este vorba”.'”
Dacă e să dăm crezare marilor companii de tehnologie și investițiilor de capital de risc, inteligența artificială și învățarea automată nu vor face decât să devină tot mai omniprezente în următorii ani. Oricum se va întâmpla, Giannandrea și Borchers au clarificat un lucru: învățarea automată joacă acum un rol în mare parte din ceea ce face Apple cu produsele sale și în multe dintre funcțiile pe care consumatorii le folosesc zilnic. Iar odată cu Neural Engine care va ajunge pe Mac-uri începând din această toamnă, rolul învățării automate la Apple va continua probabil să crească.