A mesterséges intelligencia Hollywoodba megy (és beszivárog a filmiparba)
A gépi tanulási alkalmazások egyre inkább megtalálják az utat a filmipar különböző területein filmgyártásban és a színészi szakmában
A korábbi posztokban azt vizsgáltuk, hogy a mesterséges intelligenciát/gépi tanulást egyre gyakrabban alkalmazzák a tudományban, valamint különböző (egyéb) kreatív tevékenységekben (1. rész, 2. rész).
Vágjunk most bele abba a területbe, ahol a nagy költségvetések és a kreativitás találkozik: Hollywoodba, Tinseltownba, a varázslatos filmek földjére.
A növekvő költségvetést szorosan követi az egyre kifinomultabb CGI egyre gyakoribb használata. A filmgyártási döntések nemcsak a költségvetéstől, hanem a tervezett profittól is függnek. Ezek az előrejelzések a nézettségi adatokon alapulnak. A költségvetés elosztása? Adatok. CGI? Adatok.
Már hallom, ahogy az AI dörzsöli a virtuális kezét.
Blockbuster költségvetések
A filmgyártás nem olcsó befektetés. A modern blockbuster filmek rendszeresen meghaladják a 200 millió dollárt. Ha valaki egy produkciós cégtől egy ilyen befektetés (egy részének) megtételére készül, a lehető legbiztosabb akar lenni abban, hogy a film siker lesz. Senki sem fektet be nyereségvárakozás nélkül.
Hogyan értékeli egy film nyereségpotenciálját? Nézzünk a múltba. Milyen (típusú) filmek mentek jól? Vannak olyan jellemzők, amelyek közösek a blockbusterekben? Mit keresnek a nézők, és mire hajlandóak pénzt költeni?
A pénzveszteségtől és az ismert sikerformuláktól való eltéréstől való félelem vezetett a jelenlegi “folytatások korához”.
De mint tudjuk, ez nem garancia a sikerre. Egyes folytatások nagyszerűek, mások nem annyira.
Mi lenne, ha lenne egy olyan rendszerünk, amely a lehető legtöbb releváns paramétert bevonja a “kasszasiker-potenciál” értékelésébe, amelyet nem – vagy legalábbis kevésbé – akadályoz az emberi kockázatkerülés?
Mondjuk, mi van? A nagy produkciós cégek már most is ezt csinálják. A 20th Century Fox a Merlin nevű rendszert használja (amely megjósolta a Logan sikerét), a Warner Bros. nemrég kezdett együttműködni a Cinelytic céggel, amely gépi tanulást használ a filmek sikerének előrejelzésére. A belga székhelyű ScriptBook nevű cég 86%-os sikerrel képes megjósolni egy film kasszasikerét (és potenciálisan már filmek forgatókönyveinek társszerzője – a titoktartási megállapodások miatt nem tudjuk, melyeknek…).
Senki sem fektet be nyereségvárás nélkül.
Maradjunk csak abban, hogy az ilyen AI/gépi tanulási rendszerek növekvő használata olyan rejtett gyöngyszemek támogatásához is vezet, amelyeket egyébként figyelmen kívül hagytak volna. Ha a stúdiók a múltbeli sikereknél több adatot szolgáltatnak, akkor ezek a rendszerek előre látják a mozilátogatók folytatás-fáradtságát?
CGI, halhatatlanság és mély hamisítványok
Mindannyian hallottunk már a zöld képernyő varázslatáról. A színészek és színésznők egy zöld vászon előtt teszik a dolgukat, a VXF művészek rászórnak némi CGI varázslatot et voilà, hőseink és gonosztevőink lézerfegyverekkel harcolnak egy űrhajó tetején. (Bónusz tény: a képernyő azért zöld, mert eredetileg az időjósok használták, akik – annak idején – kék öltönyt viseltek. Milyen szín nyújt ehhez nagyszerű kontrasztot? Hát persze, az élénkzöld.)
A valódi színészeket/színésznőket azonban nem mindig könnyű feladat elválasztani a virtuális háttértől.
A legjobb, legsimább eredményhez valójában a pixelek szinte pixelenkénti hozzárendelése szükséges a színészhez/színésznőhöz, az előtérelemhez vagy a háttérhez. (És még vannak olyan bosszantó pixelek is, amelyek egy kicsit mindenből tartalmaznak valamit.)
Lépjen be a mesterséges intelligencia.
A MIT kutatói nemrég bemutattak egy szemantikus lágy szegmentálásnak nevezett rendszert, amely:
…elemzi az eredeti kép textúráját és színét, és kombinálja azt egy neurális hálózat által gyűjtött információkkal arról, hogy a képen lévő objektumok valójában mik.
Long story short, a rendszer jelentősen felgyorsítja a folyamatot, és bár jelenleg statikus képekkel dolgozik, aligha kétséges, hogy a filmipar szorosan követi a fejlesztését.
Mi a helyzet magukkal a színészekkel/színésznőkkel?
Az egyik dolog, amit az AI/gépi tanulás már tud, az a színészek/színésznők “finomhangolása”. Egy közismert közelmúltbeli példa az Irishmen, az a film, amelyben Robert De Nirót, Joe Pescit és Al Pacinót a gépi tanulás és az innovatív mozgásfelvételi technikák kombinációjával “öregítették”. Nem volt szükség hosszú órákra a sminkszobában.
Egy másik példa Thanos a Bosszúállókban: Endgame. Egy új gépi tanulási rendszer, amely a találó Masquerade névre hallgat, Josh Brolin arckifejezését festette rá Thanos arcának nagy felbontású renderelésére, így a VFX-művészek sok órányi fáradságos munkát takarítottak meg.
Ez nem az AI-ról szól, hanem arról, hogyan fejlesztjük és használjuk.
Ezek azonban valódi színészek. Mi a helyzet a tényleges AI színészi rendszerekkel?
Nos, ott még nem tartunk. De figyelembe véve a jelenlegi ijesztően jó deepfake-eket és a gépi tanulási rendszerek növekvő képességét, hogy szinte kreatívnak tűnő ugrásokat tegyenek, hirtelen egy valódi S1m0ne kevésbé tűnik valószínűtlennek.
Ez ki fogja szorítani a színészeket/színésznőket az üzletből? Remélem – és gondolom – nem. Mint más AI művészeti törekvések esetében, a jövő hibrid lehet. A félig független mesterséges intelligencia színészek “partnert” adhatnak az emberi színészeknek/színésznőknek, akikkel együtt játszhatnak a zöld vászon előtt, vagy talán még improvizálhatnak is.
A lehetséges probléma az, hogy a hollywoodi mesterséges intelligencia fejlesztéséhez használt adatok tükrözhetik vagy akár erősíthetik is a meglévő előítéleteket. Másrészt a gépi tanulás gondos és megfontolt alkalmazása segíthet az említett előítéletek azonosításában. Nem a mesterséges intelligenciáról van szó, hanem arról, hogy hogyan fejlesztjük és használjuk. A mesterséges intelligencia hollywoodi alkalmazását sokszínű és befogadó szereplőgárdának kell kísérnie.
És… vágás.