Jönnek a gépek, és nagyon rossz verseket írnak

Ha és amikor a gépek átveszik a hatalmat, nem olyan lesz, mint amilyennek megálmodtuk. Nem egy hideg, gyilkos okos hangszóró lesz, vagy egy albínó android, vagy élő szövet egy fém endoszkeleton felett, osztrák testépítő alakban. Sejthettük volna, hogy végül legyőznek minket olyan dolgokban, mint a sakk. És a Go-ban. És a versenyszerű videojátékokban. De ezek hideg és számító feladatok, amik gépekhez illenek. Azt mondtuk magunknak, hogy ők mindig is csak, nos, számítógépek lesznek: merevek, racionálisak, érzéketlenek. Az igazán emberi tulajdonságok mindig a miénk lesznek. A meleg, ragacsos szív, amit egyetlen algoritmus sem tudna lemásolni.

De a valóságban a robotok sokkal élethűbbek lesznek – és emiatt még nyugtalanítóbbak. Nem fognak robotikusan hangzani, mert pont olyanok lesznek, mint mi. Talán még a kinézetük is olyan lesz, mint mi. Lehet, hogy pszichózisuk lesz, és trippes, szürrealista álmaik. És egy nap talán még tisztességes verseket is írnak majd.

emily dickinson

Ez egy mesterséges intelligencia által generált kísérlet arra, hogy Emily Dickinson stílusában írjon. Egy GPT-2 nevű mesterséges intelligencia nyelvi program készítette, amely a San Francisco-i OpenAI nevű kutatócég projektje. A félkövérrel szedett részek a programnak adott felszólítást jelentik, a többi a program sajátja; ezen a linken kipróbálhatod magad is. Az OpenAI csak nemrég adta ki a GPT-2 teljes kódját, miután kezdetben attól tartott, hogy a program a spamek és az álhírek felerősítését segíti; ha a hamis versek alapján lehet következtetni, a mesterséges intelligencia nyelvi modelljeinek hatalmáról szóló vita talán még csak most kezdődik.

A GPT-2 segítségével a Szilícium-völgyben dolgozók egy csoportja a mi és saját szórakoztatásunkra összeállított egy gyűjteményt azokból a kísérletekből, amelyeket az AI híres költői művek befejezésére tett. Az így létrejött, Transformer Poetry című, a Paper Gains Kiadó gondozásában decemberben megjelent kötet egy nyelvtörő gyűjtemény, amely meglepően jó és komikusan értelmetlen, számítógép által generált versekből áll. Egyelőre senki sem fogja összetéveszteni az emberi költészettel – legalábbis reméljük, hogy nem. De más szempontból is megdöbbentően élethű: hátborzongató pillantás arra, hogy milyen jó szervetlen szerzőkké válhatnak, és milyen következményekkel járhat ez.

A számítógépes programok az utóbbi időben sokkal inkább hasonlítanak ránk, nagyrészt azért, mert egyre inkább a saját elménkről mintázzák őket. A gépi tanulás virágzó területét – amelynek termékei mindenki számára ismerősek, aki használta már okostelefonja hangasszisztensét vagy képfelismerőjét – a neurális hálózat fogalma vezérelte, amelyben az egyes csomópontok a neuronokhoz hasonlóan “megtanulják”, hogy próbálgatással és tévedéssel összetett asszociációs hálót építsenek fel. Míg a hagyományos programok a kimeneteket meghatározó szabályokat kapják, a neurális hálók ehelyett a kívánt eredményeket kapják meg, amelyekből millió és milliárd ismétlődő próbálkozással megtanulják az elérésükhöz szükséges saját módszereiket.

A GPT-2 a képzéshez egy 8 millió weboldalból álló korpuszt kapott, amelyet a természetes kiválasztás internetes módszerével választottak ki: “A dokumentumok minőségének megőrzése érdekében” – áll az OpenAI bejegyzésében – “csak olyan oldalakat használtunk, amelyeket emberek kuráltak/szűrtek – konkrétan a Redditről származó kimenő linkeket használtunk, amelyek legalább 3 karmát kaptak”. A GPT-2 próbálkozások és hibák útján megtanulta, hogyan lehet megjósolni egy szöveg további részét, ha csak az első néhány szót vagy mondatot adjuk meg. Ez viszont általános módszert adott neki más szövegek kiegészítésére, függetlenül a tartalomtól vagy a műfajtól.

sonnet 18

A GPT-2 utánzási képessége első pillantásra lenyűgöző: a dikció, a nyelvtan és a szintaxis mind-mind ugrásszerűen meghaladja azt, amit a legtöbbünk egy számítógéptől elvárna. De ha jobban hunyorítunk, azonnal megmutatkoznak a repedések. Shakespeare leghíresebb szonettjének előadása azonnal kidobja az ablakon a rímeket és a metrumot – de hé, a legtöbben aligha emlékszünk ezekre a szabályokra. A narrátor szerelme és egy nyári nap közötti metafora is elveszett, mivel a gép inkább a forró időjárással kapcsolatos képek litániáját választja, majd hirtelen átvált a felhős égboltra. És Shakespeare záró, a szépség halhatatlanná tétele helyett egy olyan tökéletes inverziót kapunk, hogy az már perverz: Mondd, hogy szép vagy, de gyorsan!

A nem járt út

Más próbálkozásoknak szigorúan véve van értelme, de váratlan eredményekre vezetnek. Vegyük például a “The Road Not Taken”-t. Míg Frost eredeti műve valójában arról az önámításról szól, hogy az ember választása “mindent megváltoztatott”, és a legtöbb ember úgy emlékszik rá, mint a robusztus ikonoklasztika és a “kevésbé járt út” dicshimnuszára – méltán “Amerika legolvasottabb verse” -, a GPT-2 valahogy egy harmadik utat talál, megteremtve egy narrátort, akit annyira gyötör a kétségbeesés, hogy rossz utat választott, hogy kétségbeesetten követi vissza a lépéseit, csakhogy rájön, hogy a másik út le van zárva.

still i rise

GPT-2 hajlamos arra, hogy fogjon egy darab szintaxist, és fusson vele, ahogy itt is teszi, az “I will” módot Angelou versének utolsó versszakából, amit kapott, kipörgeti, és a végtelenségig mutálja. Majdnem olyan, mintha amatőr improvizáció lenne, a mesterséges intelligencia elakad, miközben próbálja kitalálni, hogy mi mást tehetne. “Az ismétlést könnyű modellezni” – mondja David Luan, az OpenAI mérnöki alelnöke. “Az emberi írásokban általában éppen annyi van belőlük, hogy a modell megtanulja, hogy az ismétlés növeli a siker valószínűségét.”

Luan azt is elmondja, hogy ez a top-k mintavételnek nevezett statisztikai módszer eredménye, amelyben a lehetséges következő szavak egy bizonyos hányadát kizárják, hogy a szöveg ne térjen el a témától. De ezek a kirívó hibák elkerülésére szolgáló módszerek, úgy tűnik, azt is eredményezik, hogy bizonyos tendenciákat az abszurd végletekig felerősítenek.

edge

Mindezek ellenére a GPT-2 költői elméje néha sokkal megmagyarázhatatlanabbul eltér, olyan egyes szám első személyű narrátort hoz létre, aki az eredetiben nem létezik, és olyan gondolatokat generál, amelyeknek kevés közük van a forrásukhoz, mégis furcsán mélyrehatóak: “Egy ember alkotta civilizáció utolsó szavai / A szavak: “Szabadok vagyunk.” És ha kíváncsiak lennének, ezek közül a mondatok közül egyik sem jelenik meg egyetlen internetes keresésben sem; bármi is a program költői érzékenysége, nem teljesen eredetietlenek.

Van itt egy közös szál. A GPT-2 írása nyelvtanilag helyes. Az egész többé-kevésbé forráshűen hangzik, ha csak a hangnemet hallottad. De hogy mit jelentenek ezek a szekvenciák, abban van a bökkenő. A GPT-2 költészetében a stílus fontosabb, mint a tartalom. Ami érthető, hiszen nem tudja, mi az az anyag.

Tiszta nyelvi modellként a GPT-2 nem tudja, hogy a szavak valójában mire utalnak, csak azt, hogy egy szó milyen valószínűséggel jelenik meg mások mellett. Számára egy olyan szó, mint a “szék” csak egy karaktersorozat, nem pedig képek vagy tárgyak halmaza, nemhogy valamilyen ködösebb fogalmi csoportosítása azoknak a dolgoknak, amelyeken emberek ülnek. A készítők szerint a GPT-2 leggyakoribb hibái ebből az alapvető tudatlanságból erednek: “e különböző hibamódokat figyeltünk meg, például ismétlődő szöveget, világmodellezési hibákat (pl. a modell néha arról ír, hogy a tűz a víz alatt történik), és természetellenes témaváltásokat”. A referenciák ismeretének hiányában a GPT-2 folyamata ehelyett valami olyasmi módon működik, mint egy jelentés nélküli szemiotika – egy játék, amelyben csak jelzők vannak, anélkül, hogy bármit is jeleznének.

Bizonyos szempontból ez hasonlónak tűnik ahhoz, ahogyan az emberek fejlesztik és használják a nyelvet. A gyerekek gyakran másolnak szavakat, és nyelvtani sorozatokban használják őket, mielőtt még tudnák, hogy mit mondanak. Az írói elme is véletlenszerűen és asszociatív módon működik, idiómákat és szintaxisokat, esztétikailag tetszetős sztringek darabkáit szívja magába és öklendezi fel. Egy érett, emberi felhasználó kezében azonban mindezek a minták végső soron a jelentéshez kötődnek – a cél egy érzés vagy gondolat közvetítése, nem pedig pusztán a hangzás. Egy szép szófordulat nem jelent semmit, hacsak nem jelent pontosan valamit.”

Ez az igazi hiányzó láncszem a gépek és az irodalom között: a valóság ismerete, az a dolog, amelynek leírására az ember a nyelvet alkotta. Egyesek még azt is állítják, hogy a valódi intelligencia előállításához fizikai lényre van szükség – hogy semmilyen testetlen világtapasztalat nem tesz egy gépet olyan érzővé, mint amilyenek mi vagyunk. Nyilvánvaló, hogy a mesterséges intelligencia kora jelentős kockázatokkal járhat – de jó tudni, hogy legalábbis egyelőre költői lelkünk biztonságban van.”