Bob Rossin työn tilastollinen analyysi

Bob Ross oli täydellinen opettaja. Hän opasti fanejaan maalatessaan ”iloisia puita”, ”kaikkivoipia vuoria” ja ”pörröisiä pilviä” 11-vuotisen televisio-uransa aikana PBS-ohjelmassaan ”The Joy of Painting”. Ross maalasi ohjelmassa yhteensä 381 teosta, jotka perustuivat tiettyihin elementteihin, kohtauksiin ja teemoihin ja tarjosivat siten tuhansia tietopisteitä. Päätin käyttää tuota dataa opettamaan jotakin itselleni: ehdollisen todennäköisyyden ja klusteroitumisen tärkeitä tilastollisia käsitteitä sekä oppitunnin datan rajoituksista.

Kiinnitetään siis hiuksemme permanentilla ja valmistaudutaan luomaan iloisia taulukkolaskentataulukoita!

Löysin – data-analyysin ja erään Rossin läheisimmän yhteistyökumppanin haastattelun avulla – teoskokonaisuuden, jota määrittivät johdonmukaisuus ja pohjimmiltaan henkilökohtainen ihanne. Ross syntyi Daytonassa, Flaconassa, ja liittyi ilmavoimiin 17-vuotiaana. Hänet sijoitettiin Fairbanksiin ja hän vietti seuraavat 20 vuotta Alaskassa. Siellä vietetty aika näyttää vaikuttaneen merkittävästi hänen suosimiinsa aiheisiin, joita ovat puut, vuoret, pilvet, järvet ja lumi.

Bob Rossin maalauksia esiteltiin PBS:n The Joy of Painting -ohjelmassa.

Bob Rossin maalauksia esiteltiin PBS:n ”The Joy of Painting” -ohjelmassa.

Bob Rossin nimi ja kuvat ovat Bob Ross Inc:n tavaramerkkejä. Kaikki oikeudet pidätetään. Käytetty luvalla.

The Joy of Painting -sarjan 403 jaksosta – jonka ensimmäinen jakso pyöri vuosina 1983-1994 ja jota esitetään edelleen uusintoina PBS-asemilla maanlaajuisesti – Ross maalasi 381:ssä, ja lopuissa jaksoissa esiintyi vieras, useimmiten hänen poikansa Steve Ross. Bob Ross Inc:n myymälästä saatavien Bob Rossin maalausten kuvien perusteella koodasin kaikki jaksot1 käyttäen 67 avainsanaa, jotka kuvasivat sisältöä (puita, vettä, vuoria, sääelementtejä ja ihmisen tekemiä rakenteita), maalausten kehystämiseen liittyviä tyylivalintoja ja vierailevia taiteilijoita, yhteensä 3224 tunnistetta.2

Analysoin aineiston selvittääkseni tarkalleen, mitä vuonna 1995 kuollut Ross maalasi yli vuosikymmenen ajan televisiossa. Päällimmäiset tulokset ovat odotettavissa – etkö arvaakin, hän maalasi paljon vuoria, puita ja järviä! – mutta sitten laitoin numeroita Rossin klassisiin kielikuviin. Hän ei maalannut tammia tai kuusia, hän maalasi ”onnellisia puita”. Hän suosi ”kaikkivoipia vuoria” huippuihin. Kun hän oli maalannut yhden puun, hän ei maalannut toista – hän maalasi ”ystävän”.”

Tässä kerrotaan, kuinka usein kukin yli viisi kertaa esiintynyt tunniste esiintyi 381 jakson aikana:

hickey-ross-tags (1)

Nyt kun tiedämme yksittäisten tunnisteiden perustodennäköisyyksien todennäköisyydet, voimme löytää myös joidenkin tapahtumien yhteistodennäköisyydet. Kuinka usein esimerkiksi lehtipuu ja havupuu esiintyvät samassa maalauksessa? Tiedämme, että 57 prosenttia maalauksista sisältää lehtipuun ja 53 prosenttia maalauksista sisältää havupuun. Aineistomme mukaan 20 prosenttia maalauksista sisältää ainakin yhden kummastakin.

Lisäksi voimme myös löytää todennäköisyyden sille, että Ross maalasi jotakin, kun otetaan huomioon, että hän maalasi jotakin muuta, tilastoa, jota kutsutaan ehdolliseksi todennäköisyydeksi.

Ehdollinen todennäköisyys voi olla hieman hankala. Tiedämme, että 44 prosenttia Rossin maalauksista sisältää pilviä, 9 prosenttia sisältää rantaa ja 7 prosenttia sisältää sekä pilviä että rantaa. Voimme käyttää tätä tietoa selvittääksemme kaksi asiaa: todennäköisyyden, että Ross maalasi pilven, jos hän maalasi rannan, ja todennäköisyyden, että hän maalasi rannan, jos hän maalasi pilven. Jaetaan yhteinen todennäköisyys – tässä tapauksessa 7 prosenttia – annetun todennäköisyydellä – 44 prosenttia tai 9 prosenttia, riippuen siitä, halutaanko tietää todennäköisyys rannalle, kun kyseessä on pilvi, vai pilvelle, kun kyseessä on ranta.

Suurin sudenkuoppa, johon ihmiset usein törmäävät, on se, että oletetaan, että nämä kaksi todennäköisyyttä ovat samat. Todennäköisyys sille, että Ross maalasi pilven, kun otetaan huomioon, että hän maalasi rannan – lähinnä se, kuinka monessa rantamaalauksessa on pilviä – on (0,07)/(0,09) eli 78 prosenttia. Valtaosa rantakuvista sisältää pilviä. Todennäköisyys, että Ross maalasi rannan, kun otetaan huomioon, että hän maalasi pilven – eli kuinka monessa pilvimaalauksessa on ranta – on kuitenkin (0,07)/(0,44) eli 16 prosenttia. Valtaosassa pilvimaalauksista ei siis ole rantoja.

Laskin jokaisen Bob Ross -tunnisteen ehdollisen todennäköisyyden suhteessa jokaiseen muuhun tunnisteeseen vastatakseni seuraaviin polttaviin kysymyksiin.

Millä todennäköisyydellä, ottaen huomioon, että Ross maalasi iloisen puun, hän maalasi sen jälkeen tuolle puulle ystävän?

On 93 prosentin todennäköisyys, että Ross maalaa toisen puun, jos hän on maalannut ensimmäisen.

Minkä prosenttiosuuden Bob Rossin maalauksista sisältää kaikkivoipaisen vuoren?

Noin 39 prosentissa esiintyy näkyvästi vuori.

Minkä prosenttiosuuden noista maalauksista sisältää useita kaikkivoipia vuoria?

Rossin oli mahdollista maalata myös ystäviä vuorille. Kuudessakymmenessä prosentissa maalauksista, joissa on yksi vuori, on vähintään kaksi vuorta.

Missä prosentissa noista maalauksista vuori on lumen peitossa?

Jos Ross maalasi vuoren, on 66 prosentin todennäköisyys, että siinä on lunta.

Mikä on jalkaisten pikku kukkuloiden laita?

Kukkuloita esiintyy neljässä prosentissa Rossin maalauksista. Hän suosi selvästi kaikkivoipia vuoria.

Miten on iloisten pienten pilvien laita?

Erinomainen kysymys, sillä 44 prosentissa Rossin maalauksista esiintyy näkyvästi ainakin yksi pilvi. Kun otetaan huomioon, että on maalattu pilvi, on 47 prosentin todennäköisyys, että se on selvästi cumulus-pilvi. Vain 14 prosentin todennäköisyys on, että maalattu pilvi on selvästi cirrus-pilvi.

Mikä on viehättävien pienten mökkien laita?

Noin 18 prosentissa Rossin maalauksista on mökki. Jos Ross maalasi mökin, on 35 prosentin todennäköisyys, että se on järven rannalla, ja 40 prosentin todennäköisyys, että maassa on lunta. Vaikka 72 prosenttia mökeistä on samassa maalauksessa havupuiden kanssa, vain 63 prosenttia on lehtipuiden läheisyydessä.

Miten usein hän maalasi vettä?

Koko ajan! Noin 34 prosentissa Rossin maalauksista on järvi, 33 prosentissa joki tai puro ja 9 prosentissa valtameri.

Luulostaa siltä, että hän ei pitänyt rannasta.

Paljon päinvastoin. Ranta näkyy 75 prosentissa Rossin merenrantamaalauksista, mutta aurinko vain 31 prosentissa niistä. Jos merta on, se on luultavasti aaltoileva: 97 prosentissa merta esittävistä maalauksista on aaltoja. Rossin 36 valtamerimaalauksessa oli myös todennäköisemmin kallioita, pilviä ja kiviä kuin keskimääräisessä maalauksessa.

Mitä Steve Rossista?

Steve näytti pitävän järvistä paljon enemmän kuin Bob. Vaikka vain 34 prosentissa Bobin maalauksista on järvi, 91 prosentissa Steven maalauksista on järvi.

Yksi hyödyllinen linssi, jota voimme soveltaa tämänkaltaiseen dataan – jossa vertaamme informaatiovektoreita – on klusterointityökalu. Klusteroinnin ideana on määrittää, kuinka lähellä tietyt tietoryhmät ovat muita datajoukon pisteitä. Tutkijat käyttävät klusterointianalyysiä kaikenlaisilla aloilla – biologiasta kuluttajamarkkinointiin – keinona segmentoida esimerkiksi kasvien tai ihmisten populaatio. Sen avulla voidaan löytää kiinnostavia aineiston osajoukkoja sen perusteella, kuinka samankaltaisia tai erilaisia tietyt alaryhmät ovat muusta joukosta.

Käytin algoritmia, jonka avulla jaoin ”The Joy of Painting” -teoksen 403 maalauksen koko joukon samankaltaisten maalausten klustereihin. Halusin tietää, onko mahdollista tunnistaa PBS:n sarjassa esitetyt 10 perusmaalausta. Tätä varten suoritin maalauksista k-means-klusterointianalyysin.3 Tulokset olivat vaihtelevia.

Katsotaan ensin klustereita, jotka ovat intuitiivisesti järkeviä. Selkeät voittajat ovat:

  • 50 maalauksen klusteri, jossa on merkintä ”lumi” ja ”talvi”
  • 28 maalauksen klusteri, joissa jokaisessa on soikea valkoisen tilan kehys
  • 35 maalauksen klusteri, jossa on merikohtauksia.

Tällaisia selkeitä klusteroitumismahdollisuuksia toivoimme löytävämme. Jokaisella on yhteinen teema, ja se kuuluu Bob Rossin ikonisten kuvien joukkoon. Hän maalasi noin yhden rantakuvan ja yhden ovaalirunkoisen kuvan per vuodenaika ja noin kaksi kohtausta, joissa on lunta etualalla, per vuodenaika. Siinä on järkeä.

Tässä on joitakin klustereita, joissa on myös järkeä, mutta jotka eivät kerro paljon Rossin suosikkimaalaustyypistä:

  • Vierasjuontaja Steve Rossin 13 maalauksen klusteri
  • Seitsemän maalauksen klusteri, jossa on silta
  • 11 maalauksen klusteri, jossa on kukkia
  • 30 maalauksen klusteri, jossa on aita tai lato
  • 33 maalauksen klusteri, jossa on vesiputous.

Näissä klustereissa tunnistetaan joitakin tunnuksia, jotka esiintyvät vain muutamissa maalauksissa, mutta ryhmittelyistä ei ole ylivoimaisesti apua Rossin maalaamien kohteiden määrittelyssä. Esimerkiksi kukat olivat hyvin harvoin maalauksen pääpaino, ja tiesimme jo, kuinka monta kertaa Steve Ross esiintyi ohjelmassa.

Kaksi viimeistä klusteria olivat kaikkein laajimmat:

  • Klusteri, johon kuului 95 maalausta, joissa oli puita ja vähintään yksi vuori
  • Klusteri, johon kuului 103 maalausta, joissa oli puita, mutta ei yhtään vuorta.

Ei äärimmäisen avulias, mutta silti varsin mielenkiintoinen. Klusterianalyysi on houkutteleva työkalu tämäntyyppiselle aineistolle, mutta sillä tuskin on kaikkia vastauksia.

Tullakseni tietoiseksi Rossista ja hänen työstään enemmän kuin sen, mitä jo tiesin aineistosta, soitin Annette Kowalskille, joka perusti yhdessä taidemaalarin kanssa Bob Ross Inc:n ja on edelleen hänen työnsä edunvalvoja.4 Hän vahvisti erään asian, jonka olin havainnut tarkastellessani satoja Rossin maisemia: hänen työtään ei määrittele se, mitä hänen maalauksissaan on mukana, vaan se, mitä on jätetty pois.

”Muistan kaksi kertaa, jolloin hän maalasi ihmisiä”, Kowalski sanoi. ”Oli mies leirinuotion äärellä,5 ja kaksi ihmistä kävelemässä metsässä. ”6 Aineistomme todellakin osoittaa, että Ross maalasi ihmisen – siluettina puuta vasten leirinuotion lähellä – vain kerran.

Yksi niistä harvoista Bob Rossin maalauksista PBS:n The Joy of Painting -ohjelmassa, joissa oli ihminen.

Yksi niistä harvoista Bob Rossin maalauksista PBS:n ”The Joy of Painting” -ohjelmassa, joissa esiintyi henkilö.

Bob Rossin nimi ja kuvat ovat Bob Ross Inc:n tavaramerkkejä. Kaikki oikeudet pidätetään. Käytetty luvalla.

Kun analysoimme hänen maalaamiaan rakenteita, näyttää siltä, että Ross suosi yksinkertaista taidokkaan sijaan. Hän maalasi 69 mökkiä, 25 eri huonokuntoista aitaa ja 17 latoa. Monimutkaisemmat ihmisen rakentamat rakenteet ovat hänen töissään huomattavan harvinaisia. Siltoja esiintyy vain seitsemän kertaa. Veneitä ja myllyjä kaksi kertaa. Ross maalasi yhden laiturin, yhden majakan ja yhden tuulimyllyn 381 jaksonsa aikana.

Rossin maalaamissa rakennelmissa on Kowalskin mukaan jotain sellaista, joka on jäänyt faneilta lähes täysin huomaamatta.

”Kerron teille Bobin suurimman salaisuuden. Jos huomaatte, hänen mökeissään ei koskaan ollut savupiippuja”, hän sanoi. ”Se johtuu siitä, että savupiiput edustivat ihmisiä, eikä hän halunnut mitään merkkejä ihmisestä maalauksissaan. Tarkista mökit. Niissä ei ole savupiippuja.”

Hän lisäsi heti: ”Olen varma, että soitat minulle huomenna ja sanot löytäneesi savupiipun.” Ja niinhän minä tein! Mutta se vaati paljon metsästystä. Kauden 7 jaksossa 1, ”Talvimökki”, mökillä on savupiippu (esillä yllä kolmannella rivillä, keskimmäisessä sarakkeessa). Mutta se, että savupiippu esiintyi kerran 381 maalauksessa, ei oikeastaan vähennä Kowalskin pointtia.

Kun asia on selvä, ”Maalaamisen ilo” ei oikeastaan koskaan kertonut maalaamisesta. Jopa Kowalski, joka pyörittää yritystä, joka myy Bob Ross -merkkisiä maalaustarvikkeita, uskoo, että suurin osa katsojista ei ole mukana taiteen vuoksi.

”Suurin osa Bob Rossia katsovista ihmisistä ei ole kiinnostunut maalaamisesta”, hän sanoi. ”Enimmäkseen se on hänen rauhoittava äänensä.”

X

Kokonaisuudessaan 403 jaksosta en pystynyt näkemään valmiita töitä kolmesta maalauksesta: 9. kauden jaksosta 10, ”Country Charm”, 15. kauden jaksosta 4, ”Peaceful Reflections” ja 26. kauden jaksosta 10, ”Purple Mountain Range”.”

X

Kokonaisuudessaan 403 jaksosta en pystynyt näkemään kolmen maalauksen valmista työtä: kauden 9 jakso 10, ”Country Charm”; kauden 15 jakso 4, ”Peaceful Reflections” ja kauden 26 jakso 10, ”Purple Mountain Range”.”

X

Tämä tietokokonaisuus on edelleen keskeneräinen – se on ensimmäinen laatuaan – ja siihen voi tietysti sisältyä puutteita. Koko ”Maalaamisen ilo” -elokuvan katsomiseen menisi reilut kahdeksan peräkkäistä päivää, joten tehtävä soveltuu huonosti yhdelle henkilölle. Olen kuitenkin vakuuttunut siitä, että aineisto tässä muodossaan kuvaa tarkasti ja johdonmukaisesti Rossin uran aikana tehtyjä töitä.

X

Kokonaisuudessaan 403 jaksosta en pystynyt näkemään kolmen maalauksen valmiita töitä: kauden 9 jakson 10. jakso ”Country Charm”, kauden 15 jakson 4. jakso ”Peaceful Reflections” ja kauden 26 jakson 10. jakso ”Purppuravuoristo”.”

X

Tämä tietokokonaisuus on edelleen keskeneräinen – se on ensimmäinen laatuaan – ja siihen voi tietysti sisältyä puutteita. Koko ”Maalaamisen ilo” -elokuvan katsomiseen menisi reilut kahdeksan peräkkäistä päivää, joten tehtävä soveltuu huonosti yhdelle henkilölle. Olen kuitenkin vakuuttunut siitä, että aineisto tässä muodossaan kuvaa tarkasti ja johdonmukaisesti Rossin uran aikana tehtyä työtä.

X

K-means-algoritmi on niin sanotusti epädeterministinen. Tämä tarkoittaa, että saat joka kerta hieman erilaisen tuloksen, koska algoritmi käyttää satunnaisuutta määrittäessään pisteitä, jotka määrittävät klustereiden keskipisteet.

X

Kokonaisuudessaan 403 jaksosta en nähnyt valmiiksi kolmea maalausta: kauden 9 jakso 10, ”Country Charm”, kauden 15 jakso 4, ”Peaceful Reflections” ja kauden 26 jakso 10, ”Purple Mountain Range”.”

X

Tämä tietokokonaisuus on edelleen keskeneräinen – se on ensimmäinen laatuaan – ja siihen voi tietysti sisältyä puutteita. Koko ”Maalaamisen ilo” -elokuvan katsomiseen menisi reilut kahdeksan peräkkäistä päivää, joten tehtävä soveltuu huonosti yhdelle henkilölle. Olen kuitenkin vakuuttunut siitä, että aineisto tässä muodossaan kuvaa tarkasti ja johdonmukaisesti Rossin uran aikana tehtyä työtä.

X

K-means-algoritmi on niin sanotusti epädeterministinen. Tämä tarkoittaa, että saat joka kerta hieman erilaisen tuloksen, koska algoritmi ottaa huomioon satunnaisuuden määrittäessään pisteitä, jotka määrittävät klusterien keskipisteet.

X

Kowalski oli myös vierailevana artistina kauden 29 jakson 10 jaksossa ”Pot o’ Posies”.���

X

Kokonaisuudessaan 403 jaksosta en pystynyt näkemään valmiiksi kolmea maalausta: kauden 9 jakso 10, ”Country Charm”, kauden 15 jakso 4, ”Peaceful Reflections” ja kauden 26 jakso 10, ”Purple Mountain Range”.”

X

Tämä tietokokonaisuus on edelleen keskeneräinen – se on ensimmäinen laatuaan – ja siihen voi tietysti sisältyä puutteita. Koko ”Maalaamisen ilo” -elokuvan katsomiseen menisi reilut kahdeksan peräkkäistä päivää, joten tehtävä soveltuu huonosti yhdelle henkilölle. Olen kuitenkin vakuuttunut siitä, että aineisto tässä muodossaan kuvaa tarkasti ja johdonmukaisesti Rossin uran aikana tehtyä työtä.

X

K-means-algoritmi on niin sanotusti epädeterministinen. Tämä tarkoittaa, että saat joka kerta hieman erilaisen tuloksen, koska algoritmi ottaa huomioon satunnaisuuden määrittäessään pisteitä, jotka määrittävät klusterien keskipisteet.

X

Kowalski oli myös vierailevana artistina kauden 29 jakson 10 jaksossa ”Pot o’ Posies”.���

X

Kausi 3, jakso 10 ”Leirinuotio”

X

Kokonaisuudessaan 403:sta jaksosta en päässyt näkemään valmiina kolmea maalausta: kauden 9 jakso 10, ”Maalaismaiseman viehätysvoima”, kauden 15 jakso 4, ”Rauhalliset heijastukset” ja kauden 26 jakso 10, ”Purppuravuoristo”.”

X

Tämä tietokokonaisuus on edelleen keskeneräinen – se on ensimmäinen laatuaan – ja siihen voi tietysti sisältyä puutteita. Koko ”Maalaamisen ilo” -elokuvan katsomiseen menisi reilut kahdeksan peräkkäistä päivää, joten tehtävä soveltuu huonosti yhdelle henkilölle. Olen kuitenkin vakuuttunut siitä, että aineisto tässä muodossaan kuvaa tarkasti ja johdonmukaisesti Rossin uran aikana tehtyä työtä.

X

K-means-algoritmi on niin sanotusti epädeterministinen. Tämä tarkoittaa, että saat joka kerta hieman erilaisen tuloksen, koska algoritmi ottaa huomioon satunnaisuuden määrittäessään pisteitä, jotka määrittävät klusterien keskipisteet.

X

Kowalski oli myös vierailevana artistina kauden 29 jakson 10 jaksossa ”Pot o’ Posies”.���

X

Kausi 3, jakso 10 ”Leirinuotio”

X

Tämä toinen maalaus ei näkynyt aineistossani, mutta on täysin mahdollista, että unohdin sen merkinnöissä.

X

The best of FiveThirtyEight, delivered to you.