Bob Ross munkásságának statisztikai elemzése

Bob Ross tökéletes tanár volt. Tizenegy éves televíziós karrierje során a PBS “A festészet öröme” című műsorában végigvezette a rajongókat, miközben “boldog fákat”, “mindenható hegyeket” és “pelyhes felhőket” festett. Ross összesen 381 művet festett a műsorban, amelyekben különböző elemekre, jelenetekre és témákra támaszkodott, és ezáltal több ezer adatpontot szolgáltatott. Úgy döntöttem, hogy ezeket az adatokat arra használom, hogy magam is tanítsak valamit: a feltételes valószínűség és a klaszterezés fontos statisztikai fogalmait, valamint egy leckét az adatok korlátairól.

Szóval daueroljuk ki a hajunkat, és készüljünk fel néhány vidám táblázat létrehozására!

Amit találtam – az adatelemzés és Ross egyik legközelebbi munkatársával készített interjú révén -, az egy olyan munkásság volt, amelyet a következetesség és egy alapvetően személyes eszmény határoz meg. Ross a floridai Daytonában született, és 17 évesen csatlakozott a légierőhöz. Fairbanksben állomásozott, és a következő 20 évet Alaszkában töltötte. Úgy tűnik, hogy az ott töltött idő jelentős hatással volt a fák, hegyek, felhők, tavak és hó által kedvelt témáira.

Bob Ross festményei a PBS The Joy of Painting című műsorában szerepelnek.

Bob Ross festményei a PBS “The Joy of Painting” című műsorában.

A Bob Ross név és a képek a Bob Ross Inc. védjegyei. Minden jog fenntartva. Használata engedéllyel történt.

A “A festészet öröme” 403 epizódjából – amelynek első adása 1983 és 1994 között futott, és amelyet a PBS országszerte ismétlésekben sugároz ma is – 381-ben Ross festett, a többi epizódban pedig egy vendég, leggyakrabban fia, Steve Ross szerepelt. Bob Ross festményeinek a Bob Ross Inc. áruházban elérhető képei alapján kódoltam az összes epizódot1 67 kulcsszóval, amelyek a tartalmat (fák, víz, hegyek, időjárási elemek és mesterséges építmények), a festmények keretezésének stilisztikai választásait és a vendégművészeket írják le, összesen 3224 címkét.2

Elemeztem az adatokat, hogy kiderítsem, pontosan mit festett az 1995-ben elhunyt Ross több mint egy évtizeden át a tévében. A felsőkategóriás eredmények várhatóak – hát nem tudod, tényleg festett egy csomó hegyet, fát és tavat! – de aztán számokkal is alátámasztottam Ross klasszikus szóképeit. Nem tölgyeket vagy lucfenyőket festett, hanem “boldog fákat”. A csúcsoknak a “mindenható hegyeket” részesítette előnyben. Ha egyszer megfestett egy fát, nem festett másikat – egy “barátot” festett.”

Itt van, hogy az egyes, ötnél többször előforduló címkék milyen gyakran fordultak elő a 381 epizód során:

hickey-ross-tags (1)

Most, hogy ismerjük az egyes címkék alapvető valószínűségeit, meg tudjuk találni néhány ilyen esemény együttes valószínűségét is. Például milyen gyakran jelenik meg egy lombhullató fa és egy tűlevelű fa ugyanazon a képen? Tudjuk, hogy a festmények 57 százalékán szerepel lombhullató fa, 53 százalékán pedig tűlevelű fa. A mi adathalmazunk szerint a festmények 20 százaléka tartalmaz mindkettőből legalább egyet.

Még azt is meg tudjuk találni, hogy mekkora annak a valószínűsége, hogy Ross festett valamit, feltéve, hogy festett valami mást, ezt a statisztikát feltételes valószínűségnek nevezzük.

A feltételes valószínűség egy kicsit trükkös lehet. Tudjuk, hogy Ross festményeinek 44 százaléka felhőket, 9 százaléka tengerpartot, 7 százaléka pedig felhőket és tengerpartot egyaránt tartalmaz. Ezt az információt felhasználhatjuk két dolog kiszámítására: annak a valószínűségére, hogy Ross felhőt festett, feltéve, hogy tengerpartot festett, és annak a valószínűségére, hogy tengerpartot festett, feltéve, hogy felhőt festett. Az együttes valószínűséget – ebben az esetben 7 százalékot – elosztjuk az adott valószínűséggel – 44 százalék vagy 9 százalék, attól függően, hogy annak a valószínűségére vagyunk kíváncsiak, hogy a felhőhöz adott strand, vagy a felhőhöz adott strand.

A legnagyobb buktató, amivel az emberek gyakran szembesülnek, hogy a két valószínűséget azonosnak feltételezik. Annak valószínűsége, hogy Ross felhőt festett, tekintve, hogy tengerpartot festett – lényegében, hogy hány tengerparti festményen van felhő – (0,07)/(0,09), azaz 78 százalék. A tengerparti jelenetek túlnyomó többsége tartalmaz felhőket. Annak valószínűsége azonban, hogy Ross tengerpartot festett, tekintve, hogy felhőt festett – vagyis, hogy hány felhős festmény tartalmaz tengerpartot -, (0,07)/(0,44), azaz 16 százalék. Tehát a felhőfestmények túlnyomó többsége nem tartalmaz strandot.

Kiszámoltam minden Bob Ross-jelző feltételes valószínűségét minden más jelzővel szemben, hogy megválaszoljam a következő sürgető kérdéseket:

Mi a valószínűsége annak, hogy – feltéve, hogy Ross egy boldog fát festett -, hogy ezután egy barátot festett a fához?

93 százalék az esélye annak, hogy Ross egy második fát is fest, feltéve, hogy az elsőt megfestette.

A Bob Ross-festmények hány százaléka tartalmaz egy mindenható hegyet?

Ezeknek a festményeknek körülbelül 39 százalékán feltűnően szerepel egy hegy.

Melyik százalékán szerepel több mindenható hegy?

Ross arra is hajlandó volt, hogy hegyek helyett barátokat fessen. Az egy hegyet ábrázoló festmények 60 százalékán legalább két hegy van.

Ezeknek a festményeknek hány százalékán van egy hegy hóval borítva?

Mivel Ross egy hegyet festett, 66 százalék az esélye, hogy hó van rajta.

Mi a helyzet a gyalogos kis hegyekkel?

A hegyek Ross festményeinek 4 százalékán szerepelnek. Egyértelműen a mindenható hegyeket részesítette előnyben.

Hogyan van a vidám kis felhőkkel?

Kiváló kérdés, hiszen Ross festményeinek 44 százalékán feltűnően szerepel legalább egy felhő. Tekintve, hogy van egy festett felhő, 47 százalék az esélye, hogy kifejezetten gomolyfelhő. Csak 14 százalék az esélye annak, hogy egy festett felhő kifejezetten cirrus felhő.

Mi a helyzet a bájos kis kunyhókkal?

A festményeinek körülbelül 18 százalékán szerepel egy kunyhó. Mivel Ross egy kunyhót festett, 35 százalék az esélye, hogy az egy tó partján van, és 40 százalék, hogy hó van a földön. Míg a kunyhók 72 százaléka tűlevelű fákkal van egy festményen, csak 63 százalékuk lombhullató fák közelében található.

Hányszor festett vizet?

Mindig! Ross festményeinek körülbelül 34 százalékán szerepel tó, 33 százalékán folyó vagy patak, 9 százalékán pedig óceán.

Úgy hangzik, mintha nem szerette volna a tengerpartot.

Sokkal inkább az ellenkezőjét. Ross tengerparti festményeinek 75 százalékán látható a tengerpart, de a nap csak 31 százalékán. Ha van óceán, akkor az valószínűleg háborgó: az óceános festmények 97 százalékán vannak hullámok. Ross 36 óceánfestményén szintén nagyobb valószínűséggel szerepeltek sziklák, felhők és sziklák, mint az átlagos festményeken.

Mi a helyzet Steve Ross-szal?

Steve úgy tűnik, sokkal jobban kedveli a tavakat, mint Bob. Míg Bob festményeinek csak 34 százalékán szerepel tó, addig Steve festményeinek 91 százalékán.

Az egyik hasznos lencse, amelyet az ilyen jellegű adatokra – ahol információvektorokat hasonlítunk össze – alkalmazhatunk, a klaszterezés eszköze. A klaszterezés lényege, hogy meghatározzuk, mennyire állnak közel bizonyos adatcsoportok az adathalmaz más pontjaihoz. A kutatók mindenféle területen – a biológiától a fogyasztói marketingig – használják a klaszterelemzést, mondjuk növények vagy emberek populációjának szegmentálására. Lehetővé teszi számunkra, hogy érdekes adathalmazokat találjunk az alapján, hogy bizonyos alcsoportok mennyire hasonlítanak vagy különböznek a halmaz többi részétől.

A “A festészet öröme” című könyv 403 festményének teljes halmazát egy algoritmus segítségével hasonló festmények klasztereire osztottam. Arra voltam kíváncsi, hogy azonosítható-e a PBS sorozatában szereplő 10 alapvető festmény. Ehhez lefuttattam a festmények k-means klaszterelemzését.3 Az eredmények vegyesek voltak.

Először nézzük meg azokat a klasztereket, amelyeknek intuitív értelme van. Az egyértelmű győztesek a következők:

  • Egy 50 “hó” és “tél” címkével ellátott festményből álló klaszter
  • Egy 28 festményből álló klaszter, amelyek mindegyike egy-egy ovális fehér térbeli kerettel rendelkezik
  • Egy 35 óceáni jelenetet ábrázoló festményből álló klaszter.

Ezek voltak azok a fajta egyértelmű klaszterek, amelyeket reméltünk. Mindegyiknek közös témája van, és az ikonikus Bob Ross-képek zászlaja alá tartozik. Évszakonként körülbelül egy tengerparti jelenetet és egy ovális keretes képet festett, és évszakonként körülbelül két olyan jelenetet, amelynek előterében hó van. Ennek van értelme.

Itt van néhány klaszter, amelyeknek szintén van értelme, de nem árulnak el sokat Ross kedvenc festményfajtájáról:

  • A vendéglátó Steve Ross 13 festményéből álló klaszter
  • Hídat tartalmazó 7 festményből álló klaszter
  • Virágokat tartalmazó 11 festményből álló klaszter
  • Kerítést vagy pajtát tartalmazó 30 festményből álló klaszter
  • Vízesést tartalmazó 33 festményből álló klaszter.

Ezek a klaszterek azonosítanak néhány olyan címkét, amelyek csak néhány festményen jelennek meg, de a csoportosítások nem nyújtanak kiemelkedő segítséget annak meghatározásában, hogy Ross mit festett. Például a virágok nagyon ritkán voltak egy festmény fő témája, és már tudtuk, hogy Steve Ross hányszor szerepelt a műsorban.

Az utolsó két klaszter volt a legtágabb:

  • A 95 festményből álló klaszter, amelyeken fák és legalább egy hegy szerepelt
  • A 103 festményből álló klaszter, amelyeken fák voltak, de hegyek nem.

Nem túlságosan hasznos, de még mindig elég érdekes. A klaszterelemzés vonzó eszköz az ilyen típusú adatokhoz, de aligha ad mindenre választ.

Hogy többet tudjak meg Rossról és munkásságáról azon túl, amit az adatokból már tudtam, felhívtam Annette Kowalski-t, aki a festővel együtt alapította a Bob Ross Inc.-t, és továbbra is ő a munkásságának gondnoka.4 Megerősített valamit, amit Ross több száz tájképének áttekintése során fedeztem fel: munkásságát nem az határozza meg, hogy mi szerepel a képein, hanem az, hogy mi van kizárva.

“Két alkalomra tudok gondolni, amikor embereket festett” – mondta Kowalski. “Volt egy ember egy tábortűznél,5 és két ember, akik az erdőben sétálnak. “6 Valóban, adataink azt mutatják, hogy Ross csak egyszer festett embert – sziluettben egy fával szemben egy tábortűz mellett -.

A PBS The Joy of Painting című műsorában szereplő kevés Bob Ross-festmény egyike, amelyen ember szerepel.

A PBS “A festészet öröme” című műsorában szereplő kevés Bob Ross-festmény egyike, amelyen egy ember szerepel.

A Bob Ross név és a képek a Bob Ross Inc. védjegyei. Minden jog fenntartva. Engedéllyel használjuk.

Az általa festett szerkezeteket elemezve úgy tűnik, Ross az egyszerűt részesítette előnyben a bonyolultal szemben. Összesen 69 kunyhót, 25 különböző állapotú kerítést és 17 pajtát festett. Az összetettebb, ember alkotta építmények feltűnően ritkák a munkáiban. A hidak mindössze hét alkalommal jelennek meg. Csónakok és malmok kétszer. Ross 381 epizódja során egy dokkot, egy világítótornyot és egy szélmalmot festett.

A Ross által festett építményekben van valami, ami Kowalski szerint szinte teljesen észrevétlen maradt a rajongók számára.

“Elmondom Bob legnagyobb titkát. Ha észrevetted, a kunyhóin soha nem volt kémény” – mondta. “Ez azért van, mert a kémények az embereket jelképezték, és ő nem akarta, hogy a festményein bármilyen jele legyen az embernek. Nézd meg a kunyhókat. Nincsenek kémények.”

A nő azonnal hozzátette: “Biztos vagyok benne, hogy holnap felhívsz, és azt mondod, hogy találtál egy kéményt”. És meg is találtam! De sok vadászatba került. A 7. évad 1. epizódjában, a “Téli kunyhó”-ban van egy kémény a kunyhón (fent látható a harmadik sorban, középső oszlopban). De az a tény, hogy 381 festményen egyszer jelent meg kémény, nem igazán csökkenti Kowalski álláspontját.

Ha a lényegre térünk, “A festészet öröme” valójában sosem a festészetről szólt. Még Kowalski is, aki egy Bob Ross márkájú festészeti kellékeket forgalmazó céget vezet, úgy véli, hogy a legtöbb néző nem a művészet miatt nézi.

“Az emberek többsége, akik Bob Rosst nézik, nem érdeklődik a festészet iránt” – mondta. “Leginkább a megnyugtató hangja miatt.”

X

Az összesen 403 epizódból három festmény befejezett munkáját nem tudtam megnézni: a 9. évad 10. epizódját, a “Country Charm”; a 15. évad 4. epizódját, a “Peaceful Reflections” és a 26. évad 10. epizódját, a “Purple Mountain Range” címűt.”

X

Az összesen 403 epizódból három festmény befejezett munkáját nem tudtam megnézni: 9. évad 10. epizód, “Country Charm”; 15. évad 4. epizód, “Peaceful Reflections” és 26. évad 10. epizód, “Purple Mountain Range”.”

X

Ez az adatsor továbbra is folyamatban lévő munka – ez az első a maga nemében -, és természetesen fennáll a kihagyások lehetősége. Alig több mint nyolc egymást követő napra lenne szükség ahhoz, hogy az egész “A festészet öröme” című filmet végignézzük, így ez a feladat egy személy számára alkalmatlan. De bízom benne, hogy az adatok ebben a formában pontosan és következetesen írják le Ross pályafutásának munkáját.

X

Az összesen 403 epizódból három festmény befejezett munkáját nem tudtam megnézni: a 9. évad 10. epizódját, a “Country Charm”; a 15. évad 4. epizódját, a “Peaceful Reflections” és a 26. évad 10. epizódját, a “Purple Mountain Range” címűt.”

X

Ez az adatsor továbbra is folyamatban lévő munka – ez az első a maga nemében -, és természetesen fennáll a kihagyások lehetősége. Alig több mint nyolc egymást követő napra lenne szükség ahhoz, hogy az egész “A festészet öröme” című filmet végignézzük, így ez a feladat egy személy számára alkalmatlan. De biztos vagyok benne, hogy az adatok jelen állapotukban pontosan és következetesen írják le a Ross pályafutása során készült munkákat.

X

A k-means algoritmust nemdeterminisztikusnak nevezzük. Ez azt jelenti, hogy minden alkalommal kissé eltérő eredményt kapunk, mivel az algoritmus véletlenszerűséget vesz figyelembe a klaszterek középpontjait meghatározó pontok meghatározásakor.

X

Az összesen 403 epizódból három festmény befejezett munkáját nem tudtam megnézni: a 9. évad 10. epizódja, “Country Charm”; a 15. évad 4. epizódja, “Peaceful Reflections” és a 26. évad 10. epizódja, “Purple Mountain Range”.”

X

Ez az adatsor továbbra is folyamatban lévő munka – ez az első a maga nemében -, és természetesen fennáll a kihagyások lehetősége. Alig több mint nyolc egymást követő napra lenne szükség ahhoz, hogy az egész “A festészet öröme” című filmet végignézzük, így ez a feladat egy személy számára alkalmatlan. De biztos vagyok benne, hogy az adatok jelen állapotukban pontosan és következetesen írják le a Ross pályafutása során készült munkákat.

X

A k-means algoritmust nemdeterminisztikusnak nevezzük. Ez azt jelenti, hogy minden alkalommal kissé eltérő eredményt kapunk, mivel az algoritmus véletlenszerűséget vesz figyelembe a klaszterek középpontjait meghatározó pontok meghatározásakor.

X

Kowalski a 29. évad 10. epizódjának, a Pot o’ Posies-nek a vendégművésze is volt.���

X

Az összesen 403 epizódból három festmény befejezett munkáját nem láthattam: 9. évad 10. epizód, “Country Charm”; 15. évad 4. epizód, “Peaceful Reflections” és 26. évad 10. epizód, “Purple Mountain Range”.”

X

Ez az adatsor továbbra is folyamatban lévő munka – ez az első a maga nemében -, és természetesen fennáll a kihagyások lehetősége. Alig több mint nyolc egymást követő napra lenne szükség ahhoz, hogy az egész “A festészet öröme” című filmet végignézzük, így ez a feladat egy személy számára alkalmatlan. De biztos vagyok benne, hogy az adatok jelen állapotukban pontosan és következetesen írják le a Ross pályafutása során készült munkákat.

X

A k-means algoritmust nemdeterminisztikusnak nevezzük. Ez azt jelenti, hogy minden alkalommal kissé eltérő eredményt kapunk, mivel az algoritmus véletlenszerűséget vesz figyelembe a klaszterek középpontjait meghatározó pontok meghatározásakor.

X

Kowalski a 29. évad 10. epizódjának, a Pot o’ Posies-nek a vendégművésze is volt.���

X

3. évad, 10. epizód, “Tábortűz”

X

Az összesen 403 epizódból három festmény befejezett munkáját nem láthattam: a 9. évad 10. epizód, “Country Charm”; a 15. évad 4. epizód, “Peaceful Reflections” és a 26. évad 10. epizód, “Purple Mountain Range”.”

X

Ez az adatsor továbbra is folyamatban lévő munka – ez az első a maga nemében -, és természetesen fennáll a kihagyások lehetősége. Alig több mint nyolc egymást követő napra lenne szükség ahhoz, hogy az egész “A festészet öröme” című filmet végignézzük, így ez a feladat egy személy számára alkalmatlan. De biztos vagyok benne, hogy az adatok jelen állapotukban pontosan és következetesen írják le a Ross pályafutása során készült munkákat.

X

A k-means algoritmust nemdeterminisztikusnak nevezzük. Ez azt jelenti, hogy minden alkalommal kissé eltérő eredményt kapunk, mivel az algoritmus véletlenszerűséget vesz figyelembe a klaszterek középpontjait meghatározó pontok meghatározásakor.

X

Kowalski a 29. évad 10. epizódjának, a Pot o’ Posies-nek a vendégművésze is volt.���

X

3. évad, 10. epizód “Tábortűz”

X

Ez a második festmény nem jelent meg az adathalmazomban, de teljesen lehetséges, hogy a címkézéskor kihagytam.

×

A FiveThirtyEight legjobbjai, neked szállítva.