Un’analisi statistica del lavoro di Bob Ross

Bob Ross era un insegnante consumato. Ha guidato i fan mentre dipingeva “alberi felici”, “montagne onnipotenti” e “nuvole soffici” nel corso della sua carriera televisiva di 11 anni nel suo show PBS, “The Joy of Painting”. In totale, Ross ha dipinto 381 opere nello show, basandosi su una serie distinta di elementi, scene e temi, e fornendo così migliaia di punti dati. Ho deciso di usare quei dati per insegnare qualcosa a me stesso: gli importanti concetti statistici di probabilità condizionale e clustering, così come una lezione sui limiti dei dati.

Perciò sciogliamo i capelli e prepariamoci a creare dei felici fogli di calcolo!

Quello che ho trovato – attraverso l’analisi dei dati e un’intervista con uno dei più stretti collaboratori di Ross – era un corpo di lavoro che era definito dalla coerenza e da un ideale fondamentalmente personale. Ross è nato a Daytona, in Florida, e si è arruolato nell’Air Force a 17 anni. Fu di stanza a Fairbanks e trascorse i successivi 20 anni in Alaska. Il suo tempo lì sembra aver avuto un impatto significativo sui suoi soggetti preferiti di alberi, montagne, nuvole, laghi e neve.

Pittura di Bob Ross presentata su The Joy of Painting della PBS.

Pittura di Bob Ross presentata su “The Joy of Painting” della PBS.

Il nome e le immagini di Bob Ross sono marchi di Bob Ross Inc. Tutti i diritti riservati. Usato con permesso.

Delle 403 puntate di “The Joy of Painting” – la cui prima edizione è stata dal 1983 al 1994 e che continua ad andare in onda in repliche sulle stazioni PBS in tutta la nazione – Ross ha dipinto in 381, e il resto ha avuto un ospite, più frequentemente suo figlio Steve Ross. Basandomi sulle immagini dei dipinti di Bob Ross disponibili nel negozio della Bob Ross Inc. ho codificato tutti gli episodi1 utilizzando 67 parole chiave che descrivono il contenuto (alberi, acqua, montagne, elementi atmosferici e strutture artificiali), le scelte stilistiche nell’inquadrare i dipinti e gli artisti ospiti, per un totale di 3.224 tag.2

Ho analizzato i dati per scoprire esattamente cosa ha dipinto Ross, morto nel 1995, per oltre un decennio in TV. I risultati sono prevedibili – non si sa mai, ha dipinto un sacco di montagne, alberi e laghi! – ma poi ho messo dei numeri alle classiche figure retoriche di Ross. Non ha dipinto querce o abeti, ha dipinto “alberi felici”. Preferiva “montagne onnipotenti” alle cime. Una volta dipinto un albero, non ne dipingeva un altro – dipingeva un “amico”.

Ecco quanto spesso ogni tag che è apparso più di cinque volte si è presentato nei 381 episodi:

hickey-ross-tags (1)

Ora che sappiamo le probabilità di base dei singoli tag, possiamo anche trovare le probabilità congiunte di alcuni di questi eventi. Per esempio, quanto spesso un albero deciduo e un albero di conifere appaiono nello stesso dipinto? Sappiamo che il 57% dei dipinti contiene un albero deciduo e il 53% dei dipinti contiene un albero di conifere. Secondo il nostro set di dati, il 20% dei dipinti contiene almeno uno di ciascuno di essi.

Inoltre, possiamo anche trovare la probabilità che Ross abbia dipinto qualcosa dato che ha dipinto qualcos’altro, una statistica chiamata probabilità condizionale.

La probabilità condizionale può essere un po’ difficile. Sappiamo che il 44% dei dipinti di Ross contiene nuvole, il 9% contiene la spiaggia e il 7% contiene sia le nuvole che la spiaggia. Possiamo usare queste informazioni per capire due cose: la probabilità che Ross abbia dipinto una nuvola dato che ha dipinto una spiaggia, e la probabilità che abbia dipinto una spiaggia dato che ha dipinto una nuvola. Si divide la probabilità congiunta – 7 per cento in questo caso – per la probabilità del dato – 44 per cento o 9 per cento, a seconda che si voglia sapere la probabilità di una spiaggia data una nuvola o di una nuvola data una spiaggia.

La più grande trappola che la gente spesso affronta è assumere che le due probabilità siano le stesse. La probabilità che Ross abbia dipinto una nuvola dato che ha dipinto la spiaggia – essenzialmente, quanti dipinti di spiaggia hanno nuvole – è (0,07)/(0,09), che è il 78%. La stragrande maggioranza delle scene di spiaggia contiene nuvole. Tuttavia, la probabilità che Ross abbia dipinto una spiaggia dato che ha dipinto una nuvola – o, quanti dipinti di nuvole contengono una spiaggia – è (0,07)/(0,44), ovvero il 16 per cento. Quindi la stragrande maggioranza dei dipinti di nuvole non hanno spiagge.

Ho calcolato la probabilità condizionale di ogni tag di Bob Ross contro ogni altro tag per rispondere alle seguenti domande pressanti.

Qual è la probabilità, dato che Ross ha dipinto un albero felice, che poi ha dipinto un amico per quell’albero?

C’è un 93% di probabilità che Ross dipinga un secondo albero, dato che ha dipinto il primo.

Quale percentuale dei quadri di Bob Ross contiene una montagna onnipotente?

Circa il 39% ha una montagna in primo piano.

Quale percentuale di quei quadri contiene diverse montagne onnipotenti?

Ross era anche disposto a dipingere amici per le montagne. Il sessanta per cento dei quadri con una montagna ha almeno due montagne.

In quale percentuale di questi quadri una montagna è coperta di neve?

Dato che Ross ha dipinto una montagna, c’è un 66 per cento di possibilità che ci sia della neve sopra.

E le piccole colline?

Le colline appaiono nel 4 per cento dei quadri di Ross. Chiaramente preferiva le montagne onnipotenti.

Che ne dici di piccole nuvole felici?

Ottima domanda, dato che il 44% dei dipinti di Ross presenta in modo prominente almeno una nuvola. Dato che c’è una nuvola dipinta, c’è un 47 per cento di possibilità che sia distintamente un cumulo. C’è solo un 14 per cento di possibilità che una nuvola dipinta sia un cirro distinto.

Che dire delle affascinanti piccole cabine?

Circa il 18 per cento dei suoi dipinti presentano una cabina. Dato che Ross ha dipinto una capanna, c’è un 35% di possibilità che sia su un lago e un 40% di possibilità che ci sia della neve sul terreno. Mentre il 72 per cento delle capanne si trova nello stesso dipinto di conifere, solo il 63 per cento è vicino ad alberi decidui.

Quante volte ha dipinto l’acqua?

Tutto il tempo! Circa il 34 per cento dei dipinti di Ross contengono un lago, il 33 per cento contengono un fiume o un torrente, e il 9 per cento contengono l’oceano.

Sembra che non gli piacesse la spiaggia.

Molto al contrario. Si può vedere la spiaggia nel 75 per cento dei dipinti balneari di Ross, ma il sole solo nel 31 per cento di essi. Se c’è un oceano, probabilmente è increspato: il 97% dei dipinti di oceano ha delle onde. I 36 dipinti oceanici di Ross avevano anche più probabilità di presentare scogliere, nuvole e rocce rispetto alla media dei dipinti.

Che dire di Steve Ross?

Steve sembra preferire i laghi molto più di Bob. Mentre solo il 34% dei dipinti di Bob hanno un lago, il 91% dei dipinti di Steve ce l’hanno.

Una lente utile che possiamo applicare a questo tipo di dati – dove stiamo confrontando vettori di informazioni – è uno strumento di clustering. L’idea alla base del clustering è quella di determinare quanto vicini siano certi gruppi di dati ad altri punti del set di dati. I ricercatori usano l’analisi di clustering in tutti i tipi di aree – dalla biologia al marketing dei consumatori – come un modo per segmentare una popolazione di, diciamo, piante o persone. Ci permette di trovare interessanti sottoinsiemi di dati basati su quanto simili o diversi sono certi sottogruppi dal resto dell’insieme.

Ho usato un algoritmo per dividere l’intero insieme di 403 dipinti da “The Joy of Painting” in gruppi di dipinti simili. Volevo sapere se era possibile identificare i 10 dipinti di base presenti nella serie PBS. Per fare questo, ho eseguito un’analisi di clustering k-means dei dipinti.3 I risultati sono stati contrastanti.

Primo, guardiamo i cluster che hanno un senso intuitivo. I chiari vincitori sono:

  • Un cluster di 50 dipinti etichettati come “neve” e “inverno”
  • Un cluster di 28 dipinti ciascuno con una cornice ovale nello spazio bianco
  • Un cluster di 35 dipinti di scene oceaniche.

Questi erano i tipi di clustering chiari che speravamo di trovare. Ognuno ha un tema comune e cade sotto la bandiera delle immagini iconiche di Bob Ross. Ha dipinto circa una scena di spiaggia e un’immagine con cornice ovale per stagione, e circa due scene con neve in primo piano per stagione. Ha senso.

Ecco alcuni raggruppamenti che hanno anche senso, ma non ci dicono molto sul tipo di pittura preferita di Ross:

  • Un gruppo di 13 dipinti dell’ospite Steve Ross
  • Un gruppo di 7 dipinti contenenti un ponte
  • Un gruppo di 11 dipinti contenenti fiori
  • Un gruppo di 30 dipinti contenenti un recinto o un fienile
  • Un gruppo di 33 dipinti contenenti una cascata.
  • Questi raggruppamenti identificano alcune etichette che appaiono solo in alcuni dipinti, ma i raggruppamenti non sono estremamente utili per definire ciò che Ross ha dipinto. Per esempio, i fiori erano molto raramente l’obiettivo principale di un dipinto, e sapevamo già quante volte Steve Ross è apparso nel programma.

    Gli ultimi due raggruppamenti erano i più ampi:

    • Un raggruppamento di 95 dipinti che avevano alberi e almeno una montagna
    • Un raggruppamento di 103 dipinti che avevano alberi ma nessuna montagna.

    Non estremamente utile, ma ancora abbastanza interessante. L’analisi del clustering è uno strumento interessante per questo tipo di dati, ma difficilmente ha tutte le risposte.

    Per saperne di più su Ross e il suo lavoro oltre a quello che già sapevo dai dati, ho chiamato Annette Kowalski, che ha fondato la Bob Ross Inc. con il pittore e rimane la custode del suo lavoro.4 Ha confermato qualcosa che avevo scoperto nella mia revisione di centinaia di paesaggi di Ross: il suo lavoro non è definito da ciò che è incluso nei suoi dipinti, ma da ciò che è escluso.

    “Posso pensare a due volte in cui ha dipinto persone”, ha detto Kowalski. “C’era un uomo vicino a un falò,5 e due persone che camminavano nel bosco”.6 In effetti, i nostri dati mostrano che Ross ha dipinto una persona – in silhouette contro un albero vicino a un falò – solo una volta.

    Uno dei pochi dipinti di Bob Ross in The Joy of Painting della PBS che presentava una persona.

    Uno dei pochi dipinti di Bob Ross nel programma della PBS “The Joy of Painting” in cui compare una persona.

    Il nome e le immagini di Bob Ross sono marchi di Bob Ross Inc. Tutti i diritti riservati. Usati con permesso.

    Analizzando le strutture che ha dipinto, sembra che Ross abbia preferito il semplice all’elaborato. Ha dipinto 69 capanne, 25 recinti in vari stati di abbandono e 17 granai. Strutture artificiali più complesse sono notevolmente rare nel suo lavoro. I ponti appaiono solo sette volte. Barche e mulini, due volte ciascuno. Ross ha dipinto un molo, un faro e un mulino a vento nei suoi 381 episodi.

    C’è qualcosa nelle strutture dipinte da Ross che è passato quasi del tutto inosservato ai fan, secondo Kowalski.

    “Vi dirò il più grande segreto di Bob. Se ci fate caso, le sue cabine non hanno mai avuto camini”, ha detto. “Questo perché i camini rappresentavano le persone, e lui non voleva alcun segno di una persona nei suoi dipinti. Controllate le capanne. Non hanno camini”

    Ha subito aggiunto: “Sono sicuro che domani mi chiamerai per dirmi che hai trovato un camino”. E l’ho fatto! Ma c’è voluta un sacco di caccia. Nell’episodio 1 della stagione 7, “Winter Cabin”, c’è un camino sulla cabina (in alto nella terza fila, colonna centrale). Ma il fatto che un camino sia apparso una volta su 381 dipinti non diminuisce davvero il punto di Kowalski.

    Quando si arriva al dunque, “The Joy of Painting” non è mai stato davvero sulla pittura. Anche Kowalski, che gestisce una società che vende forniture per la pittura a marchio Bob Ross, crede che la maggior parte degli spettatori non lo faccia per l’arte.

    “La maggior parte delle persone che guardano Bob Ross non hanno interesse nella pittura”, ha detto. “

    X

    Dei 403 episodi totali, non sono stato in grado di vedere il lavoro completato di tre dipinti: stagione 9 episodio 10, “Country Charm”; stagione 15 episodio 4, “Peaceful Reflections” e stagione 26 episodio 10, “Purple Mountain Range.”

    X

    Dei 403 episodi totali, non sono riuscito a vedere il lavoro completato di tre dipinti: stagione 9 episodio 10, “Country Charm”; stagione 15 episodio 4, “Peaceful Reflections” e stagione 26 episodio 10, “Purple Mountain Range.”

    X

    Questo set di dati rimane un lavoro in corso – è il primo del suo genere – e c’è naturalmente il potenziale di omissioni. Ci vorrebbero poco più di otto giorni di fila per guardare tutto “The Joy Of Painting”, quindi è un compito poco adatto ad una sola persona. Ma sono fiducioso che i dati così come sono descrivono il lavoro nella carriera di Ross in modo accurato e coerente.

    X

    Dei 403 episodi totali, non sono riuscito a vedere il lavoro completato di tre dipinti: stagione 9 episodio 10, “Country Charm”; stagione 15 episodio 4, “Peaceful Reflections” e stagione 26 episodio 10, “Purple Mountain Range.”

    X

    Questo set di dati rimane un lavoro in corso – è il primo del suo genere – e c’è naturalmente il potenziale di omissioni. Ci vorrebbero poco più di otto giorni di fila per guardare tutto “The Joy Of Painting”, quindi è un compito poco adatto ad una sola persona. Ma sono fiducioso che i dati così come sono descrivono il lavoro nella carriera di Ross in modo accurato e coerente.

    X

    L’algoritmo k-means è quello che noi chiamiamo non-deterministico. Questo significa che otterrai un risultato leggermente diverso ogni volta, a causa della casualità in cui l’algoritmo si basa nel determinare i punti che definiscono i centri dei cluster.

    X

    Dei 403 episodi totali, non sono riuscito a vedere il lavoro completato di tre quadri: stagione 9 episodio 10, “Country Charm”; stagione 15 episodio 4, “Peaceful Reflections” e stagione 26 episodio 10, “Purple Mountain Range.”

    X

    Questo set di dati rimane un lavoro in corso – è il primo del suo genere – e c’è naturalmente il potenziale di omissioni. Ci vorrebbero poco più di otto giorni di fila per guardare tutto “The Joy Of Painting”, quindi è un compito poco adatto ad una sola persona. Ma sono fiducioso che i dati così come sono descrivono il lavoro nella carriera di Ross in modo accurato e coerente.

    X

    L’algoritmo k-means è quello che noi chiamiamo non-deterministico. Questo significa che si otterrà un risultato leggermente diverso ogni volta, a causa della casualità di cui l’algoritmo tiene conto nel determinare i punti che definiscono i centri dei cluster.

    X

    Kowalski è stato anche un artista ospite della stagione 29, episodio 10, “Pot o’ Posies.���

    X

    Dei 403 episodi totali, non sono stato in grado di vedere il lavoro completato di tre quadri: stagione 9 episodio 10, “Fascino del paese”; stagione 15 episodio 4, “Riflessioni pacifiche” e stagione 26 episodio 10, “Gamma di montagne viola.”

    X

    Questo set di dati rimane un lavoro in corso – è il primo del suo genere – e c’è naturalmente il potenziale di omissioni. Ci vorrebbero poco più di otto giorni di fila per guardare tutto “The Joy Of Painting”, quindi è un compito poco adatto ad una sola persona. Ma sono fiducioso che i dati così come sono descrivono il lavoro nella carriera di Ross in modo accurato e coerente.

    X

    L’algoritmo k-means è quello che noi chiamiamo non-deterministico. Questo significa che si otterrà un risultato leggermente diverso ogni volta, a causa della casualità in cui l’algoritmo si basa nel determinare i punti che definiscono i centri dei cluster.

    X

    Kowalski è stato anche un artista ospite della stagione 29 episodio 10, “Pot o’ Posies.���

    X

    Stagione 3, episodio 10 “Campfire”

    X

    Dei 403 episodi totali, non sono riuscito a vedere il lavoro completato di tre dipinti: stagione 9 episodio 10, “Country Charm”; stagione 15 episodio 4, “Peaceful Reflections” e stagione 26 episodio 10, “Purple Mountain Range.”

    X

    Questo set di dati rimane un lavoro in corso – è il primo del suo genere – e c’è naturalmente il potenziale di omissioni. Ci vorrebbero poco più di otto giorni di fila per guardare tutto “The Joy Of Painting”, quindi è un compito poco adatto ad una sola persona. Ma sono fiducioso che i dati così come sono descrivono il lavoro nella carriera di Ross in modo accurato e coerente.

    X

    L’algoritmo k-means è quello che noi chiamiamo non-deterministico. Questo significa che si otterrà un risultato leggermente diverso ogni volta, a causa della casualità in cui l’algoritmo si basa nel determinare i punti che definiscono i centri dei cluster.

    X

    Kowalski è stato anche un artista ospite della stagione 29 episodio 10, “Pot o’ Posies.���

    X

    Stagione 3, episodio 10 “Campfire”

    X

    Questo secondo dipinto non è apparso nel mio set di dati, ma è del tutto possibile che mi sia sfuggito durante il tag.

    ×

    Il meglio di FiveThirtyEight, consegnato a voi.