A Statistical Analysis of the Work of Bob Ross

Bob Ross foi um professor consumado. Ele guiou os fãs enquanto pintava “árvores felizes”, “montanhas omnipotentes” e “nuvens fofas” ao longo dos seus 11 anos de carreira televisiva no seu programa da PBS, “A Alegria da Pintura”. No total, Ross pintou 381 obras no programa, contando com um conjunto distinto de elementos, cenas e temas, e assim fornecendo milhares de pontos de dados. Decidi usar esses dados para ensinar algo eu mesmo: os importantes conceitos estatísticos de probabilidade condicional e agrupamento, assim como uma lição sobre as limitações dos dados.

Então vamos pentear o cabelo e nos preparar para criar algumas planilhas felizes!

O que encontrei – através da análise dos dados e de uma entrevista com um dos colaboradores mais próximos do Ross – foi um corpo de trabalho que foi definido pela consistência e um ideal fundamentalmente pessoal. Ross nasceu em Daytona, Fla., e entrou para a Força Aérea aos 17 anos. Esteve estacionado em Fairbanks e passou os 20 anos seguintes no Alasca. Seu tempo lá parece ter tido um impacto significativo em seus temas preferidos de árvores, montanhas, nuvens, lagos e neve.

Paintings by Bob Ross featured on PBS's The Joy of Painting.

Paintings by Bob Ross featured on PBS’s “The Joy of Painting”.”

O nome e as imagens de Bob Ross são marcas registradas de Bob Ross Inc. Todos os direitos reservados. Usado com permissão.

Dos 403 episódios de “The Joy of Painting” – cuja primeira série foi de 1983 a 1994 e que continua a ser exibido em repetições em estações da PBS em todo o país – Ross pintou em 381, e o resto apresentou um convidado, mais frequentemente o seu filho Steve Ross. Baseado em imagens das pinturas de Bob Ross disponíveis na loja Bob Ross Inc., codifiquei todos os episódios1 usando 67 palavras-chave descrevendo conteúdo (árvores, água, montanhas, elementos climáticos e estruturas feitas pelo homem), escolhas estilísticas ao enquadrar as pinturas, e artistas convidados, para um total de 3.224 tags.2

Analizei os dados para descobrir exatamente o que Ross, que morreu em 1995, pintou por mais de uma década na TV. Os resultados de primeira linha são de se esperar – você não sabe, ele pintou um monte de montanhas, árvores e lagos! – mas depois coloquei alguns números nas clássicas figuras de linguagem do Ross. Ele não pintou carvalhos ou abetos, ele pintou “árvores felizes”. Ele preferia “montanhas todo-poderosas” a picos. Depois de pintar uma árvore, ele não pintou outra – ele pintou um “amigo”

Aqui está a frequência com que cada tag que apareceu mais de cinco vezes apareceu nos 381 episódios:

hickey-ross-tags (1)

Agora que sabemos as probabilidades básicas de tags individuais, também podemos encontrar as probabilidades conjuntas de alguns destes eventos. Por exemplo, com que frequência uma árvore caduca e uma árvore conífera aparecem na mesma pintura? Sabemos que 57% dos quadros contêm uma árvore decídua e 53% dos quadros contêm uma árvore conífera. De acordo com nosso conjunto de dados, 20% das pinturas contêm pelo menos uma de cada.

O que é mais, também podemos encontrar a probabilidade de Ross ter pintado algo dado que ele pintou outra coisa, uma estatística que é chamada probabilidade condicional.

Probabilidade condicional pode ser um pouco complicado. Sabemos que 44% das pinturas de Ross contêm nuvens, 9% contêm a praia e 7% contêm tanto as nuvens como a praia. Podemos usar esta informação para descobrir duas coisas: a probabilidade de Ross ter pintado uma nuvem dado que ele pintou uma praia, e a probabilidade de ele ter pintado uma praia dado que ele pintou uma nuvem. Você divide a probabilidade conjunta – 7% neste caso – pela probabilidade do dado – 44% ou 9%, dependendo se você quer saber a probabilidade de uma praia dada uma nuvem ou uma nuvem dada uma praia.

A maior armadilha que as pessoas muitas vezes enfrentam é assumir que as duas probabilidades são as mesmas. A probabilidade de Ross ter pintado uma nuvem dado que ele pintou a praia – essencialmente, quantas pinturas de praia têm nuvens – é (0.07)/(0.09), que é de 78 por cento. A grande maioria das cenas de praia contém nuvens. No entanto, a probabilidade de Ross ter pintado uma praia dado que ele pintou uma nuvem – ou, quantas pinturas de nuvens contêm uma praia – é (0.07)/(0.44), ou 16 por cento. Então a grande maioria das pinturas de nuvens não tem praias.

Eu descobri a probabilidade condicional de cada tag Bob Ross contra cada outra tag para responder às seguintes perguntas urgentes.

Qual é a probabilidade, dado que Ross pintou uma árvore feliz, de que ele então pintou um amigo para aquela árvore?

Há 93% de probabilidade de Ross pintar uma segunda árvore, dado que ele pintou uma primeira.

Que percentagem das pinturas de Bob Ross contém uma montanha todo-poderosa?

Sobre 39 por cento apresentam de forma proeminente uma montanha.

Que percentagem dessas pinturas contém várias montanhas todo-poderosas?

Ross também era favorável a pintar amigos para montanhas. Sessenta por cento das pinturas com uma montanha nelas têm pelo menos duas montanhas.

Em que percentagem dessas pinturas está uma montanha coberta de neve?

Posto que Ross pintou uma montanha, há 66 por cento de chance de haver neve nela.

E que tal colinas com pézinhos?

Montanhas aparecem em 4 por cento das pinturas de Ross. Ele claramente preferia montanhas poderosas.

Que tal nuvenzinhas felizes?

Pergunta excêntrica, já que 44% das pinturas de Ross apresentam pelo menos uma nuvem em destaque. Dado que há uma nuvem pintada, há 47% de chance de ser claramente cumulada. Há apenas 14% de chance de que uma nuvem pintada seja uma distintamente circular.

E que tal pequenas cabines encantadoras?

Sobre 18% de suas pinturas apresentam uma cabine. Dado que Ross pintou uma cabana, há 35% de chance de que esteja em um lago, e 40% de chance de que haja neve no chão. Enquanto 72% das cabanas estão na mesma pintura que as coníferas, apenas 63% estão perto de árvores decíduas.

Quantas vezes ele pintava água?

O tempo todo! Cerca de 34% das pinturas de Ross contêm um lago, 33% contêm um rio ou riacho, e 9% contêm o oceano.

Sons como se ele não gostasse da praia.

Muito pelo contrário. Você pode ver a praia em 75% das pinturas à beira-mar de Ross, mas o sol em apenas 31% delas. Se há um oceano, provavelmente é agitado: 97% das pinturas oceânicas têm ondas. As 36 pinturas oceânicas de Ross também tinham mais probabilidade de apresentar penhascos, nuvens e rochas do que a pintura média.

E quanto a Steve Ross?

Steve parecia preferir muito mais os lagos do que Bob. Enquanto apenas 34% das pinturas do Bob têm um lago, 91% das pinturas do Steve têm.

Uma lente útil que podemos aplicar a este tipo de dados – onde estamos a comparar vectores de informação – é uma ferramenta de agrupamento. A idéia por trás do agrupamento é determinar o quão próximos certos grupos de dados estão de outros pontos do conjunto de dados. Os pesquisadores utilizam a análise de clustering em todos os tipos de áreas – desde biologia até marketing de consumo – como uma forma de segmentar uma população de, digamos, plantas ou pessoas. Isto permite-nos encontrar subconjuntos interessantes de dados baseados em quão semelhantes ou diferentes certos subgrupos são do resto do conjunto.

Utilizei um algoritmo para dividir o conjunto inteiro de 403 pinturas de “A Alegria da Pintura” em conjuntos de pinturas semelhantes. Eu queria saber se era possível identificar as 10 pinturas básicas apresentadas na série PBS. Para fazer isso, eu fiz uma análise de agrupamento de k significa k das pinturas.3 Os resultados foram mistos.

Primeiro, vamos olhar para os agrupamentos que fazem sentido intuitivo. Os vencedores claros são:

  • Um aglomerado de 50 pinturas marcadas como “neve” e “inverno”
  • Um aglomerado de 28 pinturas cada uma com uma moldura oval de espaço branco
  • Um aglomerado de 35 pinturas de cenas oceânicas.

Estes foram os tipos de aglomerados claros que esperávamos encontrar. Cada um deles tem um tema comum e cai sob a bandeira das imagens icônicas de Bob Ross. Ele pintou sobre uma cena de praia e uma imagem oval por estação, e sobre duas cenas com neve em primeiro plano por estação. Faz sentido.

Aqui estão alguns aglomerados que também fazem sentido, mas não nos fale muito sobre o tipo de pintura preferido do Ross:

  • Um cacho de 13 pinturas do anfitrião convidado Steve Ross
  • Um cacho de 7 pinturas contendo uma ponte
  • Um cacho de 11 pinturas contendo flores
  • Um cacho de 30 pinturas contendo uma cerca ou um celeiro
  • Um cacho de 33 pinturas contendo uma cascata.

Estes cachos identificam algumas etiquetas que aparecem em apenas algumas pinturas, mas os agrupamentos não são extremamente úteis na definição do que Ross pintou. Por exemplo, flores eram muito raramente o foco principal de uma pintura, e já sabíamos quantas vezes Steve Ross apareceu no programa.

Os dois grupos finais eram os mais largos:

  • Um grupo de 95 pinturas que tinha árvores e pelo menos uma montanha
  • Um grupo de 103 pinturas que tinha árvores mas sem montanhas.

Não foi de grande ajuda, mas ainda assim bastante interessante. A análise do agrupamento é uma ferramenta atraente para este tipo de dados, mas dificilmente tem todas as respostas.

Para saber mais sobre Ross e seu trabalho além do que eu já sabia pelos dados, chamei Annette Kowalski, que fundou Bob Ross Inc. com o pintor e continua sendo a mordomo de seu trabalho.4 Ela confirmou algo que eu descobri na minha revisão de centenas de paisagens de Ross: Seu trabalho não é definido pelo que está incluído em suas pinturas, mas pelo que está excluído.

“Eu posso pensar em duas vezes ele pintou pessoas”, disse Kowalski. “Havia um homem perto de uma fogueira,5 e duas pessoas caminhando pela floresta “6 De fato, nossos dados mostram que Ross só pintou uma pessoa – em silhueta contra uma árvore perto de uma fogueira – uma vez.

Uma das poucas pinturas de Bob Ross em A Alegria da Pintura da PBS que apresentava uma pessoa.

Uma das poucas pinturas de Bob Ross em “The Joy of Painting” da PBS que apresentava uma pessoa.

O nome e imagens de Bob Ross são marcas registradas da Bob Ross Inc. Todos os direitos reservados. Usado com permissão.

Quando analisamos as estruturas que ele pintou, parece que Ross preferiu a simples à elaborada. Ele pintou 69 cabines, 25 cercas em vários estados de degradação e 17 galpões. Estruturas mais complexas, feitas pelo homem, são notavelmente raras em seu trabalho. As pontes aparecem apenas sete vezes. Barcos e moinhos, duas vezes cada um. Ross pintou uma doca, um farol e um moinho sobre os seus 381 episódios.

Há algo nas estruturas que Ross pintou que passou quase totalmente despercebido pelos fãs, segundo Kowalski.

“Vou contar-te o maior segredo do Bob. Se você notar, as cabines dele nunca tiveram chaminés nelas”, disse ela. “Isso porque as chaminés representavam pessoas, e ele não queria nenhum sinal de uma pessoa em suas pinturas”. Verifique as cabines. Eles não têm chaminés.”

Ela acrescentou imediatamente: “Tenho a certeza que me vai ligar amanhã e dizer que encontrou uma chaminé.” E eu encontrei! Mas foi preciso muita caça. No episódio 1 da temporada 7, “Winter Cabin”, há uma chaminé na cabana (apresentada acima na terceira fila, coluna central). Mas o facto de uma chaminé aparecer uma vez em 381 pinturas não diminui o ponto de vista de Kowalski.

No fundo, “The Joy of Painting” nunca foi realmente sobre pintura. Mesmo Kowalski, que dirige uma empresa que vende materiais de pintura da marca Bob Ross-branded, acredita que a maioria dos telespectadores não estão interessados na arte.

“A maioria das pessoas que assistem Bob Ross não tem interesse em pintar”, disse ela. “A maioria é a sua voz calma.”

X

Do total de 403 episódios, não consegui ver o trabalho completo de três pinturas: estação 9 episódio 10, “Country Charm”; estação 15 episódio 4, “Peaceful Reflections” e estação 26 episódio 10, “Purple Mountain Range”.”

X

Do total de 403 episódios, não consegui ver a obra completa de três pinturas: estação 9 episódio 10, “Encanto do Campo”; estação 15 episódio 4, “Reflexões pacíficas” e estação 26 episódio 10, “Cordilheira Púrpura”.”

X

Este conjunto de dados continua a ser um trabalho em progresso – é o primeiro do seu género – e existe, naturalmente, o potencial para omissões. Levaria pouco mais de oito dias seguidos para assistir a todo o “A Alegria da Pintura”, por isso é uma tarefa mal adequada para uma pessoa. Mas estou confiante que os dados, tal como estão, descrevem o trabalho ao longo da carreira de Ross de forma precisa e consistente.

X

Do total de 403 episódios, não consegui ver o trabalho completo de três pinturas: temporada 9 episódio 10, “Country Charm”; temporada 15 episódio 4, “Peaceful Reflections” e temporada 26 episódio 10, “Purple Mountain Range”.”

X

Este conjunto de dados continua a ser um trabalho em progresso – é o primeiro do seu género – e existe, naturalmente, o potencial para omissões. Levaria pouco mais de oito dias seguidos para assistir a todo o “A Alegria da Pintura”, por isso é uma tarefa mal adequada para uma pessoa. Mas estou confiante que os dados, tal como estão, descrevem o trabalho ao longo da carreira de Ross de forma precisa e consistente.

X

O algoritmo k significa o que chamamos de não-determinista. Isto significa que você terá um resultado ligeiramente diferente a cada vez, por causa da aleatoriedade em que os fatores do algoritmo determinam os pontos que definem os centros dos clusters.

X

Do total de 403 episódios, não consegui ver o trabalho completo de três pinturas: temporada 9 episódio 10, “Country Charm”; temporada 15 episódio 4, “Peaceful Reflections” e temporada 26 episódio 10, “Purple Mountain Range”.”

X

Este conjunto de dados continua a ser um trabalho em progresso – é o primeiro do seu género – e existe, naturalmente, o potencial para omissões. Levaria pouco mais de oito dias seguidos para assistir a todo o “A Alegria da Pintura”, por isso é uma tarefa mal adaptada para uma pessoa. Mas estou confiante que os dados, tal como estão, descrevem o trabalho ao longo da carreira de Ross de forma precisa e consistente.

X

O algoritmo k significa o que chamamos de não-determinista. Isto significa que você terá um resultado ligeiramente diferente a cada vez, por causa da aleatoriedade dos fatores do algoritmo ao determinar os pontos que definem os centros dos clusters.

X

Kowalski também foi um artista convidado para a temporada 29 episódio 10, “Pot o’ Posies”.���

X

Do total de 403 episódios, não consegui ver o trabalho completo de três pinturas: temporada 9 episódio 10, “Country Charm”; temporada 15 episódio 4, “Peaceful Reflections” e temporada 26 episódio 10, “Purple Mountain Range”.”

X

Este conjunto de dados continua a ser um trabalho em progresso – é o primeiro do seu género – e existe, naturalmente, o potencial para omissões. Levaria pouco mais de oito dias seguidos para assistir a todo o “A Alegria da Pintura”, por isso é uma tarefa mal adaptada para uma pessoa. Mas estou confiante que os dados, tal como estão, descrevem o trabalho ao longo da carreira de Ross de forma precisa e consistente.

X

O algoritmo k significa o que chamamos de não-determinista. Isto significa que você terá um resultado ligeiramente diferente a cada vez, por causa da aleatoriedade dos fatores do algoritmo ao determinar os pontos que definem os centros dos clusters.

X

Kowalski também foi um artista convidado para a temporada 29 episódio 10, “Pot o’ Posies”.���

>

X

Temporada 3, episódio 10 “Campfire”

X

O total de 403 episódios, não consegui ver o trabalho completo de três pinturas: temporada 9 episódio 10, “Country Charm”; temporada 15 episódio 4, “Peaceful Reflections” e temporada 26 episódio 10, “Purple Mountain Range”.”

X

Este conjunto de dados continua a ser um trabalho em progresso – é o primeiro do seu género – e há, naturalmente, o potencial para omissões. Levaria pouco mais de oito dias seguidos para assistir a todo o “A Alegria da Pintura”, por isso é uma tarefa mal adequada para uma pessoa. Mas estou confiante que os dados, tal como estão, descrevem o trabalho ao longo da carreira de Ross de forma precisa e consistente.

X

O algoritmo k significa o que chamamos de não-determinista. Isto significa que você terá um resultado ligeiramente diferente a cada vez, por causa da aleatoriedade dos fatores do algoritmo ao determinar os pontos que definem os centros dos clusters.

X

Kowalski também foi um artista convidado para a temporada 29 episódio 10, “Pot o’ Posies”.���

X

Temporada 3, episódio 10 “Campfire”

X

Esta segunda pintura não apareceu no meu conjunto de dados, mas é inteiramente possível que eu tenha perdido ao etiquetar.

×

O melhor de FiveThirtyEight, entregue a você.