Un análisis estadístico de la obra de Bob Ross

Bob Ross era un maestro consumado. Guió a los aficionados mientras pintaba «árboles felices», «montañas todopoderosas» y «nubes esponjosas» a lo largo de sus 11 años de carrera televisiva en su programa de la PBS, «The Joy of Painting». En total, Ross pintó 381 obras en el programa, basándose en un conjunto distinto de elementos, escenas y temas, y proporcionando así miles de puntos de datos. Decidí utilizar esos datos para enseñar algo a mí mismo: los importantes conceptos estadísticos de la probabilidad condicional y la agrupación, así como una lección sobre las limitaciones de los datos.

Así que vamos a hacernos la permanente y a prepararnos para crear unas alegres hojas de cálculo.

Lo que encontré -a través del análisis de los datos y de una entrevista con uno de los colaboradores más cercanos de Ross- fue un cuerpo de trabajo que se definía por la coherencia y un ideal fundamentalmente personal. Ross nació en Daytona, Florida, y se alistó en las Fuerzas Aéreas a los 17 años. Fue destinado a Fairbanks y pasó los siguientes 20 años en Alaska. El tiempo que pasó allí parece haber tenido un impacto significativo en sus temas preferidos: árboles, montañas, nubes, lagos y nieve.

Pinturas de Bob Ross presentadas en el programa The Joy of Painting de la PBS.

Pinturas de Bob Ross presentadas en el programa «The Joy of Painting» de PBS.

El nombre y las imágenes de Bob Ross son marcas comerciales de Bob Ross Inc. Todos los derechos reservados. Utilizadas con permiso.

De los 403 episodios de «The Joy of Painting» -cuya primera edición fue de 1983 a 1994 y que sigue emitiéndose en reposiciones en las emisoras de PBS de todo el país- Ross pintó en 381, y en el resto participó un invitado, la mayoría de las veces su hijo Steve Ross. A partir de las imágenes de los cuadros de Bob Ross disponibles en la tienda de Bob Ross Inc., codifiqué todos los episodios1 utilizando 67 palabras clave que describían el contenido (árboles, agua, montañas, elementos meteorológicos y estructuras hechas por el hombre), las elecciones estilísticas en el encuadre de los cuadros y los artistas invitados, con un total de 3.224 etiquetas.2

Analicé los datos para averiguar exactamente qué pintó Ross, fallecido en 1995, durante más de una década en televisión. Los resultados de primera línea son de esperar -¡no se sabe si pintó un montón de montañas, árboles y lagos! – pero luego puse algunos números a las clásicas cifras de Ross. No pintó robles ni abetos, sino «árboles felices». Prefería «montañas todopoderosas» a picos. Una vez que pintaba un árbol, no pintaba otro: pintaba un «amigo».

Aquí está la frecuencia con la que cada etiqueta que aparecía más de cinco veces aparecía a lo largo de los 381 episodios:

hickey-ross-tags (1)

Ahora que conocemos las probabilidades básicas de las etiquetas individuales, también podemos encontrar las probabilidades conjuntas de algunos de estos eventos. Por ejemplo, ¿con qué frecuencia aparecen un árbol de hoja caduca y un árbol de coníferas en el mismo cuadro? Sabemos que el 57% de los cuadros contienen un árbol de hoja caduca y el 53% un árbol de coníferas. Según nuestro conjunto de datos, el 20 por ciento de los cuadros contienen al menos uno de cada uno.

Es más, también podemos encontrar la probabilidad de que Ross pintara algo dado que pintara otra cosa, una estadística que se llama probabilidad condicional.

La probabilidad condicional puede ser un poco complicada. Sabemos que el 44 por ciento de los cuadros de Ross contienen nubes, el 9 por ciento contienen la playa y el 7 por ciento contienen tanto las nubes como la playa. Podemos utilizar esta información para calcular dos cosas: la probabilidad de que Ross haya pintado una nube dado que haya pintado una playa, y la probabilidad de que haya pintado una playa dado que haya pintado una nube. Se divide la probabilidad conjunta -7 por ciento en este caso- por la probabilidad de lo dado -44 por ciento o 9 por ciento, dependiendo de si se quiere saber la probabilidad de una playa dada una nube o de una nube dada una playa.

El mayor error al que se enfrenta la gente a menudo es asumir que las dos probabilidades son iguales. La probabilidad de que Ross pintara una nube dado que pintó la playa -esencialmente, cuántos cuadros de playa tienen nubes- es (0,07)/(0,09), que es el 78%. La gran mayoría de las escenas de playa contienen nubes. Sin embargo, la probabilidad de que Ross pintara una playa dado que pintó una nube -o, cuántos cuadros con nubes contienen una playa- es (0,07)/(0,44), o el 16 por ciento. Así que la gran mayoría de los cuadros de nubes no tienen playas.

He calculado la probabilidad condicional de cada etiqueta de Bob Ross frente a cualquier otra etiqueta para responder a las siguientes preguntas apremiantes.

¿Cuál es la probabilidad, dado que Ross pintó un árbol feliz, de que luego pintara un amigo para ese árbol?

Hay un 93 por ciento de probabilidades de que Ross pinte un segundo árbol dado que ha pintado un primero.

¿Qué porcentaje de los cuadros de Bob Ross contienen una montaña todopoderosa?

Alrededor del 39 por ciento presentan de forma destacada una montaña.

¿Qué porcentaje de esos cuadros contienen varias montañas todopoderosas?

Ross también se prestaba a pintar amigos para las montañas. El sesenta por ciento de los cuadros con una montaña tienen al menos dos montañas.

¿En qué porcentaje de esos cuadros hay una montaña cubierta de nieve?

Dado que Ross pintó una montaña, hay un 66 por ciento de probabilidades de que haya nieve en ella.

¿Y qué pasa con las colinitas de pie?

Las colinas aparecen en el 4 por ciento de los cuadros de Ross. Está claro que prefería las montañas todopoderosas.

¿Qué hay de las nubes pequeñas y felices?

Excelente pregunta, ya que en el 44 por ciento de los cuadros de Ross aparece prominentemente al menos una nube. Dado que hay una nube pintada, hay un 47 por ciento de posibilidades de que sea un cúmulo claro. Sólo hay un 14 por ciento de posibilidades de que una nube pintada sea claramente un cirro.

¿Qué hay de las encantadoras cabañas?

Alrededor del 18 por ciento de sus cuadros presentan una cabaña. Dado que Ross pintó una cabaña, hay un 35 por ciento de posibilidades de que esté en un lago, y un 40 por ciento de posibilidades de que haya nieve en el suelo. Mientras que el 72 por ciento de las cabañas están en el mismo cuadro que las coníferas, sólo el 63 por ciento están cerca de árboles de hoja caduca.

¿Cuántas veces pintó agua?

¡Todo el tiempo! Alrededor del 34 por ciento de las pinturas de Ross contienen un lago, el 33 por ciento contienen un río o arroyo, y el 9 por ciento contienen el océano.

Suena como si no le gustara la playa.

Muy por el contrario. Se puede ver la playa en el 75 por ciento de los cuadros costeros de Ross, pero el sol sólo en el 31 por ciento de ellos. Si hay un océano, probablemente esté agitado: el 97 por ciento de las pinturas oceánicas tienen olas. Los 36 cuadros oceánicos de Ross también tenían más probabilidades de presentar acantilados, nubes y rocas que la media de los cuadros.

¿Y qué hay de Steve Ross?

Steve parecía preferir los lagos mucho más que Bob. Mientras que sólo el 34 por ciento de los cuadros de Bob tienen un lago, el 91 por ciento de los cuadros de Steve lo tienen.

Una lente útil que podemos aplicar a este tipo de datos -en los que comparamos vectores de información- es una herramienta de agrupación. La idea que subyace a la agrupación es determinar lo cerca que están ciertos grupos de datos de otros puntos del conjunto de datos. Los investigadores utilizan el análisis de conglomerados en todo tipo de áreas -desde la biología hasta el marketing de consumo- como forma de segmentar una población de, por ejemplo, plantas o personas. Nos permite encontrar subconjuntos interesantes de datos basándonos en lo similares o diferentes que son ciertos subgrupos del resto del conjunto.

Utilicé un algoritmo para dividir todo el conjunto de 403 cuadros de «The Joy of Painting» en grupos de cuadros similares. Quería saber si era posible identificar los 10 cuadros básicos que aparecen en la serie de PBS. Para ello, realicé un análisis de agrupación de k-means de los cuadros.3 Los resultados fueron variados.

En primer lugar, veamos los grupos que tienen un sentido intuitivo. Los ganadores claros son:

  • Un grupo de 50 cuadros etiquetados como «nieve» e «invierno»
  • Un grupo de 28 cuadros, cada uno con un marco ovalado de espacio blanco
  • Un grupo de 35 cuadros de escenas oceánicas.

Estos eran los tipos de agrupaciones claras que esperábamos encontrar. Cada uno tiene un tema común y cae bajo la bandera de las imágenes icónicas de Bob Ross. Pintó alrededor de una escena de playa y una imagen con marco ovalado por temporada, y alrededor de dos escenas con nieve en primer plano por temporada. Tiene sentido.

Aquí hay algunos grupos que también tienen sentido, pero no nos dicen mucho sobre el tipo de pintura favorita de Ross:

  • Un grupo de 13 cuadros del presentador invitado Steve Ross
  • Un grupo de 7 cuadros que contienen un puente
  • Un grupo de 11 cuadros que contienen flores
  • Un grupo de 30 cuadros que contienen una valla o un granero
  • Un grupo de 33 cuadros que contienen una cascada.

Estos grupos identifican algunas etiquetas que aparecen sólo en unos pocos cuadros, pero las agrupaciones no son sumamente útiles para definir lo que Ross pintó. Por ejemplo, las flores rara vez eran el foco principal de un cuadro, y ya sabíamos cuántas veces aparecía Steve Ross en el programa.

Los dos últimos grupos eran los más amplios:

  • Un grupo de 95 cuadros que tenían árboles y al menos una montaña
  • Un grupo de 103 cuadros que tenían árboles pero no montañas.

No es extremadamente útil, pero sigue siendo bastante interesante. El análisis de conglomerados es una herramienta atractiva para este tipo de datos, pero difícilmente tiene todas las respuestas.

Para saber más sobre Ross y su obra más allá de lo que ya sabía por los datos, llamé a Annette Kowalski, que fundó Bob Ross Inc. con el pintor y sigue siendo la administradora de su obra.4 Me confirmó algo que había descubierto en mi revisión de cientos de paisajes de Ross: su obra no se define por lo que se incluye en sus cuadros, sino por lo que se excluye.

«Puedo pensar en dos ocasiones en las que pintó personas», dijo Kowalski. «Había un hombre junto a una hoguera,5 y dos personas caminando por el bosque».6 De hecho, nuestros datos muestran que Ross sólo pintó una vez a una persona -en silueta contra un árbol cerca de una hoguera-.

Uno de los pocos cuadros de Bob Ross en The Joy of Painting de la PBS en el que aparecía una persona.

Una de las pocas pinturas de Bob Ross en «The Joy of Painting» de PBS en la que aparecía una persona.

El nombre y las imágenes de Bob Ross son marcas comerciales de Bob Ross Inc. Todos los derechos reservados. Utilizadas con permiso.

Cuando analizamos las estructuras que pintó, parece que Ross prefería lo sencillo a lo elaborado. Pintó 69 cabañas, 25 vallas en diversos estados de deterioro y 17 graneros. Las estructuras artificiales más complejas son notablemente escasas en su obra. Los puentes aparecen sólo siete veces. Los barcos y los molinos, dos veces cada uno. Ross pintó un muelle, un faro y un molino de viento a lo largo de sus 381 episodios.

Hay algo en las estructuras que Ross pintó que ha pasado casi totalmente desapercibido para los aficionados, según Kowalski.

«Te diré el mayor secreto de Bob. Si te fijas, sus cabañas nunca tenían chimeneas», dijo. «Eso es porque las chimeneas representaban a las personas, y él no quería ninguna señal de una persona en sus cuadros. Comprueba las cabañas. No tienen chimeneas».

Inmediatamente añadió: «Seguro que mañana me llamas para decirme que has encontrado una chimenea». ¡Y lo hice! Pero me costó mucho cazar. En el episodio 1 de la temporada 7, «Cabaña de invierno», hay una chimenea en la cabaña (que aparece arriba en la tercera fila, columna central). Pero el hecho de que una chimenea aparezca una vez en 381 cuadros no disminuye realmente el punto de Kowalski.

A la hora de la verdad, «La alegría de pintar» nunca fue realmente sobre la pintura. Incluso Kowalski, que dirige una empresa que vende artículos de pintura de la marca Bob Ross, cree que la mayoría de los espectadores no lo hacen por el arte.

«La mayoría de las personas que ven a Bob Ross no tienen interés en la pintura», dijo. «Sobre todo es por su voz tranquilizadora».

X

De los 403 episodios totales, no pude ver el trabajo terminado de tres cuadros: el episodio 10 de la temporada 9, «Country Charm»; el episodio 4 de la temporada 15, «Peaceful Reflections» y el episodio 10 de la temporada 26, «Purple Mountain Range.»

X

De los 403 episodios totales, no pude ver la obra terminada de tres cuadros: temporada 9 episodio 10, «Country Charm»; temporada 15 episodio 4, «Peaceful Reflections» y temporada 26 episodio 10, «Purple Mountain Range.»

X

Este conjunto de datos sigue siendo un trabajo en curso -es el primero de este tipo- y, por supuesto, existe la posibilidad de que haya omisiones. Se necesitarían más de ocho días seguidos para ver todo «The Joy Of Painting», así que es una tarea inadecuada para una sola persona. Pero confío en que los datos, tal y como están, describen el trabajo a lo largo de la carrera de Ross de forma precisa y coherente.

X

De los 403 episodios totales, no pude ver el trabajo terminado de tres pinturas: el episodio 10 de la temporada 9, «Country Charm»; el episodio 4 de la temporada 15, «Peaceful Reflections» y el episodio 10 de la temporada 26, «Purple Mountain Range.»

X

Este conjunto de datos sigue siendo un trabajo en curso -es el primero de este tipo- y, por supuesto, existe la posibilidad de que haya omisiones. Se necesitarían más de ocho días seguidos para ver todo «The Joy Of Painting», así que es una tarea inadecuada para una sola persona. Pero estoy seguro de que los datos, tal como están, describen el trabajo a lo largo de la carrera de Ross con precisión y consistencia.

X

El algoritmo k-means es lo que llamamos no determinista. Esto significa que obtendrá un resultado ligeramente diferente cada vez, debido a la aleatoriedad que el algoritmo tiene en cuenta a la hora de determinar los puntos que definen los centros de los clusters.

X

De los 403 episodios totales, no pude ver el trabajo terminado de tres cuadros: el episodio 10 de la temporada 9, «Country Charm»; el episodio 4 de la temporada 15, «Peaceful Reflections» y el episodio 10 de la temporada 26, «Purple Mountain Range.»

X

Este conjunto de datos sigue siendo un trabajo en curso -es el primero de este tipo- y, por supuesto, existe la posibilidad de que haya omisiones. Se necesitarían más de ocho días seguidos para ver todo «The Joy Of Painting», así que es una tarea inadecuada para una sola persona. Pero estoy seguro de que los datos, tal como están, describen el trabajo a lo largo de la carrera de Ross con precisión y consistencia.

X

El algoritmo k-means es lo que llamamos no determinista. Esto significa que obtendrá un resultado ligeramente diferente cada vez, debido a la aleatoriedad que el algoritmo tiene en cuenta a la hora de determinar los puntos que definen los centros de los grupos.

X

Kowalski también fue artista invitado en el episodio 10 de la temporada 29, «Pot o’ Posies».���

X

De los 403 episodios totales, no pude ver el trabajo terminado de tres cuadros: el episodio 10 de la temporada 9, «Country Charm»; el episodio 4 de la temporada 15, «Peaceful Reflections» y el episodio 10 de la temporada 26, «Purple Mountain Range.»

X

Este conjunto de datos sigue siendo un trabajo en curso -es el primero de este tipo- y, por supuesto, existe la posibilidad de que haya omisiones. Se necesitarían más de ocho días seguidos para ver todo «The Joy Of Painting», por lo que es una tarea inadecuada para una sola persona. Pero confío en que los datos, tal y como están, describen el trabajo a lo largo de la carrera de Ross con precisión y consistencia.

X

El algoritmo k-means es lo que llamamos no determinista. Esto significa que obtendrá un resultado ligeramente diferente cada vez, debido a la aleatoriedad que el algoritmo tiene en cuenta a la hora de determinar los puntos que definen los centros de los clusters.

X

Kowalski también fue artista invitado en el episodio 10 de la temporada 29, «Pot o’ Posies».���

X

Temporada 3, episodio 10 «Campfire»

X

De los 403 episodios totales, no pude ver el trabajo terminado de tres cuadros: el episodio 10 de la temporada 9, «Country Charm»; el episodio 4 de la temporada 15, «Peaceful Reflections» y el episodio 10 de la temporada 26, «Purple Mountain Range.»

X

Este conjunto de datos sigue siendo un trabajo en curso -es el primero de este tipo- y, por supuesto, existe la posibilidad de que haya omisiones. Se necesitarían más de ocho días seguidos para ver todo «The Joy Of Painting», así que es una tarea inadecuada para una sola persona. Pero estoy seguro de que los datos, tal como están, describen el trabajo a lo largo de la carrera de Ross con precisión y consistencia.

X

El algoritmo k-means es lo que llamamos no determinista. Esto significa que obtendrá un resultado ligeramente diferente cada vez, debido a la aleatoriedad que el algoritmo tiene en cuenta a la hora de determinar los puntos que definen los centros de los clusters.

X

Kowalski también fue artista invitado en el episodio 10 de la temporada 29, «Pot o’ Posies».���

X

Temporada 3, episodio 10 «Campfire»

X

Este segundo cuadro no apareció en mi conjunto de datos, pero es muy posible que se me haya pasado al etiquetar.

×

Lo mejor de FiveThirtyEight, entregado a usted.