Une analyse statistique de l’œuvre de Bob Ross

Bob Ross était un enseignant consommé. Il a guidé ses fans alors qu’il peignait des « arbres heureux », des « montagnes toutes-puissantes » et des « nuages duveteux » au cours de sa carrière télévisée de 11 ans dans son émission PBS, « The Joy of Painting ». Au total, Ross a peint 381 œuvres dans le cadre de l’émission, s’appuyant sur un ensemble distinct d’éléments, de scènes et de thèmes, et fournissant ainsi des milliers de points de données. J’ai décidé d’utiliser ces données pour enseigner quelque chose moi-même : les concepts statistiques importants de probabilité conditionnelle et de regroupement, ainsi qu’une leçon sur les limites des données.

Donc, on se lisse les cheveux et on se prépare à créer de joyeuses feuilles de calcul !

Ce que j’ai trouvé – grâce à l’analyse des données et à un entretien avec l’un des plus proches collaborateurs de Ross – c’est un ensemble d’œuvres définies par la cohérence et un idéal fondamentalement personnel. Ross est né à Daytona, en Floride, et a rejoint l’armée de l’air à 17 ans. Il a été affecté à Fairbanks et a passé les 20 années suivantes en Alaska. Le temps qu’il y a passé semble avoir eu un impact significatif sur ses sujets préférés, à savoir les arbres, les montagnes, les nuages, les lacs et la neige.

Peintures de Bob Ross présentées dans l'émission The Joy of Painting de PBS.

Peintures de Bob Ross présentées dans l’émission « The Joy of Painting » de PBS.

Le nom et les images de Bob Ross sont des marques de commerce de Bob Ross Inc. Tous droits réservés. Utilisé avec permission.

Sur les 403 épisodes de « The Joy of Painting » – dont la première diffusion s’est déroulée de 1983 à 1994 et qui continue d’être diffusée en rediffusion sur les stations PBS dans tout le pays – Ross a peint dans 381, et le reste a présenté un invité, le plus souvent son fils Steve Ross. Sur la base des images des peintures de Bob Ross disponibles dans la boutique Bob Ross Inc., j’ai codé tous les épisodes1 à l’aide de 67 mots-clés décrivant le contenu (arbres, eau, montagnes, éléments météorologiques et structures artificielles), les choix stylistiques dans l’encadrement des peintures et les artistes invités, pour un grand total de 3 224 étiquettes2

J’ai analysé les données pour découvrir exactement ce que Ross, décédé en 1995, a peint pendant plus d’une décennie à la télévision. Les résultats de haut niveau sont prévisibles – vous ne savez pas, il a peint un tas de montagnes, d’arbres et de lacs ! – mais j’ai ensuite mis des chiffres sur les figures de style classiques de Ross. Il n’a pas peint des chênes ou des épicéas, il a peint des « arbres heureux ». Il préférait les « montagnes toutes-puissantes » aux sommets. Une fois qu’il avait peint un arbre, il n’en peignait pas un autre – il peignait un « ami ».

Voici combien de fois chaque tag apparu plus de cinq fois est apparu au cours des 381 épisodes :

hickey-ross-tags (1)

Maintenant que nous connaissons les probabilités de base des tags individuels, nous pouvons également trouver les probabilités conjointes de certains de ces événements. Par exemple, à quelle fréquence un arbre à feuilles caduques et un arbre à conifères apparaissent-ils dans la même peinture ? Nous savons que 57 % des peintures contiennent un arbre à feuilles caduques et 53 % des peintures contiennent un arbre à conifères. Selon notre ensemble de données, 20 pour cent des peintures contiennent au moins un de chaque.

De plus, nous pouvons également trouver la probabilité que Ross ait peint quelque chose étant donné qu’il a peint autre chose, une statistique qui est appelée probabilité conditionnelle.

La probabilité conditionnelle peut être un peu délicate. Nous savons que 44 % des peintures de Ross contiennent des nuages, 9 % contiennent la plage et 7 % contiennent à la fois les nuages et la plage. Nous pouvons utiliser ces informations pour déterminer deux choses : la probabilité que Ross ait peint un nuage étant donné qu’il a peint une plage, et la probabilité qu’il ait peint une plage étant donné qu’il a peint un nuage. Vous divisez la probabilité conjointe – 7 % dans ce cas – par la probabilité du donné – 44 % ou 9 %, selon que vous voulez connaître la probabilité d’une plage étant donné un nuage ou d’un nuage étant donné une plage.

Le plus grand piège auquel les gens sont souvent confrontés est de supposer que les deux probabilités sont les mêmes. La probabilité que Ross ait peint un nuage étant donné qu’il a peint la plage – essentiellement, combien de peintures de plage ont des nuages – est (0,07)/(0,09), soit 78 %. La grande majorité des scènes de plage contiennent des nuages. Cependant, la probabilité que Ross ait peint une plage étant donné qu’il a peint un nuage – ou, combien de peintures de nuages contiennent une plage – est (0,07)/(0,44), soit 16 %. Donc la grande majorité des peintures de nuages n’ont pas de plages.

J’ai calculé la probabilité conditionnelle de chaque tag Bob Ross par rapport à tous les autres tags pour répondre aux questions pressantes suivantes.

Quelle est la probabilité, étant donné que Ross a peint un arbre heureux, qu’il ait ensuite peint un ami pour cet arbre ?

Il y a 93 % de chances que Ross peigne un deuxième arbre étant donné qu’il a peint un premier.

Quel est le pourcentage de tableaux de Bob Ross qui contiennent une montagne toute puissante ?

Environ 39 % mettent en évidence une montagne.

Quel est le pourcentage de ces tableaux qui contiennent plusieurs montagnes toutes puissantes ?

Ross était également disposé à peindre des amis pour les montagnes. Soixante pour cent des tableaux comportant une montagne en comportent au moins deux.

Dans quel pourcentage de ces tableaux une montagne est-elle recouverte de neige ?

Du fait que Ross a peint une montagne, il y a 66 % de chances qu’il y ait de la neige dessus.

Qu’en est-il des petites collines à pied ?

Des collines apparaissent dans 4 % des tableaux de Ross. Il préférait clairement les montagnes toutes-puissantes.

Que diriez-vous de joyeux petits nuages ?

Excellente question, car 44 pour cent des peintures de Ross mettent en évidence au moins un nuage. Étant donné qu’il y a un nuage peint, il y a 47 pour cent de chances qu’il s’agisse d’un cumulus distinct. Il n’y a que 14 % de chances qu’un nuage peint soit un cirrus distinct.

Qu’en est-il des charmantes petites cabanes ?

Environ 18 % de ses tableaux présentent une cabane. Étant donné que Ross a peint une cabane, il y a 35 % de chances qu’elle soit au bord d’un lac, et 40 % de chances qu’il y ait de la neige au sol. Alors que 72 pour cent des cabanes se trouvent dans le même tableau que des conifères, seulement 63 pour cent se trouvent près d’arbres à feuilles caduques.

Combien de fois a-t-il peint de l’eau ?

Tout le temps ! Environ 34 pour cent des peintures de Ross contiennent un lac, 33 pour cent contiennent une rivière ou un ruisseau, et 9 pour cent contiennent l’océan.

On dirait qu’il n’aimait pas la plage.

Bien au contraire. On peut voir la plage dans 75 % des peintures de bord de mer de Ross, mais le soleil dans seulement 31 % d’entre elles. S’il y a un océan, il est probablement agité : 97 pour cent des peintures d’océan ont des vagues. Les 36 peintures d’océan de Ross étaient également plus susceptibles de présenter des falaises, des nuages et des rochers que la peinture moyenne.

Que dire de Steve Ross ?

Steve semblait préférer les lacs bien plus que Bob. Alors que seulement 34 % des peintures de Bob comportent un lac, 91 % des peintures de Steve en comportent un.

Une lentille utile que nous pouvons appliquer à ce genre de données – où nous comparons des vecteurs d’information – est un outil de clustering. L’idée derrière le clustering est de déterminer à quel point certains groupes de données sont proches d’autres points dans l’ensemble de données. Les chercheurs utilisent l’analyse de clustering dans toutes sortes de domaines, de la biologie au marketing de consommation, pour segmenter une population de plantes ou de personnes, par exemple. Elle nous permet de trouver des sous-ensembles de données intéressants en fonction de la similarité ou de la différence entre certains sous-groupes et le reste de l’ensemble.

J’ai utilisé un algorithme pour diviser l’ensemble des 403 peintures de « The Joy of Painting » en clusters de peintures similaires. Je voulais savoir s’il était possible d’identifier les 10 peintures de base présentées dans la série PBS. Pour ce faire, j’ai effectué une analyse de clustering k-means des peintures.3 Les résultats étaient mitigés.

D’abord, examinons les clusters qui ont un sens intuitif. Les grands gagnants sont :

  • Un cluster de 50 peintures étiquetées « neige » et « hiver »
  • Un cluster de 28 peintures ayant chacune un cadre ovale d’espace blanc
  • Un cluster de 35 peintures de scènes océaniques.

Ce sont les types de regroupements clairs que nous espérions trouver. Chacun a un thème commun et tombe sous la bannière des images iconiques de Bob Ross. Il a peint environ une scène de plage et une image à cadre ovale par saison, et environ deux scènes avec de la neige au premier plan par saison. C’est logique.

Voici quelques regroupements qui sont également logiques, mais qui ne nous disent pas grand-chose sur le type de peinture préféré de Ross :

  • Un groupe de 13 peintures de l’animateur invité Steve Ross
  • Un groupe de 7 peintures contenant un pont
  • Un groupe de 11 peintures contenant des fleurs
  • Un groupe de 30 peintures contenant une clôture ou une grange
  • Un groupe de 33 peintures contenant une cascade.

Ces regroupements permettent d’identifier certaines balises qui n’apparaissent que dans quelques tableaux, mais ces regroupements ne sont pas suprêmement utiles pour définir ce que Ross a peint. Par exemple, les fleurs étaient très rarement le point central d’une peinture, et nous savions déjà combien de fois Steve Ross apparaissait dans l’émission.

Les deux derniers groupes étaient les plus larges :

  • Un groupe de 95 peintures qui avaient des arbres et au moins une montagne
  • Un groupe de 103 peintures qui avaient des arbres mais pas de montagnes.

Pas suprêmement utile, mais tout de même assez intéressant. L’analyse de regroupement est un outil attrayant pour ce type de données, mais elle n’a guère toutes les réponses.

Pour en savoir plus sur Ross et son œuvre au-delà de ce que je savais déjà grâce aux données, j’ai appelé Annette Kowalski, qui a fondé Bob Ross Inc. avec le peintre et reste l’intendante de son œuvre4. Elle a confirmé quelque chose que j’avais découvert en examinant des centaines de paysages de Ross : son travail n’est pas défini par ce qui est inclus dans ses peintures, mais par ce qui est exclu.

« Je peux penser à deux fois où il a peint des gens », a déclaré Kowalski. « Il y avait un homme près d’un feu de camp,5 et deux personnes marchant dans les bois. « 6 En effet, nos données montrent que Ross n’a peint une personne – en silhouette contre un arbre près d’un feu de camp – qu’une seule fois.

L'une des rares peintures de Bob Ross dans The Joy of Painting de PBS qui présentait une personne.

L’une des rares peintures de Bob Ross dans l’émission « The Joy of Painting » de PBS qui mettait en scène une personne.

Le nom et les images de Bob Ross sont des marques de commerce de Bob Ross Inc. Tous droits réservés. Utilisé avec permission.

Lorsque l’on analyse les structures qu’il a peintes, il apparaît que Ross a préféré le simple à l’élaboré. Il a peint 69 cabanes, 25 clôtures dans divers états de délabrement et 17 granges. Les structures artificielles plus complexes sont remarquablement rares dans son œuvre. Les ponts n’apparaissent que sept fois. Les bateaux et les moulins, deux fois chacun. Ross a peint un quai, un phare et un moulin à vent au cours de ses 381 épisodes.

Il y a quelque chose dans les structures peintes par Ross qui est passé presque entièrement inaperçu par les fans, selon Kowalski.

« Je vais vous dire le plus grand secret de Bob. Si vous remarquez, ses cabanes n’ont jamais eu de cheminées », a-t-elle déclaré. « C’est parce que les cheminées représentaient des personnes, et il ne voulait aucun signe de personne dans ses peintures ». Vérifiez les cabanes. Elles n’ont pas de cheminées. »

Elle a immédiatement ajouté, « Je suis sûre que vous allez m’appeler demain et dire que vous avez trouvé une cheminée. » Et je l’ai fait ! Mais il a fallu beaucoup de chasse. Dans l’épisode 1 de la saison 7, « Winter Cabin », il y a une cheminée sur la cabane (illustrée ci-dessus à la troisième rangée, colonne centrale). Mais le fait qu’une cheminée apparaisse une fois sur 381 tableaux ne diminue pas vraiment le point de vue de Kowalski.

En fin de compte, « Les joies de la peinture » n’a jamais vraiment porté sur la peinture. Même Kowalski, qui dirige une entreprise qui vend des fournitures de peinture de la marque Bob Ross, croit que la plupart des téléspectateurs ne sont pas là pour l’art.

« La majorité des gens qui regardent Bob Ross n’ont aucun intérêt pour la peinture », dit-elle. « C’est surtout sa voix apaisante. »

X

Sur les 403 épisodes totaux, je n’ai pas pu voir l’œuvre achevée de trois peintures : saison 9 épisode 10, « Charme champêtre » ; saison 15 épisode 4, « Reflets paisibles » et saison 26 épisode 10, « Chaîne de montagnes violettes. »

X

Sur les 403 épisodes totaux, je n’ai pas pu voir le travail achevé de trois tableaux : l’épisode 10 de la saison 9, « Charme champêtre » ; l’épisode 4 de la saison 15, « Reflets paisibles » et l’épisode 10 de la saison 26, « Chaîne de montagnes violettes ». »

X

Cet ensemble de données reste un travail en cours – c’est le premier du genre – et il y a bien sûr le potentiel d’omissions. Il faudrait un peu plus de huit jours d’affilée pour regarder l’intégralité de « The Joy Of Painting », c’est donc une tâche qui ne convient pas à une seule personne. Mais je suis convaincu que les données telles qu’elles sont décrivent le travail au cours de la carrière de Ross avec précision et cohérence.

X

Sur les 403 épisodes totaux, je n’ai pas pu voir le travail achevé de trois peintures : l’épisode 10 de la saison 9, « Charme champêtre » ; l’épisode 4 de la saison 15, « Reflets paisibles » et l’épisode 10 de la saison 26, « Chaîne de montagnes violettes. »

X

Cet ensemble de données reste un travail en cours – c’est le premier du genre – et il y a bien sûr le potentiel d’omissions. Il faudrait un peu plus de huit jours d’affilée pour regarder l’intégralité de « The Joy Of Painting », c’est donc une tâche qui ne convient pas à une seule personne. Mais je suis confiant que les données telles qu’elles sont décrivent le travail au cours de la carrière de Ross avec précision et cohérence.

X

L’algorithme k-means est ce que nous appelons non déterministe. Cela signifie que vous obtiendrez un résultat légèrement différent à chaque fois, en raison du caractère aléatoire que l’algorithme prend en compte pour déterminer les points qui définissent les centres des clusters.

X

Sur les 403 épisodes totaux, je n’ai pas pu voir l’œuvre achevée de trois tableaux : l’épisode 10 de la saison 9, « Charme champêtre » ; l’épisode 4 de la saison 15, « Reflets paisibles » et l’épisode 10 de la saison 26, « Chaîne de montagnes violettes. »

X

Cet ensemble de données reste un travail en cours – c’est le premier du genre – et il y a bien sûr le potentiel d’omissions. Il faudrait un peu plus de huit jours d’affilée pour regarder l’intégralité de « The Joy Of Painting », c’est donc une tâche qui ne convient pas à une seule personne. Mais je suis confiant que les données telles qu’elles sont décrivent le travail au cours de la carrière de Ross avec précision et cohérence.

X

L’algorithme k-means est ce que nous appelons non déterministe. Cela signifie que vous obtiendrez un résultat légèrement différent à chaque fois, en raison du caractère aléatoire que l’algorithme prend en compte lors de la détermination des points qui définissent les centres des clusters.

X

Kowalski était également un artiste invité pour l’épisode 10 de la saison 29, « Pot o’ Posies ».���

X

Sur les 403 épisodes totaux, je n’ai pas pu voir l’œuvre achevée de trois tableaux : l’épisode 10 de la saison 9,  » Charme champêtre  » ; l’épisode 4 de la saison 15,  » Reflets paisibles  » et l’épisode 10 de la saison 26,  » Chaîne de montagnes pourpres. »

X

Cet ensemble de données reste un travail en cours – c’est le premier du genre – et il y a bien sûr le potentiel d’omissions. Il faudrait un peu plus de huit jours d’affilée pour regarder l’intégralité de « The Joy Of Painting », c’est donc une tâche qui ne convient pas à une seule personne. Mais je suis confiant que les données telles qu’elles sont décrivent le travail au cours de la carrière de Ross avec précision et cohérence.

X

L’algorithme k-means est ce que nous appelons non déterministe. Cela signifie que vous obtiendrez un résultat légèrement différent à chaque fois, en raison du caractère aléatoire que l’algorithme prend en compte lorsqu’il détermine les points qui définissent les centres des clusters.

X

Kowalski était également un artiste invité pour l’épisode 10 de la saison 29,  » Pot o’ Posies « .����

X

Saison 3, épisode 10 « Feu de camp »

X

Sur les 403 épisodes totaux, je n’ai pas pu voir l’œuvre achevée de trois tableaux : saison 9 épisode 10, « Charme champêtre » ; saison 15 épisode 4, « Reflets paisibles » et saison 26 épisode 10, « Chaîne de montagnes violettes. »

X

Cet ensemble de données reste un travail en cours – c’est le premier du genre – et il y a bien sûr le potentiel d’omissions. Il faudrait un peu plus de huit jours d’affilée pour regarder l’intégralité de « The Joy Of Painting », c’est donc une tâche qui ne convient pas à une seule personne. Mais je suis confiant que les données telles qu’elles sont décrivent le travail au cours de la carrière de Ross avec précision et cohérence.

X

L’algorithme k-means est ce que nous appelons non déterministe. Cela signifie que vous obtiendrez un résultat légèrement différent à chaque fois, en raison du caractère aléatoire que l’algorithme prend en compte lorsqu’il détermine les points qui définissent les centres des clusters.

X

Kowalski était également un artiste invité pour l’épisode 10 de la saison 29,  » Pot o’ Posies « .����

X

Saison 3, épisode 10 « Campfire »

X

Cette deuxième peinture n’est pas apparue dans mon ensemble de données, mais il est tout à fait possible que je l’ai manquée lors du marquage.

×

Le meilleur de FiveThirtyEight, livré à vous.