Dans son article L’art de grimper à l’échelle, (How to Climb A Ladder), Josh Kaufman, auteur du personal MBA et de « The first 20 hours : How to Learn Anything… Fast! » faisait une analogie entre le fait de monter en compétences et l’art de grimper à l’échelle. Dans l’article Explore / Exploit paru quelques jours plus tard, il aborde la question de savoir quelle échelle monter. Il fait une nouvelle analogie, cette fois avec les machines à sous, les bandits manchots.
Pour construire des compétences à partir de zéro, vous devez savoir comment grimper à une échelle.
Mais comment savoir quelle échelle monter ?
Il y a des millions de compétences que vous pourriez acquérir, et des milliards de variations subtiles. Quel ensemble de ces compétences et variations constitue le chemin optimal pour obtenir ce que vous voulez ? Comment déterminer les choses à l’avance, avant d’investir dans leur apprentissage?
Et si « obtenir ce que vous voulez » change au fil du temps, que fait-on ?
Sauf une certaine forme d’omniscience, y a-t-il une meilleure stratégie que de choisir au hasard et prier pour que le meilleur advienne ? … Oui, il y a une meilleure stratégie.
Le problème du bandit manchot
Déterminer quelles compétences vous donnera les meilleurs résultats est très similaire à un problème vénérable et important dans la théorie des probabilités : le problème du bandit manchot.
Voici une version courte du problème : imaginez marcher dans un casino et de décider de jouer aux machines à sous.
Il y a une rangée de machines, dont chacune a une probabilité différente de vous accorder une récompense lorsque vous tirez le levier. Certaines machines donnent plus – certaines beaucoup plus – que les autres machines, mais vous n’êtes pas sûr de la machine qui assurera le plus haut rendement.
Si vous saviez à l’avance quelle est la meilleure machine, vous vous contenteriez simplement de tirer ce levier tout au long de la journée.
Mais là vous n’avez pas la moindre idée, et personne ne va vous éclairer.
La seule façon de le savoir est donc de commencer à tirer des leviers, d’y apporter une attention particulière, de garder trace de ce qui fonctionne et ce qui ne fonctionne pas, et de faire le calcul.
Il y a un compromis à faire, cependant.
Lorsque vous choisissez de tirer un levier que vous n’avez pas tiré avant, vous obtenez de nouvelles informations sur cette option, et l’information est précieuse dans la recherche de la meilleure machine globale. Mais tirer le levier le moins testé a un coût d’opportunité: vous n’êtes pas en train de tirer le levier que vous pensez actuellement vous assurera le meilleur rendement. Il y a un risque que le levier que vous tirez vous rapportera moins que ce que vous auriez obtenu en tirant le levier optimal actuel, et c’est un coût très réel.
L’information est précieuse, mais elle a un prix – l’expérimentation est parfois une forme de mauvais investissements. Cette réflexion est la clé pour résoudre le problème de bandit.
Exploration et exploitation
Sans trop entrer dans les mathématiques, la solution au problème de bandit manchot est facile à comprendre. La stratégie optimale est de commencer avec une période d’exploration, où vous tirez les leviers au hasard et vous recueillez des informations.
Lorsque vous avez plus d’informations sur ce qui fonctionne et ce qui ne fonctionne pas, vous passez la majorité de votre temps à tirer le meilleur levier (l’exploitation), mais vous continuez cependant à explorer les autres options au cas où votre meilleure option actuelle ne serait pas la meilleure qui existe.
Voici la clé : la phase d’exploration ne cesse jamais.
Même si, dans le fond de votre cœur, vous êtes absolument certain que vous avez trouvé la meilleure option possible, vous ne cessez jamais d’expérimenter, parce que l’information que vous recueillez en expérimentant est toujours précieuse.
La seule façon de battre le bandit est de continuer à essayer de nouvelles choses.
La vie est un problème de bandit manchot
Il y a un ensemble de compétences que vous pouvez obtenir qui vous aidera à avoir ce que vous voulez de la vie. Vous avez aucune garantie que tout ce que vous choisissez d’apprendre va produire le résultat escompté, et vous commencez avec très peu d’informations sur ce qui est le mieux pour vous en tant qu’individu.
Vous avez un avantage majeur, cependant : d’autres personnes jouent le même jeu, et vous pouvez regarder ce qu’ils font pour recueillir des informations sur ce qui fonctionne et ce qui ne fonctionne pas sans avoir à faire exactement les mêmes choses qu’eux.
La stratégie optimale reste à peu près la même: expérimentez autant que possible, avec autant de variations que vous le pouvez, et portez une attention particulière aux expériences que font les autres.
Quand vous identifiez des choses qui semblent produire les résultats que vous voulez, passer plus de temps et d’énergie à les faire. Quand vos efforts produisent des résultats et que votre certitude dans cette option augmente, augmentez votre investissement dans cette option en conséquence.
Mais ne cessez jamais d’expérimenter, d’essayer de nouvelles options, de découvrir de nouvelles possibilités, d’explorer de nouvelles choses.
La clé principale pour une vie satisfaisante est l’expérimentation. Plus vous expérimentez, plus vous apprenez. Plus d’informations et d’options vous aurez à votre disposition, et meilleure est la chance que vous découvriez les choses qui vont produire les meilleurs résultats pour vous.
Vous ne pouvez pas faire de découvertes positives qui rendraient votre vie meilleure si vous ne tentez jamais quelque chose de nouveau. Commencez à expérimenter, et ne cessez jamais.
Remarques
Les machines à sous sont parfois appelés «bandits manchots», ce qui a donné son nom au problème. Il y a une bonne raison pour que les casinos soient rentables. Sur une période de temps assez longue, la maison gagne toujours ; la seule façon de gagner est de refuser de jouer.
Supposons que, pour le bien de cette expérience de pensée, vous ne payez pas pour jouer – chaque jeu ne vous coûte que le temps qu’il faut pour tirer le levier et voir le résultat.
Bien sûr, assurez-vous que les gens que vous observez ont les mêmes buts généraux, les aspirations et les valeurs que vous avez. Sinon, vous risquez d’optimiser pour quelque chose que vous ne voulez pas vraiment.
Pour en savoir plus :
Fiche Wikipédia Bandit manchot
Source : Josh Kaufman
Josh Kaufman est l’auteur du personal MBA et de « The first 20 hours : How to Learn Anything… Fast! »
Ses articles cités
Illustration : Flickr / Visual Artist Frank Bonilla