Pages

vendredi 26 février 2021

Relations clients : de l'Intelligence Artificielle nait l'uniformité

Le développement et l'amélioration des relations des entreprises avec leurs clients est une des préoccupations les plus importantes pour tous les dirigeants d'entreprise. Les grandes firmes américaines comme Netflix, You Tube (Google), Facebook, Amazon,... ont développés des algorithmes très séduisants permettant de conseiller leurs clients et de les orienter vers les produits et les services qu'ils attendent. Ces algorithmes reposent en grandes parties sur des techniques d'Intelligence artificielles et notamment sur des réseaux de neurones. Ces solutions sont très séduisantes mais est-ce une bonne solution ? Est-ce que les choix proposés sont pertinents ? Quels sont les effets indirects ?

Quelques definitions utiles  

Afin d'éviter des confusions il est nécessaire de rappeler les définitions des algorithmes et des réseaux de neurones.

La définition de l'algorithmes proposée par wikipédia est la suivante : Un algorithme est une méthode générale pour résoudre un type de problème. L’algorithme numérique sert donc à décrire un processus de résolution d'un problème. Par exemple l'algorithme de prévision météo transforme des mesures de pression, de température, de vents, .... en information sur ce que sera le temps du lendemain. Ainsi il permet de savoir, aussi précisément que possible, le temps qu'il fera bientôt.

Pour résoudre un problème donné, il existe de nombreux algorithmes possibles. Par exemple pour passer d'une station de métro A à une station de métro B, on peut partir d'une description de tout les chemins d'un point central (C) vers chaque station du réseau. L'algorithme proposera alors systématiquement un début de parcours pour rejoindre C depuis A puis une fin de parcours pour rejoindre B depuis C. Cet algorithme peut être rendu plus efficace en éliminant du parcours final, toutes les stations situées dans le parcours où on passe deux fois à l'aller et au retour. Plus efficace que le premier, il est certainement encore possible de l'améliorer. On parle dans ce cas d'optimiser l'algorithme.




Les différentes manières d'aller de A à B

La quantité de ressources (mémoire et le nombre d'étapes, ...) nécessaire à l’exécution d’un algorithme est nommée complexité algorithmique. Comme on vient de le voir deux algorithmes produisant le même résultat peuvent avoir des complexités très différentes - on peut voir à cet effet les problèmes NP Complet et NP Difficiles.

Cette complexité peut être optimale. Dans ce cas, il est impossible de trouver un algorithme qui puisse effectuer ses opérations de manière plus rapide. En fait ce stade optimal est rarement atteint, d’une part parce qu’il est souvent indémontrable ou trop cher à démontrer, d’autre part parce qu’il coûte cher à atteindre. C'est à dire que les efforts à produire pour optimiser l’algorithme sont supérieurs à l’utilisation de l’algorithme pendant toute sa durée de vie.

L'invention des algorithmes à base d'Intelligence Artificielle 

Dès l'origine de la notion d'intelligence artificielle, on a assez vite compris qu'un programme  pour être perçu comme intelligent devait prévoir toutes les situations qu'il pourrait rencontrer, or il est impossible de toutes les décrire et donc il n'est pas possible d'imaginer un tel algorithme. Pour y arriver il va falloir que le programme sache s'adapter. Ainsi il devra apprendre à faire face à des situations inconnues au moment de sa programmation, par exemple en étant capable de se reprogrammer.

Souvent quand on pense intelligence artificielle, on se restreint aux réseaux de neurones, parce que ce type d'algorithmes a permis  ces deux dernières décennies de nombreuses avancées. Le réseau de neurones, est un algorithme unique qui est capable de prendre en compte un nombre colossal d'autres algorithmes adaptés au contexte à traiter. La première étape de sa mise au point, couramment appelée phase d’apprentissage, précède la phase d’utilisation. Elle permet de paramétrer le réseau de neurones pour qu'il réponde à un ensemble de situations bien définies. Pour simplifier, la phase d’apprentissage repose sur un algorithme unique (1) dit de rétropropagation. Pendant cette phase l’algorithme ajuste un autre algorithme par touches successives que l’on utilisera ensuite en phase opérationnelle.

Le réseau de neurones est donc un algorithme capable de fabriquer d'autres algorithmes. 

Ce fascine le plus c'est que, dans certains cas, cet algorithme est capable de produire des algorithmes de qualité supérieure à ce que l’être humain arrive à produire à travers les techniques habituelles. L’exemple le plus connu étant la reconnaissance d’images. C'est une opération bien trop complexe pour être décrite à l'aide d'un langage informatique classique. Un réseau de neurones, bien entraîné, reconnait des lettres, des chiffres, des objets, des animaux,.. 

La phase d’apprentissage demande (en général) une quantité colossale de données et nécessite des quantités phénoménales de cycles de calcul (qui se traduisent notamment par une consommation d'énergie importante). 

L'Intelligence artificielle permet de mieux connaitre les clients de l'entreprise 

Les services marketing de toutes les entreprises passent leur temps à demander aux informaticiens des analyses des bases de données clients mais ils ont du mal à définir en termes techniques ce dont ils ont besoins. Ils rêvent d'avoir un algorithme unique capable de produire toutes les analyses possibles. En effet, un algorithme générique pourrait être capable de produire l’algorithme permettant d'analyser le marché, les clients, les produits,... Ainsi ils pourraient se passer des informaticiens. C'est le rêve secret de tous ceux qui dans l'entreprise travaillent hors de la DSI. 

Pour autant, et quand bien même on disposerait des outils fiables permettant d’entrainer correctement et simplement un réseau de neurones, sans être un expert on ne peut pas y arriver. Fin du rêve. Mais il est possible qu'un jour on puisse commander des analyses complexes en langage naturel mais aujourd’hui, entrainer un réseau de neurones est un métier qui demande de grandes qualifications.

Il faut aussi comprendre que l’algorithme permettant de fabriquer l’algorithme recherché ne fera jamais que produire un paramétrage correspondant à ce qui lui a été demandé. Il dépendra donc beaucoup de l'intuition de son "entraineur" même s'il est capable, parfois, de réserver des surprises. En d’autres termes, non seulement il va reproduire tous les biais éventuels des données qui ont servi à son entrainement mais en plus il ne verra dans les données que ce que l’être humain qui l’a préparé lui a demandé de chercher. Il renforcera aussi les biais dans les données car un des points forts de ces algorithmes est de découvrir et de mettre en avant les signaux si faibles qu’ils sont invisibles pour l’être humain.

En bref, il cherche que ce qu’on lui demande et met en exergue, notamment, le pire de ce qui se trouve dans les données.

Quelques interrogations sans réponse 

D'abord ces opérations sont réservées aux grandes entreprises. Quant aux autres structures, notamment comme les artisans, les petites boutiques, les professions libérales, ... sont trop petites et n'ont pas assez de données pour entrainer des réseaux de neurones. Toutes ces petites entreprises ont  intérêt à utiliser d’autres outils pour améliorer leur compréhension de leurs clients et des services dont ils ont besoins.

Le réseau de neurones est un algorithme produisant des algorithmes notamment utiles pour comprendre les attentes des clients. Pour cela on va compléter son profil en se basant sur une connaissance partielle des clients en effectuant des extrapolations extrêmement fines. Ainsi on connait mieux les clients et on a une bonne probabilité de bien répondre à ses attentes spécifiques quand on s'adresse à chacun avec une offre personnalisée.

Netflix utilise des algorithmes pour optimiser le déploiement des vidéos sur des serveurs se trouvant à proximité de ses clients. En effet un algorithme d'intelligence artificielle est capable de prévoir une forte demande locale d'une vidéo donnée compte tenu des goûts de la clientèle. Si dans l’absolu cela ressemble à une optimisation de la distribution de contenu, dans le détail c’est plus exactement une centralisation. On est plus dans un  processus similaire à l’implantation des grandes surfaces qui ont tuées les commerces de proximité que dans une optimisation globale de la distribution de film. 

Si l'offre VOD semble plus variée que l'offre télévisuelle classique, il est probable, si on l'étudie à l'échelle mondiale, qu'en fait elle soit plus uniforme. De même, le nombre de produits directement accessibles dans une grande surface parait immense comparé à celui d'une épicerie de quartier. Pourtant étudié à l'échelle nationale ou mondiale, la diversité des produits offerts en grande surface est infinitésimale (notamment si on regroupe les produits équivalents, quelque soit la marque et le paquetage).

Cette centralisation mène à une uniformisation, comme c'est le cas avec le déploiement du tourisme de masse. Il se traduit par un appauvrissement culturel général. Ce biais qui nous mène à suivre le troupeau, non seulement parce que c’est naturel chez l’homme qui est un animal social, mais parce que sortir du lot est rendu encore plus compliqué parce que ces algorithmes influencent notre accès à l’information. Il est important de comprendre la nature de ce biais et de s'en prémunir, pour soi en tant que client autant que pour ses propres clients.

En effet, bien que des algorithmes bien entrainés soient capables de reproduire des compositions musicales qui ressemblent à du Beethoven ou un morceau de rap, ils ne font que copier, avec beaucoup plus de finesse qu'un copier coller. Cette finesse peut leur donner un verni de créativité, mais ils ne sont en rien créatifs. Si, vous écoutez uniquement des chansons produites par un de ces algorithmes il y a de fortes chances que rapidement vous finissiez par vous ennuyer profondément. Il pourrait en être de même pour vos clients qui, s'ils se sont laissés séduire au départ par la précision de votre compréhension de leurs besoins, ils finissent par se lasser de recevoir inlassablement des réponses similaires de la part de votre entreprise comme de vos concurrents.

L'Intelligence Artificielle n'est pas la panacée universelle 

En résumé, 

    • Les réseaux de neurones peuvent produire de l'information extrêmement pertinente à propos des clients de l'entreprise, 
    • Mais, ils ont tendance à reproduire, et même à grossir le trait, de tous les biais de nos sociétés humaines. 
    • La production d'algorithme d'Intelligence Artificielle est généralement une opération coûteuse. 
    • Ces algorithmes produisent une information dénuée de toute créativité. 
Les entreprises ayant de nombreux clients et utilisant ce type d'outil disposent d'un avantage concurrentiel indéniable sur ceux qui ne l'utiliserait pas car elles disposent, client par client, d'une image assez fine de leurs attentes. Sans un outil de ce type les entreprises risquent de disparaître, tôt ou tard. Pour autant, n'oubliez pas que les clients sont des humains. Ils ont besoin d'être, de temps à autre, surpris faute de quoi ils s'ennuieraient très vite. Les livrer aux seuls algorithmes permet, peut-être, de dégager une marge importante tant que l'algorithme est perçu comme ayant de la valeur, mais très vite la concurrence pourra, sans effort, offrir le même produit ou le même service et tout sera à recommencer.

1 - En réalité il existe plusieurs dizaines de variantes de l'algorithme à la base des réseaux de neurones.