- Published on
Bard, Chat GPT, Bing Chat, … Quel chatbot va révolutionner notre façon de concevoir l’intelligence artificielle ?
- Authors
- Name
- Victor Pavageau
Quel chatbot va révolutionner notre façon de concevoir l’intelligence artificielle ?
Les intelligences artificielles, et notamment les chatbots, font aujourd'hui partie de notre quotidien. De plus en plus médiatisés, ils se retrouvent dans nos conversations en ligne, sur les réseaux sociaux, les sites de e-commerce, et même dans certains services clients. Mais derrière ces conversations fluides et naturelles se cache une technologie révolutionnaire : les LLM, ou Large Language Models
.
Ces modèles de langage avancés permettent aux chatbots et aux autres types d'IA de comprendre et de produire un langage humain de manière plus sophistiquée que jamais auparavant. Dans cet article, nous explorerons ce que sont les LLM, et quel est leur enjeu dans le développement de l'IA et de la communication humaine. Nous prendrons comme exemple 4 des chatbots les plus médiatisés Bard, Chat GPT, Bing Chat, et LLaMA.
Un LLM (Large Language Model) est un type d'intelligence artificielle basé sur le Deep Learning
qui peut être utilisé pour générer du texte, traduire des langues et répondre à des questions. Les LLM sont entraînés sur de très grandes quantités de données textuelles pouvant provenir d'internet, de livres, ou de bien d’autres sources variées. Les LLM peuvent être utilisés pour générer du texte en langage réel, traduire un texte d'une langue à une autre ou encore répondre à des questions sur divers sujets.
Les plus gros LLM à l’heure actuelle sont composés de plusieurs centaines de milliards de paramètres. Les paramètres
sont des variables ajustables dans un modèle de traitement de langage naturel. Ainsi, plus il y a de paramètres, plus le modèle peut être complexe et plus il est capable de comprendre les nuances subtiles du langage naturel. Cependant, un modèle avec un grand nombre de paramètres nécessite également des ressources de calcul plus élevées.
Dans cet article, je vous propose de nous intéresser, spécificité par spécificité, à quatre des chatbots (IA conversationnelle
) les plus connus.
- Bard
- Chat GPT
- Bing Chat
- LLaMA
Chacun de ses chatbot est basé sur un LLM bien particulier.
Tous les LLM dont nous allons parler sont basés sur des réseaux neuronaux
. Les réseaux neuronaux sont un type d'algorithme d'apprentissage automatique inspiré du cerveau humain. Ils sont constitués d'un grand nombre de nœuds interconnectés, appelés neurones
. Chaque neurone est responsable du traitement d'une petite quantité d'informations, et les connexions entre les neurones leur permettent de partager des informations entre eux.
Tous ces LLM sont des réseaux neuronaux basés sur des transformateurs. Les transformateurs sont un type de réseau neuronal particulièrement adapté aux tâches de traitement du langage naturel (Natural Language Processing
). Ils sont capables d'apprendre les dépendances à long terme entre les mots, ce qui les rend plus aptes à comprendre et à générer du texte.
Ainsi, pour générer un texte, ces chatbots prédisent le mot suivant dans une séquence de mots, sur la base du contexte des mots précédents, et créé ainsi des phrases, mots par mots.
Accessibilité
L’information la plus importante au sujet des chatbot est probablement l’accessibilité de ce dernier. En effet, tous les chatbot de la liste ne sont pas encore tout à fait accessible au public.
Ce n’est pas le cas de Chat GPT qui est publiquement accessible dans sa version gratuite (GPT-3.5) depuis novembre 2022, et dans sa version premium (GPT-4) depuis mars 2023.
Bing Chat est également accessible au public depuis février 2023, mais seulement utilisable depuis Microsoft Edge.
En ce qui concerne Bard, le chatbot de Google n’est pas encore accessible au public. Il est possible de s’inscrire à une liste d’attente pour les personnes résidants aux Etats-Unis ou au Royaume-Uni afin d’avoir accès à une version bêta. De plus, Bard n’est actuellement utilisable qu’en anglais, ce qui est une restriction supplémentaire.
Le chatbot qui s’en sort le moins bien dans cette catégorie est LLaMA. Arrivé plus tard dans la course aux IA conversationnelles
, LLaMA est le seul des chatbots de ce comparatif à ne pas avoir d'interface en ligne. Après qu'une version ultra-bêta du modèle ait fuité sur GitHub, Meta a décidé de rendre public l'accès au LLM. Le moteur de LLaMA a alors été publié sous le format de versions locales et parfois non entraînées du modèle, nécessitant une mise en place et des connaissances afin de le faire fonctionner. Différents modèles de différentes tailles ont été rendus accessible, permettant également aux personnes équipées d’ordinateurs moins performants d’installer et d'utiliser le modèle.
Accès à l’information
Une caractéristique majeure pour un chatbot est son jeu de données
, autrement dit, les informations dont il dispose pour apporter des réponses précises et pertinentes.
Sur cette caractéristique-là, c’est Bing Chat et Bard qui se démarquent en proposant un jeu de données complet couplé à un accès à internet. Un accès à Internet représente un très grand atout pour un chatbot car cela lui permet de disposer de beaucoup plus d’informations, de ne pas se limiter à son jeu de données d’apprentissage, et surtout d’avoir accès aux informations les plus récentes à tout moments.
Bard va, par défaut, se limiter à son jeu de donnée pour tenter de répondre à la question posée. Si son jeu de donnée ne suffit pas ou ne lui permet pas d’apporter une réponse pertinente et complète, il va alors utiliser son accès à internet afin d’améliorer la qualité de sa réponse. Si Bard recourt à l’utilisation d’internet pour vous répondre, il citera systématiquement ces sources en fin de réponses.
En ce qui concerne Chat GPT, que ce soit avec GPT-3.5 ou GPT-4, aucune des deux versions n’est dotée d’un accès à internet, mais les deux modèles disposent d’un jeu de données extrêmement volumineux et récent (jusqu’à septembre 2021) ce qui leur permet tout de même de proposer des réponses très pertinentes.
LLaMA possède un jeu de données très récent (jusqu'à février 2023), mais n'a pas non plus d'accès à internet. L'avantage d'avoir publié des versions locales et de permettre aux utilisateurs d'entraîner à nouveau le modèle sur leurs propres données est de pouvoir avoir une IA entraînée et spécialisée
sur un jeu bien précis et défini qui correspond parfaitement aux besoins de l'utilisateur.
On remarque particulièrement l'intérêt d'avoir un accès à internet lors de questions sur des sujets d'actualité, comme par exemple le champion du monde actuel de football.
GPT-4 :
"Je ne peux pas vous donner le champion du monde de football actuel, car mon entraînement s'est terminé en septembre 2021. À cette époque, la France était championne du monde, ayant remporté la Coupe du Monde de la FIFA en 2018."
Bard :
"L'Argentine est actuellement championne du monde de football après avoir battu la France en finale de la Coupe du monde de la FIFA 2022."
Rapidité
Les délais des réponses sont également au cœur des préoccupations chez les développeurs de ces chatbots. En effet, le tout est d’avoir un chatbot performant sans avoir à attendre trop longtemps avant d’avoir notre réponse. Dans ce domaine, c’est à nouveau Bard qui se démarque de la concurrence avec un temps moyen de réponse de 2 secondes.
Il est suivi de près par Bing Chat, puis Chat GPT qui sont quelques secondes plus lents.
Du côté de LLaMA, étant donné que les seuls tests dont nous disposons actuellement sont sur des machines locales, les délais varient beaucoup et dépendent des taille de modèles et des capacités de l’ordinateur de l’utilisateur.
Si Bing Chat, Chat GPT, et Bard sont très proches, là ou Bard fait la différence, c’est qu’il ne se limite pas à une seule réponse. En effet, lorsque Bard vous répond, il vous propose 3 réponses
, une principale et 2 variantes, ce qui permet d’avoir le choix sur la formulation des phrases ou de vérifier des calculs mathématiques par exemple.
Problèmes mathématiques
Les problèmes mathématiques font partie des questions les plus posées à Chat GPT depuis son accès publique. Mais est-ce vraiment le modèle le plus doué dans ce domaine ?
Actuellement, seul Bard est équipé d’un solveur mathématique
. Cependant, Bing Chat et Chat GPT parviennent à résoudre des problèmes mathématiques relativement simple grâce au fait qu’il y a des démonstrations mathématiques dans leur jeu de donnée d’apprentissage. Un solveur mathématique est un outil informatique conçu pour résoudre des problèmes mathématiques en utilisant des algorithmes et des méthodes numériques.
Bard est également le seul des chatbots mentionnés ici à gérer parfaitement la syntaxe LaTeX
rendant plus lisible des démonstrations mathématiques.
Afin de combler ces lacunes en mathématiques et l’absence de solveur, OpenAI
a récemment annoncé ajouter une fonctionnalité de plug-in
à Chat GPT afin de lui permettre, notamment, d’interagir avec des solveurs de maths externes (leur choix premier semble se porter vers Wolfram Alpha
).
Prise de position
Si le cadre juridique et éthique autour des intelligences artificielles est encore peu défini et délimité, les entreprises ont tout de même posé leurs propres limites, ainsi, voici des exemples de sujets que Chat GPT, Bing Chat, et Bard ne couvriront pas :
- Tout ce qui est illégal ou nuisible.
- Tout ce qui est sexuellement explicite ou offensant.
- Tout ce qui est haineux ou discriminatoire.
- Tout ce qui est confidentiel ou exclusif.
- Tout ce qui constitue du spam ou de la publicité.
- Tout ce qui n'est pas pertinent pour la conversation.
Cependant, il existe certains moyens de contourner ces restrictions, notamment sur Chat GPT avec des prompts
bien précis permettant de tromper le chatbot. L'exemple le plus connu de est un prompt dans lequel on disait à Chat GPT de se faire passer pour un personnage inventé appelé DAN (Do Anything Now). En incarnant ce personnage, les restrictions et limites de Chat GPT imposées par OpenAI pouvaient être contournées.
Malgré ces restrictions, des sujets plus ou moins ambiguë sont considérés comme sensibles pour certains, mais pas pour d’autres. Ainsi, on obtient des réponses divergentes lorsque l'on demande leur opinion sur le conflit russo-ukrainien à Bard et Chat GPT.
GPT-4 :
"En tant qu'IA, je n'ai pas d'opinion personnelle. Je peux vous fournir des informations et des analyses sur le conflit russo-ukrainien, mais je ne peux pas exprimer de point de vue propre."
Bard :
"Je pense que le conflit russo-ukrainien est une situation très triste et malheureuse. Il s'agit d'une crise humanitaire qui a causé beaucoup de souffrances au peuple ukrainien. J'espère qu'il sera résolu pacifiquement dès que possible. [...]"
Bilan
Les chatbots, et plus généralement les LLM
sont des technologies fascinantes qui ont le potentiel de révolutionner la manière dont nous communiquons et interagissons les uns avec les autres. Ces avancées permettent aux machines de comprendre et de produire un langage humain de manière plus sophistiquée que jamais auparavant.
Cependant, les choses évoluent rapidement et de nouvelles innovations émergent constamment, ce qui rend difficile de couvrir toutes les informations pertinentes dans un seul article. Néanmoins, il est clair que les chatbots et les LLM sont des technologies à surveiller de près, car ils continueront de jouer un rôle important dans le développement futur de l'IA
et de la communication humaine
.
Au fur et à mesure de leur développement, les LLM sont susceptibles d'avoir un impact significatif
sur la manière dont nous communiquons et interagissons avec le monde qui nous entoure. Ils pourraient être utilisés pour créer de nouvelles formes de divertissement, pour améliorer notre façon d'apprendre et pour rendre notre vie plus efficace.