Bard vs ChatGPT vs Claude 2 : quelle IA générative est faite pour vous ?

JDN
July 14, 2023
502 views

Quelles sont les principales différences entre les chatbots de Google, OpenAI et Anthropic ? La réponse en tableau.

Depuis des mois désormais, les acteurs de l'IA générative bataillent pour développer un chatbot compétitif. Une course à l'intelligence artificielle dominée par trois acteurs, OpenAI, Google et Anthropic, qui s'est accélérée en juillet. OpenAi a dégainé le premier en sortant son plugin Code Interpreter le 7, Anthropic lui a emboîté le pas le 11 en dévoilant son nouveau modèle Claude 2, beaucoup plus efficient que la première version, avant que dans la foulée, le 13, Google déploie en Europe Bard, avec la prise en charge de la multimodalité basée sur Google Lens. Comme toute course entre champion, celle-ci s'avère difficile à suivre. Voici donc ci-dessous un point d'étape sur les capacités de chacun.

Bard, ChatGPT, Claude 2 : comparatif au 13 juillet ChatGPT Bard Claude 2 Développeur OpenAI Google Anthropic Disponible en France Oui Oui Non Multimodalité Oui, avec Code Interpreter Oui, en Anglais Oui Fonctionnalités premium GPT-4, priorité d'accès, plugin, Code Interpreter Non Non Longueur de prompt théorique 30 000 mots (avec GPT-4) 10 000 mots 75 000 mots Dernière mise à jour "officielle" des données Septembre 2021 Temps réel Début 2023 API OpenAI API Cloud's AI Trusted Tester Program Anthropic API Connexion à internet Non Oui Non Prix de l'API Entre 0,03 $ et 0,06 $ / 750 mots ND 0.0465 $ / 1 000 mots Plugin(s) disponible(s) Oui Non Non Qualité du texte généré en français Haute Bonne Faible Éthique du modèle Moyenne Bonne Bonne Temps de réponse Moyen (avec GPT-4) Rapide Rapide Nombre de paramètres 530 millions 1,3 million 1,6 million

Quel modèle faut-il choisir aujourd'hui et pour quel usage ?

Pour le moment, seuls ChatGPT - et ses modèles sous-jacents GPT-4 et GPT-3.5 - et Claude 2 sont destinés à un usage professionnel. Bard ne dispose pas encore d'API ouverte au public, les éditeurs sont dans l'obligation de s'inscrire sur le Cloud's AI Trusted Tester Program de Google pour réussir à intégrer Bard à leurs applications. Du côté d'Anthropic et d'OpenAI, l'intégration est beaucoup plus simple. Il suffit de créer un compte et de renseigner les informations de facturation pour utiliser l'API.

Côté multimodalité, les trois modèles sont maintenant capables de traiter des fichiers en entrée de prompt. Bard réserve la possibilité d'uploader des images pour les analyser mais uniquement dans sa version anglophone. ChatGPT peut traiter différents types de fichier, des images aux fichiers PDF en utilisant Code Interpreter. Claude 2 permet également de soumettre des fichiers textuels (PDF, CSV, DOCX…).

Quel modèle est le plus qualitatif ?

D'un point de vue qualitatif, GPT-4 continue de proposer des réponses plus structurées avec un langage riche et un contexte pertinent. De son côté Bard semble suivre la logique de la transformation des Serp et propose de l'information très pratique, souvent brève et présentée sous forme de liste à puce. Enfin Claude 2 répond très classiquement mais, en français, son vocabulaire est peu diversifié et ses informations moins pertinentes.

Concernant la fraîcheur des informations, Bard gagne haut la main. L'IA de Google étant connectée à Internet, elle génère des réponses plus récentes mais manque encore de fiabilité. Lors de nos tests, le chatbot a été victime d'hallucination à de multiples reprises. Claude 2 ne fait pas beaucoup mieux mais semble toutefois moins sujet à l'AI hallucination. Ses données ont le mérite d'être plus à jour que celles des modèles d'OpenAI, l'IA ayant emmagasiné son dataset jusqu'en début d'année 2023. Enfin ChatGPT - bien qu'il ne dispose plus d'un accès au web - répond de manière générale plutôt correctement, mais ses données, arrêtées en septembre 2021, l'handicapent fortement.

Prompt : "Génère un article sur les dangers du soleil en été." De bas en haut : Claude 2, Bard, GPT-4. © Capture d'écran

Dans la majorité des cas, l'intégration de l'IA générative dans l'applicatif ne nécessite pas de données récentes. Il semble alors pertinent de recourir à Claude 2 pour des tâches basiques en raison de son faible coût et à GPT-4 pour des tâches plus complexes. Enfin de manière alternative, les modèles de précédentes générations chez OpenAI - à l'image de text-curie-001, text-babbage-001 ou encore text-ada-001 - sont suffisants pour gérer des tâches élémentaires comme de la traduction, le classement ou encore de la synthèse. Leur rapidité et leur rapport qualité / prix en font des modèles toujours incontournables en 2023.

Source: JDN