ChatGPT : LegiGPT et Ordalie.tech, ces deux chatbots 100% français vous aident à connaître vos droits

May 06, 2023
169 views

« Tiens, on a eu la même idée ». À deux jours d’intervalles et sans s’être concertés, des entrepreneurs français ont lancé LegiGPT et Ordalie.tech. Après le ChatGPT du climat, voici donc le, ou plutôt, les ChatGPT du droit. Depuis le lancement de ce robot conversationnel en novembre 2022, des entrepreneurs du monde entier travaillent sur des interfaces spécialisées dans certaines thématiques, basées sur ce modèle de langage. Après « Climate Q & A », le robot qui répond à vos questions sur l’environnement, ce sont des chats conversationnels spécialisés en droit français qui ont été lancés la semaine dernière dans l’Hexagone.

Tous deux préviennent en amont : leur robot conversationnel n’est pas un avocat en ligne, et il est en cours d’amélioration. Comprenez : comme pour ChatGPT, les hallucinations et les erreurs sont possibles. Si nous avons constaté des requêtes laissées sans réponse, voire des réponses inexactes, ces deux outils ont l’immense mérite de rendre le droit plus accessible.

À la tête de LegiGPT : Steeve Morin, un ingénieur de 39 ans, fondateur de Zenly, un réseau social basé sur la géolocalisation racheté par Snapchat en 2017. Sur son interface en ligne basée sur GPT 3.5, pas d’inscription préalable. Il est possible de poser ses questions directement dans l’interface en ligne, sans limite. Aux rênes d’Ordalie.tech, Léa Fleury et Baudouin Arbarétier, respectivement 29 et 25 ans, un couple composé d’une ancienne juriste et d’un entrepreneur-développeur. Pour poser des questions juridiques, il faut créer son compte et laisser son adresse e-mail – vous serez alors limité à 15 questions par mois. Nous les avons interviewés séparément, quelques jours après le lancement officiel de leurs interfaces.

Comment avez-vous eu l’idée de créer un ChatGPT du droit français ?

Steeve Morin (LegiGPT) : Tout est parti de la réforme des retraites. Je trouvais un peu désolant d’entendre des diatribes sur des choses qui n’étaient pas dans le projet de loi. Je me suis dit, et pourquoi on ne peut pas simplement regarder le texte ? Il y a 10 ans, j’avais mis le code civil sur Github. À l’époque, j’avais été marqué par le débat sur la loi du mariage pour tous et l’énorme décalage entre la perception des militants et la réalité du texte. Et je me suis dit, aujourd’hui, il y a quand même cette avancée qui sont les modèles de langage, les GPT.

Ça ferait quoi de leur donner toutes les lois, les codes, et de poser des questions – pas des questions générales, mais des questions spécifiques à une situation ? Par exemple, j’ai ce problème là, dans ce contexte là, je sais pas quoi faire. Et le modèle de langage va comprendre mon cas particulier, l’appliquer à un set de données – en l’occurrence les lois et les articles des codes – me sortir une synthétisation ou une réponse adaptée à mon cas. Je me suis dit, il faut le faire. Et donc je l’ai fait.

Léa Fleury (Ordalie.tech) : Aujourd’hui, il existe de nombreuses solutions de recherche d’articles et de jurisprudence. Mais il manque une couche un peu simplifiée pour des personnes qui ne viennent pas du monde juridique. Et on a vraiment voulu rendre l’information juridique beaucoup plus accessible qu’elle ne l’est aujourd’hui, sans renier sur la qualité. Ensuite, quand on recherche des règles de droit, il faut se plonger dans des blocs de droit et des sources différentes, certaines sont gratuites comme Legifrance, d’autres sont payantes et extrêmement chères.

Notre objectif, c’est vraiment de condenser tout ça en un seul site et d’optimiser le temps de recherche. Avec Ordalie.tech, l’idée c’est surtout de pouvoir faire gagner du temps à ce niveau là, d’optimiser le temps de travail pour les avocats et les juristes pour qu’ils puissent se concentrer sur des tâches plus intellectuelles.

Qu’est ce qui est le plus compliqué quand on veut intégrer du droit dans des LLM, ces grands modèles de langage ?

Steeve Morin (LegiGPT) : Le droit ressemble plus qu’on ne pense au code informatique. Les deux sont très proches. Quand j’ai travaillé sur le code civil, j’ai lu la loi, les articles, j’ai été choqué de voir à quel point c’était compréhensible, et à quel point c’était proche du code (informatique), notamment dans son fonctionnement : ça pose un cadre, il y a des exceptions, des bugs, des externalités non prévues avec une infinité de variabilités, ainsi que des mises à jour. La première étape, ça a été d’aller sourcer les codes (de droit). Alors ce n’est pas un défi au sens impossible, mais c’est très fastidieux.

On a la chance d’avoir des dépôts de données qui sont complets, même si c’est un cauchemar à manipuler. Et après ce qu’on fait, c’est qu’on a demandé au modèle d’analyser tous ses articles, ses codes, etc., et de les représenter dans ce qu’on appelle un espace vectoriel. Et donc une fois qu’on a ça, on va aller donner des consignes aux modèles en disant voilà, tu fais ça dans ce cadre là, avec ça, voici la question à laquelle tu dois répondre. Ce qu’on appelle le contexte.

Baudouin Arbarétier (Ordalie.tech) : Concrètement, on a vu en novembre que ChatGPT était disponible, et on a commencé à travailler sur des maquettes de moteurs de recherche qui cherchaient dans les lois pour ensuite les donner à ChatGPT, afin que celui-ci ait de la matière pour répondre aux questions. Ça, c’est vraiment un peu le modèle de fonctionnement de base. Ensuite, on a un peu complexifié cette structure. On a ajouté des nouveaux modèles qu’on a entraîné nous-même, pour pouvoir sélectionner encore plus précisément les articles qui correspondent à la question. Tout ça fait un ensemble de briques qui, aujourd’hui, donne Ordalie.tech.

Un des défis à relever a été d’intégrer la jurisprudence et les conventions collectives, qui sont des textes assez longs. On a aussi voulu insérer les sources (à côté de la réponse du Bot, les articles cités sont référencés et consultables, NDLR), parce que les LLM ont surtout l’avantage de pouvoir simplifier, ou de résumer les choses. Or le fait d’avoir ce résumé n’empêche pas tout le travail de recherche et de vérification.

Pour nous, c’est très important d’avoir cette dualité entre le texte qui est fourni par le LLM et les sources en fait sur lesquelles il s’appuie et qu’on va pouvoir vérifier. D’autant qu’on a vu aussi qu’il y a des modèles, qui, de manière très naturelle et très crédible, inventent des références à des articles de loi qui n’ont jamais existé (les hallucinations). Et puis d’un point de vue juridique aussi, c’est quand même un peu la base de citer ses sources.

Dans certains commentaires qu’on trouve sur les réseaux sociaux, certains vous accusent de vouloir remplacer les professionnels du droit. Que leur répondez-vous ?

Steeve Morin (LegiGPT) : Non, pas du tout, au contraire, je vais leur apporter du business. En fait, l’idée, ce n’est pas de manger une plus grosse part du gâteau, c’est de faire grossir le gâteau. Imaginez que vous ayez un problème d’ordre juridique : il n’y a pas grand monde qui va se dire, je prends mon téléphone, et je demande un conseil gratuit à un avocat qui est dans mon cercle de connaissances. Tout le monde n’a pas accès à un avocat. Mais les questions, elles, elles existent. Et personne n’y répond aujourd’hui. Moi, je pense que s’ils interrogent LegiGPT, et qu’en fonction de la réponse ils se disent : « Tiens, il y a peut-être quelque chose à faire », ça va les pousser à aller voir un avocat. Je pense qu’au contraire, LegiGPT va apporter aux professionnels du droit beaucoup de business.

Léa Fleury (Ordalie.tech) : On a eu des commentaires de juristes qui disaient, « merci, on va être au chômage ». Mais, pour nous, poser une question à Ordalie.tech, c’est une première étape qui va permettre à tout un chacun d’aborder sa situation et qui peut justement pousser à se dire : je vais consulter un expert juridique. L’IA ne remplacera jamais l’avocat, on a pas du tout cette prétention là. Et pour les professionnels du droit, c’est plutôt un outil de soutien et d’aide qui peut les aider à être beaucoup plus productif dans leurs recherches.

À terme, avez-vous déjà un modèle économique en tête ?

Steeve Morin (LegiGPT) : Moi, ça fait 10 ans que je suis dans le milieu des start-up à Paris, et je me suis dit qu’il fallait faire un outil qui soit facile, mais surtout qui soit gratuit. Le service a été lancé vendredi (28 avril) à 9 h. On va voir comment ça fonctionne. Là, je paie tout de ma poche, et ça commence à me coûter cher, parce que chaque question me coûte de l’argent, ça peut varier, mais ça peut monter jusqu’à 30 centimes la requête.

Pour moi, il faut qu’une bonne partie de l’outil reste gratuite. Je n’irai pas jusqu’à dire que c’est du service public, mais en tout cas c’est quelque chose qui est très important. Il faut que tout un chacun puisse se renseigner. Ensuite, j’ouvre aussi la porte à une partie payante (il est possible de s’inscrire à un LegiGPT + en cours de création, NDLR) parce qu’il y a des gens qui m’ont dit : « Moi, je serais près à payer pour ça ». Par exemple, en testant une version basée sur GPT4, des avocats m’ont clairement dit qu’ils seraient près à payer pour ce service. Mais aujourd’hui, je n’ai pas de modèle économique.

Baudouin Arbarétier (Ordalie.tech) : Pour l’instant, pour utiliser le service, il faut s’inscrire. Les utilisateurs sont limités à 15 requêtes par mois. Mais on espère pouvoir étendre ce chiffre. À terme, on pense développer deux branches : une pour les particuliers, l’autre pour les professionnels. La première, pour le grand public, on l’imagine plutôt gratuite, toujours dans l’optique de suivre notre conviction qui est de pouvoir démocratiser l’accès à une information juridique de qualité.

Et la seconde, plus développée et étoffée, sera à destination des avocats, des juristes d’entreprises mais aussi des entreprises, plutôt PME et TPE, qui ne peuvent pas toujours avoir recours à des experts juridiques. Notre outil est déjà testé par des avocats, et on a des retours très positifs, même s’il reste beaucoup de choses à intégrer et à corriger. Notre positionnement sera de proposer un service plus accessible (financièrement) que ce qui existe actuellement.

Un point commun que vous avez, c’est d’avoir introduit de l’humour dans les réponses du bot, pourquoi ?

Sur Ordalie.tech, le robot explique qu’il est en train de chercher ses lunettes ou de se remuer les méninges, le temps d’attendre la réponse. Sur LegiGPT, si vous posez une question qui n’a rien à voir avec le droit, vous obtiendrez une réponse très ironique.

Steeve Morin (LegiGPT) : Dimanche dernier j’ai en effet ajouté un détecteur de conneries. Un prompt ça coûte de l’argent, donc si le bot détecte une question qui n’a pas lieu d’être, il répondra avec beaucoup d’ironie.

Léa Fleury (Ordalie.tech) : Insérer un peu d’humour pendant que le message charge, c’est un peu pour casser le côté élitiste du droit, qui peut être parfois assez intimidant et impressionnant. Je pense que ça reflète aussi notre personnalité au quotidien, donc on avait vraiment envie que ça se ressente dans notre outil.

Maintenant que votre chatbot du droit est lancé, quelles sont vos prochaines étapes ?

Steeve Morin (LegiGPT) : Mes prochaines étapes, c’est améliorer LegiGPT. Je vais rajouter plus de choses, comme la jurisprudence. Sur le long terme, j’aimerais aussi intégrer les projets de loi, ce qui permettrait de dire, si cette loi là était appliquée, voilà ma question juridique, et voici quel serait mon futur virtuel. Les réponses seraient aussi bien mieux avec GPT 4, c’est un tout autre niveau. On peut lui mettre plus de choses, il est beaucoup plus grand. Sa capacité de raisonnement est un peu plus aboutie. Mais il est beaucoup plus cher.

Baudouin Arbarétier (Ordalie.tech) : Sur le très court terme, j’ai des bugs à corriger. On va essayer d’améliorer les choses pour que le serveur ne crashe pas sous le poids des visiteurs. On aimerait aussi intégrer les conventions collectives. Ce sont des textes qui sont essentiels pour comprendre le droit, et qui sont aussi valables que les codes juridiques. Ensuite on a pour l’instant limité les questions à 15 par mois, pour éviter les abus, parce que chaque requête nous coûte de l’argent. Mais on pense qu’on va étendre cette possibilité au fur et à mesure, en fonction de nos coûts. Sur le long terme, on veut créer une offre pour les professionnels, et rendre notre outil encore plus pointu. On pourrait aussi s’étendre à d’autres pays, comme le Luxembourg. Mais pour l’instant, on se concentre vraiment sur le droit français.

Source: 01net