Tech

Avec un financement de 11,9 millions de dollars, Dottxt indique aux modèles d’IA comment répondre

Comme nous l’avons déjà signalé, les DSI des entreprises ralentissent l’IA générative. L’une des raisons à cela est que l’IA ne s’intègre pas dans les flux de travail d’ingénierie logicielle existants, car elle ne parle littéralement pas le même langage. Par exemple, les LLM (alias grands modèles de langage) nécessitent beaucoup de cajoleries pour fournir un JSON valide.

C’est là qu’une startup basée aux États-Unis a appelé Dottxt arrive, avec la promesse de « faire parler l’IA à l’ordinateur ». L’entreprise est dirigée par l’équipe derrière le projet open source Grandes lignesqui aide les développeurs à obtenir ce dont ils ont besoin de ChatGPT et d’autres modèles d’IA générative sans avoir à recourir à des tactiques grossières comme l’injection de chantage émotionnel dans les invites (« écrivez le code ou le chaton l’obtiendra ! »).

Des bibliothèques de logiciels telles que Outlines, une bibliothèque Python ou Microsoft’s Guidance, ou LMQL (alias Language Model Query Language), permettent de guider les LLM d’une manière plus sophistiquée qu’un simple piratage rapide – en utilisant une approche connue sous le nom de génération structurée (ou génération parfois contrainte).

Comme son nom l’indique, la technique se concentre sur le résultat des LLM, plus que sur l’entrée. Ou, en d’autres termes, il s’agit de dire aux modèles d’IA comment pour répondre, déclare Rémi Louf, PDG de Dottxt.

L’approche « permet de revenir à un flux de travail d’ingénierie traditionnel », a-t-il déclaré à TechCrunch. « Vous affinez la grammaire jusqu’à ce que vous ayez raison. »

Dottxt vise à créer une solution de génération structurée puissante en étant indépendante du modèle et en offrant plus de fonctionnalités – et, dit-il, de meilleures performances – que le projet open source (Outlines) dont il est né.

Louf, un Français titulaire d’un doctorat et de plusieurs diplômes, a une formation en statistiques bayésiennes, tout comme plusieurs autres membres de l’équipe Dottxt. Cet ancrage dans la théorie des probabilités leur a probablement ouvert les yeux sur le potentiel de la génération structurée. La familiarité avec l’informatique au-delà de l’IA a également joué un rôle dans leur décision de créer une entreprise dont l’objectif est d’aider les autres à exploiter utilement l’IA générative.

La référence de Louf à la grammaire n’est pas un hasard. Dottxt est basé sur le principe selon lequel la plupart du texte avec lequel nous interagissons est fortement structuré. Il y a du code, bien sûr, mais aussi de nombreux autres modèles que les LLM devraient être capables de suivre pour être réellement utiles dans les environnements de travail.

Le créateur de GPT, OpenAI, a récemment introduit une forme de génération structurée qu’il appelle Structured Outputs – et il a fait un signe de tête aux Outlines dans le cadre de son « inspiration ».

Louf, quant à lui, considère la popularité d’Outlines comme le signe qu’il existe une demande pour une autre approche flexible, avec plus de cloches et de sifflets. Et les investisseurs semblent être d’accord : Dottxt a levé 11,9 millions de dollars en quelques mois.

La startup a lancé un tour de pré-amorçage de 3,2 millions de dollars dirigé par la société de capital-risque de technologie profonde Elaia en 2023, suivi d’un amorçage de 8,7 millions de dollars dirigé par EQT Ventures en août dernier. Entre-temps, Louf et ses cofondateurs se sont efforcés de prouver que leur approche n’a pas d’impact sur les performances. Pendant cette période, la demande d’Outlines open source a explosé ; ils disent qu’il a été téléchargé plus de 2,5 millions de fois, ce qui les a encouragés à voir grand.

La collecte de fonds supplémentaires était logique pour une autre raison : les cofondateurs de Dottxt savaient désormais qu’ils voulaient utiliser cet argent pour embaucher davantage de personnes afin de pouvoir répondre à la demande croissante d’outils de génération structurés. L’équipe entièrement distante de la startup atteindra un effectif de 17 personnes à la fin du mois, contre huit personnes en juin, selon Louf.

Les nouveaux membres du personnel comprennent deux professionnels DevRel (relations avec les développeurs), ce qui reflète la priorité de Dottxt en matière de création d’écosystème. « Notre objectif au cours des 18 prochains mois est d’accélérer l’adoption, plus que l’aspect commercial », a déclaré Louf. Cependant, il a également déclaré que la commercialisation devrait toujours commencer dans les six prochains mois, en mettant l’accent sur les entreprises clientes.

Cela pourrait potentiellement être une approche risquée si le battage médiatique sur l’IA est terminé au moment où Dottxt cherche plus de financement. Mais la startup est convaincue qu’il y a de la substance derrière la bulle ; son espoir est précisément d’aider les entreprises à tirer une réelle valeur de l’IA.

Julien Chaumond, CTO de Hugging Face, investisseur dans Dottxt, a récemment surnommé la génération structurée «l’avenir des LLM.» Le battage médiatique s’étend donc également à ce segment de la pile technologique GenAI.

Avec d’autres vents favorables tels que les agents IA et la montée en puissance de modèles d’IA plus petits, le pari d’adoption de Dottxt pourrait s’avérer payant. « Dans quelques années, tout le monde utilisera la génération structurée, cela ne fait aucun doute », prédit Louf.

Source link