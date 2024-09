Une startup appelée Lire vient de sortir de la clandestinité avec une technologie qui aide les modèles d’IA à se souvenir des utilisateurs et des conversations. Créée dans la célèbre usine à startups des laboratoires de l’UC Berkeley, elle a également annoncé un capital d’amorçage de 10 millions de dollars dirigé par Astasia Myers de Felicis, pour une valorisation post-financement de 70 millions de dollars.

Letta est également soutenu par un who’s who d’investisseurs providentiels dans l’IA, comme Jeff Dean de Google, Clem Delangue de Hugging Face, Cristóbal Valenzuela de Runway et Robert Nishihara d’Anyscale, entre autres.

Fondée par les doctorants Sarah Wooders et Charles Packer de Berkeley, cette startup spécialisée dans l’IA est très attendue. En effet, elle est issue du Sky Computing Lab de Berkeley et est l’entité commerciale du célèbre projet open source MemGPT.

Le Sky Computing Lab de Berkeley, dirigé par le professeur de renom et cofondateur de Databricks Ion Stoica, est le descendant de RISELab et d’AMPLab, qui ont donné naissance à des entreprises telles qu’Anyscale, Databricks et SiFive. Sky Lab, en particulier, a donné naissance à de nombreux projets populaires de grands modèles de langage (LLM) open source comme le Gorilla LLM, le vLLM et le langage structuré LLM SGLang.

« Une tonne de projets ont vu le jour très rapidement, en l’espace d’un an. Il n’y avait que des gens assis à côté de nous », a décrit Wooders. « C’était donc une période incroyable. »

MemGPT est l’un de ces projets et il est tellement populaire qu’il est devenu viral avant même son lancement.

« Quelqu’un nous a devancés », a déclaré Packer à TechCrunch. Les fondateurs avaient a publié un livre blanc le jeudi 12 octobre 2023, et prévoyait de publier un article plus approfondi et le code sur GitHub le lundi suivant. Une personne au hasard a trouvé l’article, l’a publié sur Hacker News dimanche, et il « est devenu viral sur Hacker News avant que nous ayons eu la chance de publier correctement le code, de publier l’article ou, comme, de faire un fil de discussion sur Twitter ou quelque chose comme ça », a-t-il déclaré.

La raison de cet engouement est que MemGPT atténue un problème pernicieux pour les LLM : dans leur forme native, les modèles comme ChatGPT sont sans état, ce qui signifie qu’ils ne stockent pas de données historiques dans la mémoire à long terme. Cela pose problème pour les applications d’IA qui dépendent de la connaissance et de l’apprentissage d’un utilisateur au fil du temps, qu’il s’agisse de robots d’assistance client ou d’applications de suivi des symptômes des soins de santé. MemGPT gère les données et la mémoire de manière à ce que les agents d’IA et les chatbots puissent se souvenir des utilisateurs et des conversations précédents.

Packer a raconté que le message publié sur le journal est resté en tête d’affiche de Hacker News, le site populaire pour les programmeurs géré par Y Combinator, pendant 48 heures. Il a donc passé son week-end et les jours suivants à répondre à des questions sur le site tout en essayant de préparer le code pour sa publication. Une fois le projet disponible sur GitHub, un lien vers celui-ci est devenu viral sur Hacker News, une fois de plus. Entretiens sur YouTube et des tutoriels, Messages moyens, 11 000 étoiles et 1,2 K forks sur GitHub, c’est arrivé rapidement.

Myers, de VC Felicis, a également découvert Wooders et Packer en lisant des articles sur MemGPT et a immédiatement reconnu les possibilités commerciales de cette technologie.

« J’ai vu le document dès sa publication », a-t-elle déclaré à TechCrunch, et elle a rapidement contacté les fondateurs. « Nous avions un thème d’investissement autour de l’infrastructure des agents d’IA et nous avons compris qu’un élément vraiment important de cela était la gestion des données et de la mémoire pour rendre ces chatbots conversationnels et ces agents d’IA efficaces. »

Les fondateurs ont continué à se promener virtuellement sur Sand Hill Road pour passer des appels Zoom avec des capital-risqueurs avant de choisir celui qui les avait aimés en premier.

Pendant ce temps, Stoica a négocié des présentations à Dean, Nishihara et d’autres business angels de renom de la Silicon Valley. « De nombreux professeurs de Berkeley, simplement parce qu’ils sont à Berkeley, ont de très bonnes relations », se souvient Packer à propos de la facilité du processus de recrutement des business angels. « Ils ont les yeux rivés sur les projets de ce laboratoire qui vont être commercialisés. »

Concurrence et menace d’OpenAI o1

Bien que MemGPT soit déjà disponible et utilisé, la variante commerciale de Letta, Letta Cloud, n’est pas encore ouverte aux entreprises. Depuis lundi, Letta accepte les demandes d’utilisateurs bêta. Il offrira un service d’agent hébergé qui permettra aux développeurs de déployer et d’exécuter des agents avec état dans le cloud, accessibles via des API REST, une interface de programmation capable de maintenir l’état. Letta Cloud stockera les données à long terme nécessaires pour ce faire. Letta proposera également des outils de développement pour créer des agents d’IA.

Avec MemGPT, Wooders envisage un large éventail d’utilisations. « Je pense que le cas d’utilisation numéro un que nous voyons est essentiellement celui des chatbots hautement personnalisés et très engageants », dit-elle. Mais il existe également des utilisations de pointe comme « un chatbot pour les patients atteints de cancer », où les patients téléchargent leur historique puis partagent les symptômes en cours afin que le robot puisse apprendre et offrir des conseils au fil du temps.

Il convient de noter que MemGPT n’est pas le seul à travailler sur ce sujet. LangChain est probablement son concurrent le plus connu et propose déjà des options commerciales. Les plus grands créateurs de modèles proposent également des outils de création d’agents d’IA, comme l’API Assistants d’OpenAI.

Le nouveau modèle o1 d’OpenAI peut rendre la nécessité de corriger l’état discutable pour ses utilisateurs. Comme il s’agit d’un modèle à plusieurs étapes, il doit fondamentalement maintenir l’état dans une certaine mesure afin de « réfléchir » et de vérifier les faits avant de répondre.

Mais Wooders, Packer et Myers voient quelques différences clés entre ce que propose Letta et ce que fait OpenAI, le géant du marché de 360 ​​kilos. Letta affirme qu’il fonctionnera avec n’importe quel modèle d’IA et s’attend à ce que ses utilisateurs en utilisent un grand nombre : OpenAI, Anthropic, Mistral, leurs propres modèles maison. La technologie d’OpenAI ne fonctionne actuellement qu’avec elle-même.

Plus important encore, Letta utilise l’open source MemGPT et se lance fermement dans le débat open source entre FOSS et LLM en boîte noire, affirmant que l’open source est un meilleur choix pour les programmeurs d’applications d’IA.

« Nous nous positionnons comme une alternative ouverte à OpenAI », explique Packer. « Je pense qu’il est en fait très, très difficile de créer de très bonnes applications d’IA, surtout lorsque l’on se préoccupe, par exemple, des hallucinations, si l’on ne peut pas voir ce qui se passe sous le capot. »