Ce n’est pas seulement OpenAIle monde des grands modèles de langage (LLM) après tout.

Certes, le GPT-4 d’OpenAI, son dernier modèle sorti en mars, est de loin supérieur sur le marché, en partie parce que son modèle est beaucoup plus vaste que ceux de ses concurrents. Le LLM d’OpenAI, qui alimente des chatbots comme ChatGPT, peut être appliqué pour fournir une grande quantité d’informations telles que les statistiques de baseball ou conseils de reprise. Mais dans un secteur en évolution rapide, les entreprises qui créent des applications d’IA diversifient leurs dépendances LLM, testant ainsi les limites de la domination d’OpenAI dans le secteur de l’IA générative.

Lorsqu’il s’agit de perturber l’OpenAI, « de nombreuses personnes intelligentes et disposant de beaucoup d’argent essaient, nous pouvons donc nous attendre à un changement l’année prochaine », a déclaré Alexandre Lebrun, PDG de Nabla, une startup basée à Paris qui construit un système de prise de notes sur l’IA. logiciel pour les paramètres cliniques.

Le marché croissant des prestataires LLM

Cela survient alors que les grandes entreprises technologiques comme Meta et Google proposent leurs propres LLM. Et aux côtés de nouveaux venus comme Anthropic, Stability AI, Mosaic, les entreprises d’IA disposent d’une multitude de modèles parmi lesquels choisir.

Compte tenu de la vitesse élevée du secteur de l’IA, les entreprises ont commencé à utiliser plusieurs LLM pour réduire les risques que d’autres acteurs deviennent meilleurs qu’OpenAI, et les positionnent pour s’adapter rapidement si cela devient le cas.

Par exemple, la société de télécommunications et de réseaux Cisco a des contrats avec plusieurs fournisseurs de LLM, dont OpenAI et Google, et elle est prête à en obtenir davantage. « Ce que nous constatons, c’est qu’il n’existe pas un seul modèle qui fonctionne bien pour chaque scénario », a déclaré à Quartz Anurag Dhingra, directeur de la technologie de Cisco. Il a ajouté que Cisco teste régulièrement les LLM pour voir leurs performances. Pour résumer les cas d’utilisation, par exemple, l’entreprise opte pour GPT 3.5. Mais pour évaluer les tendances des appels des clients, un modèle plus petit suffit ; l’entreprise utilise ses propres modèles ou des modèles open source qu’elle peaufine.

“Au lieu d’en choisir un [model] et disant que c’est le Un anneau pour les gouverner tous, nous adoptons une approche plus flexible », a déclaré Dhingra.

Cisco n’est que l’une des nombreuses entreprises utilisant l’IA qui ont développé leurs produits dans un souci de flexibilité. Ce qu’il faut retenir : si un LLM surpasse les autres en qualité, il peut facilement connecter le nouveau modèle à son produit d’IA pour rester compétitif.

Des modèles moins chers de sociétés comme Meta et Mosaic sont sur le marché

Pour d’autres entreprises, en particulier les startups à court d’argent qui utilisent des LLM pour alimenter leurs produits, il s’agit d’économiser de l’argent, d’autant plus que la formation de modèles d’IA peut entraîner des coûts de calcul élevés. C’est le cas des startups à court d’argent comme Numerade, une société d’éducation en ligne basée à Los Angeles qui construit un tuteur en IA.

Pour réduire les coûts, ces entreprises utilisent souvent un mélange de fournisseurs LLM moins chers que ceux d’OpenAI, puis les ajustent pour répondre à leurs besoins. C’est particulièrement efficace lorsqu’une entreprise dispose de données exclusives, a déclaré Alex Lee, CTO de Numerade, qui utilise un mélange de fournisseurs LLM, notamment Google, Meta, Mosaic, Anthropic, entre autres.

Forte demande pour les services d’OpenAI

Il existe également des préoccupations plus immédiates à résoudre, comme les limitations de capacité pour la formation des modèles d’IA.

Par exemple, avec la forte demande pour le GPT-4 d’OpenAI, les serveurs peuvent atteindre leur pleine capacité, ce qui nécessite des GPU supplémentaires pour fonctionner efficacement – et tous les chemins mènent à Nvidia – qui a fait ses preuves. problème de propre demande. Et lorsqu’une startup fait évoluer sa clientèle, garantir un accès ininterrompu à GPT-4 devient crucial. Dans ces situations, les entreprises se retrouvent à travailler leurs relations avec de plus grandes entreprises, comme Microsoft, qui héberge le modèle d’OpenAI, pour garantir une capacité supplémentaire.

“[If] “Vous êtes HP ou IBM ou un client très important, vous obtenez ce que vous voulez pour vos employés chez Microsoft, mais si vous n’êtes qu’une entreprise normale, il peut être très, très difficile d’obtenir la bonne capacité”, a déclaré Lebrun. dit. Pour éviter une surcharge de capacité, l’entreprise utilise des LLM open source de Meta et Mistral.

Il a ajouté que l’utilisation de différents modèles protège contre le risque d’augmentations de prix futures de la part d’OpenAI, qui pourrait commencer à augmenter les tarifs lorsque la concurrence commencera à rattraper son retard.