Cadence, Dropbox, SAP et ServiceNow sont les premiers à accéder à NVIDIA NeMo Retriever pour optimiser la récupération sémantique pour une inférence IA précise
AWS re:Inventer—NVIDIA a annoncé aujourd’hui un microservice d’IA générative qui permet aux entreprises de connecter de grands modèles de langage personnalisés aux données d’entreprise afin de fournir des réponses très précises pour leurs applications d’IA.
NVIDIA NeMo™ Récupérateur — une nouvelle offre dans le NVIDIA NeMo famille de frameworks et d’outils pour créer, personnaliser et déployer des modèles d’IA générative – aide les organisations à améliorer leurs applications d’IA générative avec des solutions de niveau entreprise génération augmentée par récupération (RAG).
En tant que microservice de récupération sémantique, NeMo Retriever aide les applications d’IA générative à fournir des réponses plus précises grâce à des algorithmes optimisés par NVIDIA. Les développeurs utilisant le microservice peuvent connecter leurs applications d’IA aux données d’entreprise où qu’elles se trouvent dans les cloud et les centres de données. Il ajoute des capacités RAG optimisées par NVIDIA à Fonderies d’IA et fait partie du NVIDIA IA Entreprise plateforme logicielle, disponible en Marché AWS.
Cadence, Dropbox, SAP et ServiceNow font partie des pionniers travaillant avec NVIDIA pour intégrer des fonctionnalités RAG prêtes pour la production dans leurs applications et services d’IA générative personnalisés.
« Les applications d’IA générative dotées de capacités RAG sont la prochaine application phare de l’entreprise », a déclaré Jensen Huang, fondateur et PDG de NVIDIA. « Avec NVIDIA NeMo Retriever, les développeurs peuvent créer des chatbots, des copilotes et des outils de synthèse d’IA génératifs personnalisés qui peuvent accéder à leurs données d’entreprise pour transformer la productivité grâce à une intelligence d’IA générative précise et précieuse.
Les leaders mondiaux améliorent la précision du LLM avec NeMo Retriever
Cadence, leader en conception de systèmes électroniques, sert les entreprises des marchés de l’informatique hyperscale, des communications 5G, de l’automobile, de la téléphonie mobile, de l’aérospatiale, de la consommation et de la santé. L’entreprise travaille avec NVIDIA pour développer des fonctionnalités RAG pour les applications d’IA générative dans la conception électronique industrielle.
« L’IA générative introduit des approches innovantes pour répondre aux besoins des clients, telles que des outils permettant de découvrir les défauts potentiels dès le début du processus de conception », a déclaré Anirudh Devgan, président et PDG de Cadence. « Nos chercheurs travaillent avec NVIDIA pour utiliser NeMo Retriever afin d’améliorer encore la précision et la pertinence des applications d’IA générative afin de révéler les problèmes et d’aider les clients à commercialiser plus rapidement des produits de haute qualité. »
Déchiffrer le code pour des applications d’IA générative précises
Contrairement aux boîtes à outils RAG open source, NeMo Retriever prend en charge l’IA générative prête pour la production avec des modèles commercialement viables, une stabilité d’API, des correctifs de sécurité et une prise en charge d’entreprise.
Les algorithmes optimisés par NVIDIA fournissent les résultats les plus précis dans les modèles d’intégration de Retriever. Les modèles d’intégration optimisés capturent les relations entre les mots, permettant aux LLM de traiter et d’analyser les données textuelles.
Grâce à NeMo Retriever, les entreprises peuvent connecter leurs LLM à plusieurs sources de données et bases de connaissances, afin que les utilisateurs puissent facilement interagir avec les données et recevoir des réponses précises et à jour à l’aide d’invites conversationnelles simples. Les entreprises utilisant des applications basées sur Retriever peuvent permettre aux utilisateurs d’accéder en toute sécurité à des informations couvrant de nombreuses modalités de données, telles que du texte, des PDF, des images et des vidéos.
Les entreprises peuvent utiliser NeMo Retriever pour obtenir des résultats plus précis avec moins de formation, accélérer la mise sur le marché et soutenir l’efficacité énergétique dans le développement d’applications d’IA générative.
Déploiement fiable, simple et sécurisé avec NVIDIA AI Enterprise
Les entreprises peuvent déployer des applications basées sur NeMo Retriever pour les exécuter lors de l’inférence sur l’informatique accélérée par NVIDIA sur pratiquement n’importe quel centre de données ou cloud. NVIDIA AI Enterprise prend en charge l’inférence accélérée et hautes performances avec NVIDIA NeMo, Serveur d’inférence NVIDIA Triton™, NVIDIA TensorRT™, NVIDIA TensorRT-LLM et autre IA NVIDIA logiciel.
Pour maximiser les performances d’inférence, les développeurs peuvent exécuter leurs modèles sur Superpuces NVIDIA GH200 Grace Hopper avec logiciel TensorRT-LLM.
Disponibilité
Les développeurs peuvent s’inscrire accès anticipé à NVIDIA NeMo Retriever.