Dans l’Omniverse : les modèles de fondation open-world créent des mondes synthétiques pour le développement de l’IA physique

Bienvenue dans le monde fascinant de l’intelligence artificielle physique, où la simulation et la réalité convergent grâce à des outils de pointe comme NVIDIA Omniverse. Cet article explore comment les « Open World Foundation Models » (WFMs) génèrent des mondes synthétiques pour le développement de l’IA physique, ouvrant de nouvelles perspectives pour des applications allant de la robotique à la logistique. L’IA physique, qui alimente les robots, les véhicules autonomes et autres machines intelligentes, nécessite des données du monde réel pour apprendre. Cependant, collecter ces données est souvent complexe, coûteux et parfois dangereux. La génération de données synthétiques physiquement réalistes offre une solution prometteuse, permettant aux développeurs de former et de tester leurs modèles d’IA dans des environnements contrôlés et évolutifs. NVIDIA, un acteur majeur dans ce domaine, a récemment mis à jour ses WFMs NVIDIA Cosmos, accélérant ainsi la génération de données pour l’IA physique. Ces avancées, basées sur la plateforme NVIDIA Omniverse et le standard OpenUSD, ouvrent des possibilités inédites pour les développeurs et les entreprises. Examinons de plus près ces technologies et leurs applications concrètes.

NVIDIA Cosmos : La Génération de Mondes Synthétiques à Grande Échelle

Au cœur de cette révolution se trouvent les WFMs NVIDIA Cosmos. Ces modèles permettent de générer des données synthétiques à une échelle impressionnante, ouvrant la voie à des simulations photoréalistes et à une réduction significative de l’écart entre la simulation et la réalité. Cosmos Predict 2.5, par exemple, unifie trois modèles distincts (Text2World, Image2World et Video2World) en une seule architecture légère. Cela permet de générer des vidéos multicaméras cohérentes et contrôlables à partir d’une seule image, d’une vidéo ou d’une simple invite.

Cosmos Transfer 2.5, quant à lui, facilite le transfert de style entre les mondes, permettant aux développeurs d’ajouter de nouvelles conditions météorologiques, d’éclairage et de terrain à leurs environnements simulés. Cette version est 3,5 fois plus petite que la précédente, offrant des performances plus rapides, une meilleure alignement des invites et une plus grande précision physique. Ces WFMs s’intègrent parfaitement dans les pipelines de données synthétiques exécutés dans le framework de simulation robotique open-source NVIDIA Isaac Sim, construit sur la plateforme NVIDIA Omniverse, pour créer des vidéos photoréalistes. Ces outils permettent de créer des environnements virtuels extrêmement fidèles, réduisant ainsi les limitations inhérentes à la collecte de données réelles.

Image article

De la Simulation à la Réalité : Applications Concrètes

De nombreuses entreprises de pointe dans le domaine de la robotique et de l’IA exploitent déjà ces technologies pour accélérer le développement de l’IA physique. Skild AI, par exemple, utilise Cosmos Transfer pour enrichir ses données existantes avec de nouvelles variations, facilitant ainsi les tests et la validation des politiques robotiques entraînées dans NVIDIA Isaac Lab. En combinant les capacités de simulation robotique d’Isaac Lab avec la génération de données synthétiques de Cosmos, Skild AI peut entraîner des cerveaux robotiques dans diverses conditions sans les contraintes de temps et de coûts liées à la collecte de données réelles.

Serve Robotics, quant à elle, s’appuie sur des données synthétiques générées à partir de milliers de scénarios simulés dans NVIDIA Isaac Sim. Ces données sont ensuite utilisées conjointement avec des données réelles pour entraîner des modèles d’IA physique. L’entreprise a ainsi constitué l’une des plus grandes flottes de robots autonomes opérant dans l’espace public, réalisant plus de 100 000 livraisons de repas en milieu urbain. Les robots de Serve collectent chaque mois 1 million de miles de données, dont près de 170 milliards d’échantillons image-lidar, utilisés en simulation pour améliorer davantage les modèles robotiques. Cette approche permet d’accélérer le développement, les tests et le déploiement de leurs robots de livraison de trottoir. Serve Robotics a même utilisé ses robots pour livrer des superordinateurs d’IA personnels NVIDIA DGX Spark à des personnalités comme Refik Anadol et Will.I.AM. Zipline, une entreprise de livraison par drone, a également participé à cette initiative, soulignant l’impact croissant de l’IA et de la simulation dans divers secteurs.

Image article

D’autres exemples incluent Lightwheel, qui utilise des actifs SimReady et des ensembles de données synthétiques à grande échelle pour combler le fossé entre la simulation et la réalité, et Santiago Villa, qui utilise les bibliothèques Omniverse et le logiciel Blender pour améliorer les opérations minières en identifiant les gros rochers. FS Studio a collaboré avec un leader mondial de la logistique pour améliorer la détection de colis basée sur l’IA, et Robots for Humanity a construit un environnement de simulation complet dans Isaac Sim pour un client du secteur pétrolier et gazier. Ces cas d’utilisation démontrent la polyvalence et l’efficacité des données synthétiques dans divers domaines.

Perspectives d’Avenir et Ressources

L’utilisation de la génération de données synthétiques pour l’IA physique est en pleine expansion. Avec les avancées continues dans les WFMs et les outils comme NVIDIA Omniverse, les développeurs peuvent s’attendre à des simulations encore plus réalistes et à des modèles d’IA plus performants. Les avantages sont nombreux : réduction des coûts, accélération du développement, et la possibilité de tester des scénarios complexes et dangereux en toute sécurité.

Image article

Pour ceux qui souhaitent approfondir leurs connaissances, NVIDIA propose de nombreuses ressources, notamment le parcours d’apprentissage « Getting Started With Isaac Sim », le flux de travail de référence pour la génération de données synthétiques, et le NVIDIA Cosmos Cookbook. Pour rester informé des dernières actualités, il est conseillé de s’abonner aux actualités NVIDIA Omniverse et de rejoindre la communauté Omniverse via Discord, Instagram, LinkedIn, Threads, X et YouTube. L’exploration de l’Alliance for OpenUSD et du site web AOUSD est également recommandée. Ces ressources permettent aux développeurs et aux passionnés de se familiariser avec les technologies et de contribuer à l’avenir de l’IA physique.

Conclusion

La génération de données synthétiques, grâce à des outils comme NVIDIA Omniverse et les WFMs NVIDIA Cosmos, est en train de transformer le développement de l’IA physique. En offrant des environnements de simulation réalistes et évolutifs, ces technologies permettent d’accélérer l’innovation dans des domaines aussi variés que la robotique, la logistique et l’exploration spatiale. L’avenir de l’IA physique est prometteur, et les avancées dans ce domaine continueront d’ouvrir de nouvelles possibilités pour les entreprises et les développeurs du monde entier.