NVIDIA : nouveaux modèles IA et outils pour les développeurs, l’écosystème des véhicules autonomes passe à la vitesse supérieure.

L’industrie des véhicules autonomes (AV) franchit un nouveau cap. NVIDIA, leader incontesté dans le domaine de l’intelligence artificielle pour l’automobile, vient de dévoiler de nouveaux modèles d’IA et des outils de développement révolutionnaires. Ces avancées visent à accélérer le développement des architectures AV de nouvelle génération, en particulier en améliorant la génération de données synthétiques. L’objectif est clair : rendre les voitures autonomes plus sûres, plus performantes et plus rapidement disponibles pour le grand public.

Cette annonce marque une étape cruciale dans l’évolution des systèmes AV, passant d’architectures composées de plusieurs modèles distincts à une approche unifiée et « end-to-end ». Cette transition, qui exécute les actions de conduite directement à partir des données des capteurs, nécessite une quantité massive de données d’entraînement de haute qualité. NVIDIA répond à ce besoin croissant avec des solutions innovantes, propulsant l’industrie vers l’avenir de la conduite autonome.

Cosmos Predict-2 : Le Nouveau Modèle Fondateur pour la Génération de Données Synthétiques

Image article

Au cœur de cette annonce se trouve NVIDIA Cosmos Predict-2, un nouveau world foundation model conçu pour améliorer la prédiction des états futurs du monde et la génération de données synthétiques. NVIDIA définit les world foundation models comme des modèles d’IA capables de comprendre et de simuler le monde physique. Cosmos Predict-2 se distingue par une meilleure compréhension du contexte à partir des entrées textuelles et visuelles, ce qui se traduit par moins d’hallucinations et des détails plus riches dans les vidéos générées. Cette amélioration est cruciale pour la création de données synthétiques réalistes et pertinentes pour l’entraînement des systèmes AV.

L’utilisation des dernières techniques d’optimisation permet à Cosmos Predict-2 d’accélérer considérablement la génération de données synthétiques sur les systèmes NVIDIA GB200 NVL72 et NVIDIA DGX Cloud. Les modèles Cosmos post-entraînés sur les données AV permettent aux développeurs de générer des vidéos qui correspondent précisément aux environnements physiques existants et aux trajectoires des véhicules. De plus, ils peuvent transformer des vidéos mono-vues, comme des séquences de caméras embarquées, en vidéos multi-vues, offrant ainsi de nouvelles sources de données pour l’entraînement des systèmes AV.

De Nouvelles Outils et Microservices pour les Développeurs

En plus de Cosmos Predict-2, NVIDIA a également annoncé Cosmos Transfer, un aperçu de microservice NVIDIA NIM, pour un déploiement facile sur les GPU des centres de données. Ce microservice facilite l’augmentation des ensembles de données et la génération de vidéos photoréalistes à partir d’entrées structurées ou de simulations de vérité terrain de la plateforme NVIDIA Omniverse. De plus, le modèle NuRec Fixer aide à combler les lacunes et à résoudre les problèmes dans les données AV reconstruites.

CARLA, le principal simulateur AV open-source, a intégré Cosmos Transfer et NVIDIA NuRec, un ensemble d’API et d’outils pour la reconstruction et le rendu neuronal. Cela permet aux plus de 150 000 développeurs AV utilisant CARLA de générer des scènes et des points de vue de simulation synthétiques avec une grande fidélité, ainsi que de créer d’innombrables variations d’éclairage, de météo et de terrain grâce à de simples instructions. La génération de données synthétiques est un élément clé de la stratégie de NVIDIA pour l’AV, et ces outils en sont la preuve.

L’Écosystème AV Adopte et Accélère le Développement

Les entreprises leaders dans le domaine des AV intègrent déjà les modèles Cosmos pour accélérer le développement de leurs véhicules. Plus, un leader du camionnage autonome, utilise Cosmos Predict, post-entraîné sur des données de camionnage, pour générer des scénarios de conduite synthétiques réalistes. Oxa, une entreprise de logiciels AV, utilise également Cosmos Predict pour la génération de vidéos multi-caméras de haute fidélité et de cohérence temporelle.

Le NVIDIA Research team a post-entraîné les modèles Cosmos sur 20 000 heures de données de conduite réelles. En utilisant les modèles spécifiques aux AV pour générer des données vidéo multi-vues, l’équipe a amélioré les performances du modèle dans des conditions difficiles telles que le brouillard et la pluie. Ces avancées ont permis à NVIDIA de remporter pour la deuxième fois consécutive le End-to-End Autonomous Grand Challenge au CVPR, démontrant ainsi l’efficacité de cette approche.

Conclusion : Vers un Avenir plus Sûr et plus Rapide pour l’Autonomie

Les nouvelles annonces de NVIDIA, avec Cosmos Predict-2, les nouveaux outils et les microservices, représentent une avancée significative pour l’industrie des véhicules autonomes. En améliorant la génération de données synthétiques et en offrant des outils de développement plus performants, NVIDIA accélère le développement de systèmes AV plus sûrs et plus sophistiqués. Ces innovations promettent non seulement de rendre les voitures autonomes une réalité plus rapidement, mais aussi de renforcer la sécurité et la fiabilité de ces systèmes.

L’intégration de NVIDIA Halos, une plateforme de sécurité complète, avec les dernières avancées en matière d’IA, souligne l’engagement de l’entreprise à garantir la sécurité des systèmes AV. Avec des partenaires tels que Bosch et Nuro rejoignant l’AI Systems Inspection Lab, NVIDIA consolide sa position de leader dans l’industrie, ouvrant la voie à un avenir où la conduite autonome sera plus sûre, plus fiable et plus accessible à tous. La plateforme NVIDIA Cosmos est donc essentielle pour l’avenir de la conduite autonome.