
Les modèles fondamentaux mondiaux : la clé de l’IA physique
Dans le monde en constante évolution de l’IA, il devient crucial de développer des modèles capables de simuler et de prédire avec précision les résultats dans des environnements physiques réels. Ces modèles sont essentiels pour la prochaine génération de systèmes d’IA physiques.
L’importance des modèles fondamentaux mondiaux
Les modèles fondamentaux mondiaux (WFM) sont de puissants réseaux de neurones qui peuvent simuler des environnements physiques. Ils peuvent générer des vidéos détaillées à partir de données textuelles ou d’images, et prédire l’évolution d’une scène en combinant son état actuel (image ou vidéo) avec des actions (comme des invites ou des signaux de contrôle).
Selon Ming-Yu Liu, vice-président de la recherche chez NVIDIA, « les modèles fondamentaux mondiaux sont essentiels pour les développeurs d’IA physique. Ils peuvent imaginer de nombreux environnements différents et simuler le futur, ce qui nous permet de prendre de bonnes décisions basées sur cette simulation. »
Les avantages des WFM pour l’IA physique
- Génération de données synthétiques : Les WFM peuvent générer des données synthétiques, fournissant un ensemble de données riche et varié qui améliore le processus d’entraînement.
- Environnements de test virtuels : Les WFM offrent des environnements virtuels en 3D où les développeurs peuvent simuler et tester les systèmes d’IA physique dans un cadre contrôlé, sans les risques et les coûts associés aux essais dans le monde réel.
L’accès ouvert aux WFM
NVIDIA a annoncé NVIDIA Cosmos, une plateforme de WFM génératifs qui accélère le développement de systèmes d’IA physique tels que les robots et les voitures autonomes. La plateforme est conçue pour être ouverte et accessible, et comprend des WFM préentraînés, des tokeniseurs et des architectures auto-régressives.
Selon Liu, « avec ces modèles ouverts, les entreprises et les développeurs disposent de tous les ingrédients nécessaires pour construire des modèles à grande échelle. La plateforme ouverte offre également aux équipes la flexibilité d’explorer diverses options de formation et de réglage fin des modèles, ou de construire les leurs en fonction de besoins spécifiques. »
Les impacts des WFM sur les industries
Les WFM devraient améliorer les flux de travail et le développement de l’IA dans diverses industries. Liu voit des impacts particulièrement importants dans deux domaines :
- Voitures autonomes : Les WFM peuvent simuler des environnements qui permettent des tests et une optimisation complets. Par exemple, une voiture autonome peut être testée dans diverses conditions météorologiques simulées et scénarios de circulation pour s’assurer qu’elle fonctionne de manière sûre et efficace avant son déploiement sur les routes.
- Robotique : Les WFM peuvent simuler et vérifier le comportement des systèmes robotiques dans différents environnements pour s’assurer qu’ils effectuent les tâches de manière sûre et efficace avant leur déploiement.
NVIDIA collabore avec des entreprises pour aider à relever les défis du développement de l’IA physique et à faire progresser leurs systèmes. Liu conclut : « Nous sommes encore au début du développement des modèles fondamentaux mondiaux – ils sont utiles, mais nous devons les rendre plus utiles. Nous devons également étudier comment intégrer au mieux ces modèles dans les systèmes d’IA physique afin qu’ils puissent réellement leur être bénéfiques. »
Écoutez le podcast avec Ming-Yu Liu ou lisez la transcription.