AccueilDecart lance Oasis 3 : un modèle de monde photoréaliste pour la conduite autonome — avec des limitations notables.

Decart lance Oasis 3 : un modèle de monde photoréaliste pour la conduite autonome — avec des limitations notables.

Auteur:bitcoinworld

BitcoinWorld

Decart lance Oasis 3 : un modèle de monde photoréaliste pour la conduite autonome — avec des limitations notables

La startup d'IA Decart a publié Oasis 3, un modèle de monde interactif capable de générer en temps réel des environnements de conduite photoréalistes, disponible via API. L'entreprise cible les développeurs de véhicules autonomes qui ont besoin de simuler à grande échelle des scénarios de conduite rares ou dangereux, avec l'intention de s'étendre à la robotique et aux applications d'IA physique. Le modèle, que Decart affirme être le premier modèle de monde exploitable sur lequel les développeurs peuvent programmer, représente une avancée importante dans l'évolution de l'IA générative pour les environnements physiques.

Ce que propose Oasis 3 et son fonctionnement Oasis 3 génère des environnements physiquement précis, à plusieurs caméras — une caméra frontale et deux caméras latérales — conçus pour l'entraînement et le test de systèmes autonomes. Contrairement aux aperçus de recherche limités de ses concurrents, Decart permet aux développeurs de générer des scénarios à l'infini, une fonctionnalité particulièrement précieuse pour les tests de cas limites. Le modèle est tarifé à 0,02 $ par seconde de simulation, avec des prix d'entreprise variables selon le cas d'usage. Decart indique disposer d'une communauté de plus de 100 000 développeurs qui utilisent déjà son modèle vidéo en temps réel Lucy, et s'attend à ce qu'Oasis 3 attire un écosystème similaire.

L'avantage d'efficacité de la startup provient de son logiciel DOS (Decart Optimization Stack), qui optimise les modèles pour fonctionner sur le matériel Nvidia, Amazon et Google, rendant l'inférence bien moins coûteuse que celle des concurrents. Decart affirme que ses modèles sont plus d'un ordre de grandeur moins chers à exécuter que tout autre modèle du secteur, et qu'elle a dépensé bien moins de 100 millions de dollars au cours de son existence.

Performances et limitations lors des tests Dans des tests pratiques, Oasis 3 a produit des scènes initiales impressionnantes à partir d'une simple invite textuelle — par exemple, une rue de New York le matin apparaissait photoréaliste et détaillée. Cependant, la cohérence du modèle s'est rapidement détériorée au fil de la simulation. En avançant, l'environnement a perdu son identité spécifique pour devenir une scène urbaine générique. Tenter de revenir au point de départ a révélé que le monde avait été entièrement remplacé, soulignant l'absence de mémoire spatiale persistante.

Les contrôles étaient également parfois non réactifs, et la voiture traversait d'autres véhicules, indiquant que le modèle ne simule pas encore correctement la physique. Dean Leitersdorf, cofondateur et PDG de Decart, a décrit cela comme un problème de recherche majeur, l'attribuant à un déséquilibre des données — il existe beaucoup plus de données sur la conduite correcte que sur les accidents. Le modèle est auto‑régressif, générant une image à la fois en se référant aux images précédentes, ce qui remplit rapidement sa fenêtre de contexte. L'équipe travaille à étendre la mémoire afin de maintenir la cohérence sur des simulations plus longues.

Contexte industriel et concurrence Decart entre dans un domaine très concurrentiel. Google a publié Genie 3 en aperçu de recherche l'année dernière, World Labs de Fei‑Fei Li a lancé Marble pour un usage commercial, et des startups de génération vidéo comme Luma et Runway transforment leurs modèles vidéo sensibles à la physique en modèles de monde. L'avantage d'Oasis 3 réside dans son photoréalisme et sa capacité de génération infinie, mais il partage des limitations communes avec ses rivaux, notamment une cohérence à long terme incohérente et un manque de conscience des objets.

Cette sortie intervient quelques semaines après que Decart a levé 300 millions de dollars à une valorisation proche de 4 milliards de dollars, avec des investisseurs stratégiques tels que Toyota, Adobe, eBay et Nvidia. Ces investisseurs sont également des clients potentiels, en particulier pour les applications de véhicules autonomes et de robotique.

Pourquoi cela importe Les modèles de monde sont une frontière critique de l'IA, avec le potentiel de révolutionner la façon dont les machines apprennent à interagir avec les environnements physiques. Pour les entreprises de véhicules autonomes, la capacité de simuler à grande échelle des cas limites rares pourrait accélérer le développement et améliorer la sécurité. La décision de Decart d'offrir un accès API dès le premier jour reflète la stratégie initiale d'OpenAI avec les modèles de langage, visant à construire un écosystème de développeurs qui découvrent et créent des applications novatrices. Si le projet réussit, Oasis 3 pourrait devenir une plateforme fondamentale pour l'IA physique, tout comme GPT‑3 l'a été pour les tâches de langage.

Conclusion Oasis 3 de Decart représente une avancée significative dans la modélisation de mondes photoréalistes, offrant une efficacité inégalée et une génération infinie pour les simulations de conduite autonome. Cependant, des limitations importantes subsistent en termes de cohérence à long terme, de simulation physique et de conscience des objets. Le domaine en est encore à ses débuts, et le vrai test sera de voir si la communauté de développeurs peut transformer ces capacités en applications pratiques et fiables. Decart prévoit de résoudre les problèmes de cohérence dans la prochaine version, qui permettra aux utilisateurs de semer les mondes à partir de vidéos plutôt que d'une seule image.

FAQ Q1 : Qu'est‑ce qu'Oasis 3 et à qui s'adresse‑t‑il ? Oasis 3 est un modèle de monde interactif de la startup d'IA Decart qui génère des environnements de conduite photoréalistes en temps réel. Il est conçu pour les développeurs de véhicules autonomes qui ont besoin de simuler à grande échelle des scénarios de conduite rares, et il est disponible via API.

Q2 : Comment Oasis 3 se compare‑t‑il à d'autres modèles de monde comme Genie 3 de Google ? Oasis 3 offre un photoréalisme supérieur et une capacité de génération infinie, mais partage des limitations communes avec les concurrents, notamment la dégradation de la cohérence des scènes au fil du temps et l'absence de précision physique pour les interactions d'objets.

Q3 : Quelles sont les principales limitations d'Oasis 3 ? Le modèle a du mal à maintenir la cohérence à long terme — les environnements perdent leur spécificité après une utilisation prolongée — et ne simule pas correctement la physique, ce qui fait que les véhicules traversent les uns les autres. Les contrôles peuvent également être non réactifs.

Ce billet Decart lance Oasis 3 : un modèle de monde photoréaliste pour la conduite autonome — avec des limitations notables est apparu pour la première fois sur BitcoinWorld.