BitcoinWorld
Decart meluncurkan Oasis 3: model dunia fotorealistik untuk mengemudi otonom — dengan keterbatasan yang signifikan
Startup AI Decart telah merilis Oasis 3, sebuah model dunia interaktif yang mampu menghasilkan lingkungan mengemudi fotorealistik secara real‑time, tersedia melalui API. Perusahaan menargetkan pengembang kendaraan otonom yang perlu mensimulasikan skenario mengemudi yang jarang atau berbahaya dalam skala besar, dengan rencana untuk memperluas ke bidang robotika dan aplikasi AI fisik. Model ini, yang diklaim Decart sebagai model dunia pertama yang dapat diprogram oleh pengembang, merupakan langkah penting dalam evolusi AI generatif untuk lingkungan fisik.
Apa yang ditawarkan Oasis 3 dan cara kerjanya Oasis 3 menghasilkan lingkungan multi‑kamera yang secara fisik akurat — satu kamera menghadap depan dan dua kamera menghadap sisi — dirancang untuk melatih dan menguji sistem otonom. Tidak seperti pratinjau riset terbatas dari pesaing, Decart memungkinkan pengembang menghasilkan skenario secara tak terbatas, sebuah fitur yang sangat berharga untuk pengujian kasus tepi. Model ini dibanderol $0,02 per detik simulasi, dengan harga enterprise tergantung pada kasus penggunaan. Decart mengatakan memiliki komunitas lebih dari 100.000 pengembang yang sudah membangun di atas model video real‑time Lucy, dan mengharapkan Oasis 3 menarik ekosistem serupa.
Keunggulan efisiensi startup ini berasal dari perangkat lunak DOS (Decart Optimization Stack), yang mengoptimalkan model untuk dijalankan di perangkat keras Nvidia, Amazon, dan Google, menjadikan inferensi jauh lebih murah dibandingkan pesaing. Decart mengklaim modelnya lebih dari satu urutan besaran lebih murah untuk dijalankan daripada model lain di industri, dan bahwa mereka telah menghabiskan jauh kurang dari $100 juta selama masa operasinya.
Kinerja dan keterbatasan dalam pengujian Dalam pengujian langsung, Oasis 3 menghasilkan adegan awal yang mengesankan dari satu prompt teks — misalnya, jalan di New York City pada pagi hari muncul dengan fotorealistik dan detail. Namun, koherensi model menurun dengan cepat seiring berjalannya simulasi. Saat mengemudi, lingkungan kehilangan identitas spesifiknya, menjadi adegan perkotaan generik. Mencoba kembali ke titik awal mengungkapkan bahwa dunia telah sepenuhnya diganti, menyoroti kurangnya memori spasial yang persisten.
Kontrol juga kadang tidak responsif, dan mobil dapat menabrak kendaraan lain, menunjukkan bahwa model belum mensimulasikan fisika secara akurat. Dean Leitersdorf, co‑founder dan CEO Decart, menyebut ini sebagai masalah riset utama, mengaitkannya dengan ketidakseimbangan data — ada jauh lebih banyak data tentang mengemudi yang baik dibandingkan kecelakaan. Model ini bersifat auto‑regressive, menghasilkan satu frame pada satu waktu dan melihat kembali frame sebelumnya, yang dengan cepat mengisi jendela konteksnya. Tim sedang bekerja memperpanjang memori agar konsistensi terjaga pada simulasi yang lebih lama.
Konteks industri dan kompetisi Decart masuk ke bidang yang sudah ramai. Google merilis Genie 3 dalam pratinjau riset tahun lalu, World Labs milik Fei‑Fei Li meluncurkan Marble untuk penggunaan komersial, dan startup video generation seperti Luma dan Runway sedang menerjemahkan model video yang sadar fisika menjadi model dunia. Keunggulan Oasis 3 terletak pada fotorealisme dan kemampuan generasi tak terbatas, namun ia berbagi keterbatasan umum dengan pesaingnya, termasuk koherensi jangka panjang yang tidak konsisten dan kurangnya kesadaran objek.
Rilis ini datang beberapa minggu setelah Decart mengumpulkan $300 juta dengan valuasi hampir $4 miliar, dengan investor strategis termasuk Toyota, Adobe, eBay, dan Nvidia. Investor‑investor ini juga berpotensi menjadi pelanggan, terutama untuk aplikasi kendaraan otonom dan robotika.
Mengapa ini penting Model dunia merupakan frontier kritis dalam AI, dengan potensi merevolusi cara mesin belajar berinteraksi dengan lingkungan fisik. Bagi perusahaan kendaraan otonom, kemampuan mensimulasikan kasus tepi yang jarang dalam skala besar dapat mempercepat pengembangan dan meningkatkan keselamatan. Keputusan Decart untuk menawarkan akses API sejak hari pertama meniru strategi awal OpenAI dengan model bahasa, bertujuan membangun ekosistem pengembang yang menemukan dan membangun aplikasi baru. Jika berhasil, Oasis 3 dapat menjadi platform dasar untuk AI fisik, serupa dengan peran GPT‑3 untuk tugas bahasa.
Kesimpulan Oasis 3 dari Decart merupakan langkah maju yang berarti dalam pemodelan dunia fotorealistik, menawarkan efisiensi tak tertandingi dan generasi tak terbatas untuk simulasi mengemudi otonom. Namun, masih terdapat keterbatasan signifikan pada koherensi jangka panjang, simulasi fisika, dan kesadaran objek. Bidang ini masih berada pada tahap awal, dan ujian sebenarnya adalah apakah komunitas pengembang dapat mengubah kemampuan ini menjadi aplikasi praktis yang handal. Decart berencana mengatasi masalah konsistensi pada versi berikutnya, yang akan memungkinkan pengguna menanamkan dunia dari video alih‑alih satu gambar tunggal.
FAQ Q1: Apa itu Oasis 3 dan untuk siapa? Oasis 3 adalah model dunia interaktif dari startup AI Decart yang menghasilkan lingkungan mengemudi fotorealistik secara real‑time. Model ini dirancang untuk pengembang kendaraan otonom yang perlu mensimulasikan skenario mengemudi yang jarang dalam skala besar, dan tersedia melalui API.
Q2: Bagaimana Oasis 3 dibandingkan dengan model dunia lain seperti Genie 3 milik Google? Oasis 3 menawarkan fotorealisme yang lebih tinggi dan kemampuan generasi tak terbatas, namun berbagi keterbatasan umum dengan pesaing, termasuk penurunan koherensi adegan seiring waktu dan kurangnya akurasi fisika pada interaksi objek.
Q3: Apa saja keterbatasan utama Oasis 3? Model ini mengalami kesulitan dengan konsistensi jangka panjang — lingkungan kehilangan spesifikasi setelah penggunaan lama — dan tidak mensimulasikan fisika secara akurat, sehingga kendaraan dapat menembus satu sama lain. Kontrol juga dapat tidak responsif.
Posting ini Decart meluncurkan Oasis 3: model dunia fotorealistik untuk mengemudi otonom — dengan keterbatasan yang signifikan pertama kali muncul di BitcoinWorld.
