Trang chủDecart ra mắt Oasis 3: một mô hình thế giới cực thực cho lái xe tự động — với những hạn chế đáng chú ý

Decart ra mắt Oasis 3: một mô hình thế giới cực thực cho lái xe tự động — với những hạn chế đáng chú ý

Tác giả:bitcoinworld
Nguồn:bitcoinworld

BitcoinWorld

Decart ra mắt Oasis 3: mô hình thế giới ảnh thực cho lái tự động — với những hạn chế đáng chú ý

Startup AI Decart đã phát hành Oasis 3, một mô hình thế giới tương tác có khả năng tạo ra môi trường lái xe ảnh thực trong thời gian thực, có sẵn qua API. Công ty nhắm tới các nhà phát triển xe tự hành cần mô phỏng các kịch bản lái xe hiếm hoặc nguy hiểm ở quy mô lớn, và có kế hoạch mở rộng sang robot và các ứng dụng AI vật lý. Mô hình, mà Decart khẳng định là mô hình thế giới có thể sử dụng đầu tiên mà các nhà phát triển có thể lập trình lên trên, đánh dấu một bước tiến quan trọng trong sự phát triển của AI sinh ra cho môi trường vật lý.

Những gì Oasis 3 cung cấp và cách nó hoạt động Oasis 3 tạo ra các môi trường đa camera chính xác về mặt vật lý — một camera hướng về phía trước và hai camera hướng sang hai bên — được thiết kế để đào tạo và kiểm tra các hệ thống tự động. Khác với các bản xem trước nghiên cứu hạn chế của đối thủ, Decart cho phép các nhà phát triển tạo ra các kịch bản vô hạn, một tính năng đặc biệt có giá trị cho việc kiểm tra các trường hợp biên. Mô hình được định giá 0,02 USD cho mỗi giây mô phỏng, với mức giá doanh nghiệp tùy thuộc vào trường hợp sử dụng. Decart cho biết đã có cộng đồng hơn 100.000 nhà phát triển đang xây dựng trên mô hình video thời gian thực Lucy, và kỳ vọng Oasis 3 sẽ thu hút một hệ sinh thái tương tự.

Lợi thế về hiệu suất của startup đến từ phần mềm DOS (Decart Optimization Stack), tối ưu hóa mô hình để chạy trên phần cứng của Nvidia, Amazon và Google, làm cho việc suy luận rẻ hơn nhiều so với đối thủ. Decart khẳng định các mô hình của họ rẻ hơn hơn một bậc thang so với bất kỳ mô hình nào khác trong ngành, và họ đã tiêu tốn ít hơn đáng kể 100 triệu USD trong suốt thời gian hoạt động.

Hiệu năng và hạn chế trong thử nghiệm Trong các thử nghiệm thực tế, Oasis 3 tạo ra những cảnh ban đầu ấn tượng từ một lời nhắc văn bản duy nhất — ví dụ, một con phố New York vào buổi sáng xuất hiện với độ ảnh thực và chi tiết cao. Tuy nhiên, độ nhất quán của mô hình nhanh chóng giảm sút khi mô phỏng tiếp diễn. Khi lái xe, môi trường mất đi bản sắc cụ thể, trở thành một cảnh đô thị chung chung. Khi cố gắng quay lại điểm xuất phát, toàn bộ thế giới đã bị thay thế, cho thấy thiếu bộ nhớ không gian bền vững.

Điều khiển cũng đôi khi không phản hồi, và xe sẽ đi xuyên qua các phương tiện khác, chỉ ra rằng mô hình chưa mô phỏng vật lý một cách chính xác. Dean Leitersdorf, đồng sáng lập và CEO của Decart, mô tả đây là một vấn đề nghiên cứu lớn, do mất cân bằng dữ liệu — có rất nhiều dữ liệu về lái xe tốt nhưng ít dữ liệu về tai nạn. Mô hình là tự hồi quy, tạo ra một khung hình tại một thời điểm và dựa vào các khung hình trước, khiến cửa sổ ngữ cảnh nhanh chóng đầy. Nhóm đang làm việc để mở rộng bộ nhớ nhằm duy trì tính nhất quán trong các mô phỏng dài hơn.

Bối cảnh ngành và cạnh tranh Decart bước vào một lĩnh vực đã bão hòa. Google đã ra mắt Genie 3 trong bản xem trước nghiên cứu năm ngoái, World Labs của Fei‑Fei Li đã ra mắt Marble cho mục đích thương mại, và các startup tạo video như Luma và Runway đang chuyển các mô hình video có nhận thức vật lý sang mô hình thế giới. Ưu điểm của Oasis 3 nằm ở độ ảnh thực và khả năng tạo vô hạn, nhưng nó vẫn chia sẻ những hạn chế chung với các đối thủ, bao gồm độ nhất quán dài hạn không ổn định và thiếu nhận thức đối tượng.

Việc ra mắt này diễn ra chỉ vài tuần sau khi Decart huy động được 300 triệu USD với định giá gần 4 tỷ USD, với các nhà đầu tư chiến lược bao gồm Toyota, Adobe, eBay và Nvidia. Những nhà đầu tư này cũng là khách hàng tiềm năng, đặc biệt cho các ứng dụng xe tự hành và robot.

Tại sao điều này quan trọng Mô hình thế giới là một ranh giới quan trọng trong AI, với tiềm năng cách mạng hoá cách máy móc học tương tác với môi trường vật lý. Đối với các công ty xe tự hành, khả năng mô phỏng các trường hợp biên hiếm ở quy mô lớn có thể tăng tốc phát triển và nâng cao an toàn. Quyết định của Decart cung cấp truy cập API ngay từ ngày đầu phản ánh chiến lược sớm của OpenAI với các mô hình ngôn ngữ, nhằm xây dựng một hệ sinh thái nhà phát triển khám phá và tạo ra các ứng dụng mới. Nếu thành công, Oasis 3 có thể trở thành nền tảng nền tảng cho AI vật lý, tương tự như GPT‑3 đã làm cho các nhiệm vụ ngôn ngữ.

Kết luận Oasis 3 của Decart đại diện cho một bước tiến đáng kể trong mô hình thế giới ảnh thực, cung cấp hiệu suất vô song và khả năng tạo vô hạn cho các mô phỏng lái xe tự động. Tuy nhiên, vẫn còn những hạn chế đáng kể về độ nhất quán dài hạn, mô phỏng vật lý và nhận thức đối tượng. Lĩnh vực này vẫn còn mới, và thử thách thực sự sẽ là liệu cộng đồng nhà phát triển có thể biến những khả năng này thành các ứng dụng thực tiễn, đáng tin cậy hay không. Decart dự kiến sẽ giải quyết các vấn đề về tính nhất quán trong phiên bản tiếp theo, cho phép người dùng khởi tạo thế giới từ video thay vì một hình ảnh duy nhất.

Câu hỏi thường gặp Q1: Oasis 3 là gì và dành cho ai? Oasis 3 là một mô hình thế giới tương tác của startup AI Decart, tạo ra môi trường lái xe ảnh thực trong thời gian thực. Nó được thiết kế cho các nhà phát triển xe tự hành cần mô phỏng các kịch bản lái xe hiếm ở quy mô lớn, và có sẵn qua API.

Q2: Oasis 3 so sánh như thế nào với các mô hình thế giới khác như Genie 3 của Google? Oasis 3 cung cấp độ ảnh thực và khả năng tạo vô hạn vượt trội, nhưng vẫn chia sẻ những hạn chế chung với đối thủ, bao gồm sự suy giảm độ nhất quán của cảnh theo thời gian và thiếu độ chính xác vật lý trong tương tác đối tượng.

Q3: Những hạn chế chính của Oasis 3 là gì? Mô hình gặp khó khăn trong việc duy trì tính nhất quán lâu dài — môi trường mất đi tính đặc thù sau khi sử dụng kéo dài — và không mô phỏng vật lý một cách chính xác, gây ra việc các phương tiện xuyên qua nhau. Điều khiển cũng có thể không phản hồi.

Bài viết này Decart launches Oasis 3: a photorealistic world model for autonomous driving — with notable limitations lần đầu xuất hiện trên BitcoinWorld.