Decart가 Oasis 3을 출시했습니다: 자율 주행을 위한 사진실감 세계 모델 — 눈에 띄는 제한 사항이 있습니다.

Decart가 Oasis 3을 출시했습니다: 자율 주행을 위한 사진실감 세계 모델 — 눈에 띄는 제한 사항이 있습니다.

작성자:bitcoinworld

BitcoinWorld

Decart, 포토리얼리스틱 자율주행용 월드 모델 Oasis 3 출시 — 주목할 만한 제한 사항 포함

AI 스타트업 Decart가 실시간으로 포토리얼리스틱한 주행 환경을 생성할 수 있는 인터랙티브 월드 모델인 Oasis 3를 API를 통해 공개했습니다. 이 회사는 대규모로 희귀하거나 위험한 주행 시나리오를 시뮬레이션해야 하는 자율주행 차량 개발자를 주요 고객으로 삼고 있으며, 로봇공학 및 물리 기반 AI 응용 분야로의 확장을 계획하고 있습니다. Decart가 주장하길, 이 모델은 개발자들이 그 위에 프로그래밍할 수 있는 최초의 실용적인 월드 모델이며, 물리적 환경을 위한 생성 AI 진화에 중요한 도약을 의미합니다.

Oasis 3가 제공하는 것과 작동 방식 Oasis 3는 물리적으로 정확한 다중 카메라 환경(전방 1대와 측면 2대)을 생성하여 자율 시스템의 훈련 및 테스트에 최적화되었습니다. 경쟁사의 제한된 연구 미리보기와 달리 Decart는 개발자가 시나리오를 무한히 생성할 수 있게 하여, 특히 엣지 케이스 테스트에 큰 가치를 제공합니다. 시뮬레이션 1초당 $0.02의 가격이 책정되어 있으며, 기업용 가격은 사용 사례에 따라 달라집니다. Decart는 이미 실시간 비디오 모델인 Lucy 위에 10만 명이 넘는 개발자가 구축하고 있다고 밝히며, Oasis 3 역시 유사한 생태계를 끌어들일 것으로 기대하고 있습니다.

이 스타트업의 효율성은 DOS(Decart Optimization Stack) 소프트웨어에서 비롯됩니다. DOS는 Nvidia, Amazon, Google 하드웨어에서 모델을 최적화해 추론 비용을 경쟁사보다 크게 낮춥니다. Decart는 자사의 모델이 업계 어느 모델보다 10배 이상 저렴하게 실행될 수 있다고 주장하며, 현재까지 누적 비용이 1억 달러에 훨씬 못 미친다고 전했습니다.

테스트에서 확인된 성능 및 제한 사항 직접 테스트한 결과, Oasis 3는 단일 텍스트 프롬프트만으로도 인상적인 초기 장면을 생성했습니다. 예를 들어 “아침의 뉴욕시 거리”라는 프롬프트는 포토리얼리스틱하고 디테일하게 나타났습니다. 하지만 시뮬레이션이 진행될수록 모델의 일관성이 급격히 떨어졌습니다. 주행을 계속하면 환경은 특정성을 잃고 일반적인 도시 풍경으로 변했습니다. 시작점으로 돌아가려 할 때는 세계가 완전히 다른 것으로 교체돼, 지속적인 공간 메모리가 부족함을 드러냈습니다.

조작이 때때로 반응하지 않았으며, 차량이 다른 차량을 통과하는 현상이 발생해 물리 시뮬레이션이 아직 정확하지 않음을 보여줍니다. Decart 공동창업자이자 CEO인 Dean Leitersdorf는 이를 “데이터 불균형” 문제로 설명했습니다—좋은 주행 데이터는 많지만 사고 데이터는 부족합니다. 모델은 자동 회귀 방식으로 한 프레임씩 생성하고 이전 프레임을 참고하는데, 이 과정에서 컨텍스트 창이 빠르게 채워집니다. 팀은 메모리를 확장해 장시간 시뮬레이션에서도 일관성을 유지하도록 작업 중입니다.

산업적 맥락 및 경쟁 상황 Decart는 경쟁이 치열한 시장에 진입했습니다. Google은 지난해 연구 미리보기 형태로 Genie 3를 공개했으며, Fei‑Fei Li의 World Labs는 상용 Marble을 출시했습니다. 또한 Luma와 Runway 같은 비디오 생성 스타트업도 물리 인식 비디오 모델을 월드 모델로 전환하고 있습니다. Oasis 3의 강점은 뛰어난 포토리얼리즘과 무한 생성 능력에 있지만, 경쟁사와 마찬가지로 장기 일관성 부족 및 객체 인식 한계라는 공통적인 제약을 가지고 있습니다.

이번 발표는 Decart가 최근 3억 달러를 유치해 기업가치 40억 달러에 근접한 시점에 이루어졌으며, 투자자에는 Toyota, Adobe, eBay, Nvidia 등이 포함됩니다. 이들 투자자는 자율주행 차량 및 로봇 분야의 잠재 고객이기도 합니다.

왜 중요한가 월드 모델은 AI의 핵심 전선으로, 물리적 환경과 상호작용하는 방식을 혁신할 잠재력을 가지고 있습니다. 자율주행 기업에게는 희귀 엣지 케이스를 대규모로 시뮬레이션할 수 있는 능력이 개발 속도를 높이고 안전성을 향상시킬 수 있습니다. Decart가 초기부터 API 접근을 제공하는 전략은 OpenAI가 언어 모델 초기에 취한 접근과 유사하며, 개발자 생태계를 조성해 새로운 응용 프로그램을 발굴하고 구축하도록 유도합니다. 성공한다면 Oasis 3는 물리 AI 분야에서 GPT‑3가 언어 작업에 끼친 영향과 같은 근본적인 플랫폼이 될 수 있습니다.

결론 Decart의 Oasis 3는 포토리얼리스틱 월드 모델링 분야에서 의미 있는 진전을 보여주며, 자율주행 시뮬레이션을 위한 탁월한 효율성과 무한 생성 능력을 제공합니다. 그러나 장기 일관성, 물리 시뮬레이션 정확도, 객체 인식 측면에서 여전히 큰 제한이 남아 있습니다. 이 분야는 아직 초기 단계이며, 진정한 시험은 개발자 커뮤니티가 이러한 기능을 실용적이고 신뢰할 수 있는 애플리케이션으로 전환할 수 있느냐에 달려 있습니다. Decart는 차기 버전에서 일관성 문제를 해결하고, 단일 이미지가 아닌 비디오를 통해 세계를 시드(seed)할 수 있게 할 계획입니다.

FAQ Q1: Oasis 3가 무엇이며 대상은 누구인가요? Oasis 3는 AI 스타트업 Decart가 만든 인터랙티브 월드 모델로, 실시간으로 포토리얼리스틱한 주행 환경을 생성합니다. 대규모로 희귀 주행 시나리오를 시뮬레이션해야 하는 자율주행 차량 개발자를 위해 설계되었으며, API를 통해 제공됩니다.

Q2: Oasis 3는 Google의 Genie 3와 어떻게 다른가요? Oasis 3는 뛰어난 포토리얼리즘과 무한 생성 능력을 제공하지만, 경쟁사와 마찬가지로 시간이 지남에 따라 장면 일관성이 저하되고 물리 정확도가 부족하다는 공통적인 제한을 가지고 있습니다.

Q3: Oasis 3의 주요 제한 사항은 무엇인가요? 모델은 장기 일관성 유지에 어려움을 겪으며(오랜 사용 시 환경이 구체성을 잃음), 물리 시뮬레이션이 정확하지 않아 차량이 서로 통과하는 현상이 발생합니다. 또한 조작이 때때로 반응하지 않을 수 있습니다.

이 게시물 Decart launches Oasis 3: a photorealistic world model for autonomous driving — with notable limitations은 최초로 BitcoinWorld에 게재되었습니다.