中国の人工知能企業が、主要チャットボットに画像と動画の認識機能を追加しました。
同時に、国内のチップメーカーは、かつて米国が強みとしていた迅速なローンチサポートに匹敵できることを示しました。
杭州拠点のDeepSeekは、静かに「画像認識モード」という新機能をチャットプラットフォームに追加しました。この新モードは、同社が今月初めに発表した「expert」および「flash」の2つのモードに加わります。
この新機能により、チャットボットはテキストだけでなく写真や動画も理解できるようになります。
これにより、同様の機能を長らく提供している他の主要AIチャットボットと同等になります。
DeepSeekのマルチモーダルチームを率いる陳小康氏は、このツールがウェブサイトとモバイルアプリの両方で少数のユーザーを対象に最初にテストされたと述べました。
同社のシニアリサーチャーである陳德利氏は、短い投稿でローンチを祝いました、会社のロゴに言及した:「小さなクジラが今や見ることができる。」
画像・動画機能は、DeepSeekは最新フラッグシップモデルのプレビューを公開しました、DeepSeek-V4のプレビューを公開し、モデルの重みを誰でもダウンロードして使用できるようにした数日後に登場しました。
V4は1つのモデルではなく2つです。最初のDeepSeek-V4-Proは1.6兆パラメータを持ち、複雑な推論やマルチステップの自動化ワークフローを必要とする難しいタスク向けに設計されています。
2つ目のDeepSeek-V4-Flashは、低コストで多数のリクエストに対応できるよう構築されています。両モデルはコンテキストウィンドウをサポートしています100万トークンの。
また、同社は推論時に必要な計算リソースとメモリを削減するとするハイブリッドアテンション設計を採用しています。
中国のチップメーカーが新たなマイルストーンを達成 多くの業界関係者の注目を集めたのはモデル自体だけでなく、ローンチ当日に起きた出来事でした。
中国の4社、Huawei Ascend、Cambricon、Hygon Information、Moore Threadsは、リリース初日から自社ハードウェアがV4と完全に互換性があることを確認しました。
新モデルが発売直後にNVIDIA以外のチップ上でスムーズに動作する同日サポートは、これまでNvidiaのエコシステム外ではほぼ不可能とされていました。
HuaweiのAscendチップ(A2、A3、950を含む)は、V4-ProとV4-Flashの両方をサポートします。
同社は、Ascend 950チップが融合コンピューティングプロセスと並列処理ストリームを用いて推論を高速化していると述べました。
Cambriconは、オープンソースのvLLM推論フレームワークを使用して適応を完了し、コードをGitHubで共有しました。
Hygonは、DCUプラットフォーム上で深層モデル最適化を実施し、モデルリリースから実際の利用までのスムーズ
