Cerebras、マルチモーダルAIモデルGemma 4を高速推論プラットフォームで提供開始、毎秒1,500トークン超を実現

2026年6月20日

Cerebras アメリカ

概要

Cerebrasは、同社の推論プラットフォームでマルチモーダルAIモデルGemma 4のプライベートプレビューを開始し、今月末には一般提供を開始すると発表しました。このGemma 4は、Google DeepMindのオープンウェイトGemmaファミリーのフラッグシップモデルであり、品質と効率のために構築された高密度マルチモーダルモデルです。Cerebras Inference上で毎秒1,500トークンを超える速度で実行され、コンピュータ使用から画像駆動型のエージェントワークフローまで、新しい種類のアプリケーションを可能にします。この高速性能は、特にリアルタイム性が求められるAIアプリケーションにおいて重要な意味を持ちます。

詳細

主要成果

Cerebrasは、同社の革新的な推論プラットフォーム上で、Google DeepMindのフラッグシップマルチモーダルAIモデル「Gemma 4」をプライベートプレビューとして提供開始しました。このモデルは今月末には一般提供される予定です。Gemma 4は、Cerebras Inferenceシステム上で毎秒1,500トークンを超える驚異的な速度で推論を実行できることが実証されており、従来のテキストベースのアプリケーションだけでなく、画像駆動型のエージェントワークフローなど、まったく新しい種類のAIアプリケーションを可能にします。このブレークスルーは、AI推論の速度と効率に関する新たな業界ベンチマークを打ち立てます。

技術・臨床詳細

Gemma 4は、Google DeepMindによって開発されたオープンウェイトGemmaファミリーの最新かつ最も高性能なマルチモーダルモデルです。その「高密度マルチモーダル」設計は、複数のモダリティ（テキスト、画像、音声など）からの情報を統合し、より包括的で精度の高い理解と生成を可能にします。Cerebrasのワシントン・プロセッサ（WSE-3）を搭載したCerebras Inferenceプラットフォームは、Gemma 4の超高速推論を実現する鍵です。

超高速推論速度: Cerebras Inference上で毎秒1,500トークン以上という速度は、特に大規模なAIモデルにおいて、ほぼリアルタイムでの応答を可能にします。これは、顧客サービス、リアルタイム分析、エッジAIアプリケーションにとって極めて重要です。
マルチモーダル能力: テキストと画像を同時に理解し、関連付ける能力は、単一モダリティモデルでは不可能だった複雑なタスクを開放します。例えば、視覚情報に基づいてテキストを生成したり、テキストプロンプトで画像を操作したりすることが可能になります。
高密度設計: Gemma 4は、その品質と効率を最適化するために高密度で設計されており、限られた計算リソースで最大限のパフォーマンスを引き出すように工夫されています。
スケーラビリティ: Cerebrasのハードウェアアーキテクチャは、大規模なAIモデルの展開とスケーリングに特化しており、Gemma 4のような複雑なモデルを効率的に処理できます。

この技術は、特にエージェント型AIの発展に貢献し、AIが物理世界とよりインテリジェントに相互作用する新たなアプリケーションの道を拓きます。

背景・業界文脈

AIの活用が広がるにつれて、モデルの推論速度は、ユーザー体験とアプリケーションの実現可能性を決定する重要な要素となっています。特に生成AIや自律型エージェントでは、リアルタイムまたはそれに近い応答性が求められるため、高速な推論は不可欠です。Cerebrasは、その独自のウェハーサイズスケール集積（WSE）チップ技術により、AIワークロードの高速化に特化してきました。Gemma 4とCerebrasのプラットフォームの組み合わせは、従来のGPUベースのシステムに比べて、より効率的で高速なAI推論ソリューションを提供することで、AIインフラのボトルネックを解消することを目指しています。Google DeepMindが開発したGemmaファミリーは、より多くの開発者が高品質なAIモデルを利用できるようにするためのオープンウェイト戦略の一環であり、Cerebrasとの提携は、その普及と性能向上に貢献します。

今後の展望

CerebrasとGemma 4の組み合わせは、AIアプリケーションの新たなフロンティアを開拓する可能性を秘めています。特に、画像駆動型エージェントや、リアルタイムでのマルチモーダルインタラクションが可能なシステムは、スマートアシスタント、医療診断、ロボティクス、自動運転など、多様な分野で革新的なユースケースを生み出すでしょう。この技術は、企業がAIをより深くビジネスプロセスに統合し、競争優位性を確立するための重要なツールとなることが期待されます。今後、CerebrasはGemma 4の一般提供を通じて、より広範な開発者コミュニティがこの高速マルチモーダル推論の恩恵を享受できるよう支援していく方針です。

元記事: https://www.cerebras.ai/blog/gemma-4-on-cerebras-the-fastest-inference-is-now-multimodal

毎週の技術動向レポートを無料でお届け

各分野の分析レポートを読む価値があるかどうか一目で判断できるインフォグラフィックをメールで受け取れます。

📢 メールマガジンに無料登録（週刊・技術動向レポート）

ご登録いただくと、Troy-Technical から週刊で技術動向レポート（メールマガジン）をお届けします。