Google AI Edge、LiteRT GPUアクセラレータでSamsung Galaxy S24上のオンデバイスAIを19.6msの低遅延で実現

2026年6月6日

Google AI Edge アメリカ

概要

Google AI Edgeは、LiteRT GPUアクセラレータの新たな進展を発表しました。これはまだオープンソース化されていないものの、KotlinおよびC++ SDKユーザー向けにプレビルド版として利用可能です。Samsung Galaxy S24デバイス上でのベンチマーク結果では、hf_mms_300mモデルで19.6msという低遅延を実現するなど、様々なモデルで効率的なGPUアクセラレーションとフルデリゲーションを示しています。この技術は、オンデバイスAIの性能を大幅に向上させます。

詳細

主要成果

Google AI Edgeは、オンデバイスAIの性能を飛躍的に向上させる新たなLiteRT GPUアクセラレータを発表しました。このアクセラレータは、まだオープンソース化されていないものの、KotlinおよびC++ SDKのユーザー向けにプレビルド版として提供されています。特に注目すべきは、Samsung Galaxy S24デバイス上でのベンチマーク結果で、hf_mms_300mモデルにおいてわずか19.6ミリ秒（ms）という極めて低い推論遅延を達成したことです。これは、様々なAIモデルで効率的なGPUアクセラレーションとフルデリゲーション（GPUに処理を完全に委譲すること）が実現できることを実証しています。

技術・臨床詳細

LiteRT GPUアクセラレータの核心は、モバイルデバイスのGPUリソースを最大限に活用し、AIモデルの推論を高速化する能力にあります。これにより、大規模な計算能力を必要とするAI処理をクラウドに依存することなく、デバイス上で直接実行することが可能になります。例えば、リアルタイムの画像認識、自然言語処理、音声アシスタント機能などが、ネットワーク遅延の影響を受けずに瞬時に応答できるようになります。19.6msという低遅延は、ユーザーエクスペリエンスを大幅に向上させ、より没入型で応答性の高いAIアプリケーションの実現を可能にします。フルデリゲーションは、モデルの計算グラフ全体をGPUで処理できることを意味し、CPUとの間でデータを頻繁にやり取りするオーバーヘッドを削減し、効率を最大化します。

背景・業界文脈

近年、プライバシー保護の強化、ネットワーク接続の信頼性への依存度低減、およびリアルタイム処理の要求から、AIワークロードをデバイス上で実行する「オンデバイスAI」への関心が高まっています。しかし、モバイルデバイスの限られた電力と熱設計制約の中で、複雑なAIモデルを効率的に実行することは大きな課題でした。LiteRT GPUアクセラレータは、これらの課題を克服するためのGoogleの重要な取り組みであり、モバイルAIの性能と応用の可能性を大きく広げるものです。これにより、スマートフォン、ウェアラブルデバイス、IoTデバイスなど、様々なエッジデバイスでより高度なAI機能が利用可能になることが期待されます。

今後の展望

LiteRT GPUアクセラレータの導入は、オンデバイスAIの新しい時代を切り開くでしょう。開発者は、この技術を活用して、ユーザーのプライバシーを保護しつつ、高速で応答性の高い革新的なAIアプリケーションを構築できるようになります。例えば、ローカルでのパーソナライズされた学習、オフラインでの高度な翻訳機能、より進化した拡張現実（AR）体験などが可能になるかもしれません。Googleは、このアクセラレータが最終的にオープンソース化されることで、より広範な開発コミュニティがその恩恵を受け、エッジAIエコシステムのさらなる発展が促進されることを期待しています。これにより、私たちの日常生活のあらゆる側面にAIがより深く統合される未来が加速されるでしょう。

元記事: https://developers.google.com/edge/litert/next/gpu

よかったらシェアしてね！