
【モニタリングダッシュボード提供の背景】
日々、繰り返しジョブを投入する運用では、個々のジョブの実行状況を追跡したり、長期間にわたって利用データを分析したりすることは容易ではありません。
こうした課題を解決し、利用状況を直感的に可視化・分析できる環境を提供するため、Grafanaを導入したモニタリングダッシュボード機能を開発しました。

【モニタリングダッシュボードの活用シーン】
モニタリングダッシュボードでは、以下の項目を一画面上で確認することができます。
・ パーティションにおける実行中ジョブ数
・ パーティションにおける待機中ジョブ数
・ ユーザー別の実行中ジョブ数
・ ユーザー別の待機中ジョブ数
活用例1)ジョブが実行されている時間帯を可視化し、実行が集中している時間があれば分散するよう調整する。
活用例2)一定時間内におけるGPU利用率を確認し、パラメーターを調整することでリソース効率を最適化する。
■ダッシュボードのイメージ


【「GMO GPUクラウド」とは】
(URL:https://gpucloud.gmo/)
(URL:https://gpucloud.gmo/)
「GMO GPUクラウド」は、「NVIDIA H200GPU」を搭載し、国内初となる高速ネットワーク「NVIDIA Spectrum-X」と高速ストレージを組み合わせることで、マルチノード構成において、国内商用クラウド最速(※5)の性能を誇る、高性能GPUクラウドサービスです。2024年11月に公表された世界スーパーコンピュータランキング「TOP500」で世界37位・国内6位にランクインし、商用クラウドとして国内最速の性能を誇ります。マルチノード構成時の圧倒的なパフォーマンスと安定性により、大規模言語モデル(LLM)の学習やマルチモーダルAIの開発など、高度なAI開発に最適な環境を提供します。
また2025年内にNVIDIAの次世代の「NVIDIA Blackwell Ultra GPU」を搭載した「NVIDIA HGX B300(以下、NVIDIA B300)」のクラウドサービスの提供を予定しています。
GMOインターネットは、本サービスを通じて、生成AI分野に取り組む企業や研究機関に対し、最適化されたインフラ基盤と、お客様のワークロードに応じた柔軟でカスタマイズ可能な計算環境を提供し、開発期間の短縮とコスト低減に貢献、国内AI産業の発展を促進します。
(※5)2024年11月22日時点の国内商用向けクラウドサービスとして当社調べ(参考:「GMO GPUクラウド」世界のスーパーコンピュータランキングTOP500に初ランクインhttps://internet.gmo/news/article/26/
【今後の展開】
GMOインターネットは、「GMO GPUクラウド」を中核としたAIインフラ戦略により、急速に進化するAI・ロボティクス分野の技術革新に貢献してまいります。今後も最新のAI計算基盤の提供と、お客様のニーズに応じた柔軟なクラウド環境の構築により、日本のAI産業に欠かせないクラウドサービスとして、日本発のAIイノベーション創出に貢献してまいります。
■過去の参考リリース