世界各国でAIの開発競争が激化するなか、経済産業省が生成AIの開発能力を国内で安定的に供給する計画を発表しました。具体的には「AI用の計算資源については、2027年度末に需要見込みに見合う60EFLOPS1の整備を目指す2」ことを目標として、さくらインターネットはじめ、複数の民間企業を支援しています。
この計画と並走してさくらインターネットが提供する生成AIの開発支援サービスが「高火力シリーズ」です。
高火力シリーズのなかで、2024年6月から新たに提供開始された「高火力 DOK」について、クラウド事業本部 事業開発部の角 俊和に話を聞きました。
角 俊和(すみ としかず) プロフィール
さくらインターネット クラウド事業本部 事業開発部 部長
大手通信キャリア、メディア企業での開発・企画・技術統括・事業統括を経て、2019年3月にさくらインターネットに入社。現在はおもに「高火力シリーズ」をはじめとする機械学習・生成AI向けサービスなどの新規事業を統括。
希少なハードウェアを大量に確保し、国内インフラの安定供給を目指す
さくらインターネットの「高火力シリーズ」とはどのようなものですか。
「高火力シリーズ」はさくらインターネットが提供する生成AI向けクラウドサービスです。AIや機械学習、生成AIといった負荷の高いプロジェクトに対応する、強力な計算資源を構築しています。
もともとAI関連の計算資源は非常に高価で、企業や団体が導入するためには大規模な投資が必要でした。さらに近年は生成AIのブレイクスルーによって高性能なGPUの需要が高まり、ハードウェアの確保も困難になっています。そのような状況の中でさくらインターネットは、NVIDIA社との緊密な協力のもと、希少な高性能GPUである「NVIDIA H100」を大量に確保しています。
高火力シリーズで生成AI開発の支援をする背景についてお聞かせください。
経済産業省が発表した「60EFLOPS」の背景には、経済安全保障の課題があります。生成AIが経済活動に大きな影響を与えるようになるなかで、データ主権の確保や国際関係に依存しないセキュリティ対応などを可能にするには、サービスの開発基盤を国内に置く必要があるためです。
さくらインターネットは経済産業省の支援を受け、60EFLOPSのうち18.9EFLOPSの計算能力を担います3。その計画のなかで、調達したGPUリソースを国内で稼働させ、日本における生成AI開発を支援するのが高火力シリーズです。そのなかでも「高火力 DOK」は、あらゆるユーザーが生成AI開発にアクセスできるよう、従量課金制の実行環境を提供しています。
高火力 DOKでできること、他サービスとの違い
高火力 DOKでは、具体的に何ができるのでしょうか。
高火力 DOK(以下、DOK)は「Dockerコンテナを使用するジョブ型の実行環境」で、計算資源を効率的にシェアする仕組みを提供しています。1秒単位の時間貸しで利用でき、短期間・小規模の開発プロジェクトにも、柔軟に対応できます。
学習から推論まで、AI関連のさまざまな用途でご利用いただけますが、どのような場合においても時間貸しのサービスの場合、サービスにアクセスする時間はなるべく短く、希少な計算資源は最大限に活かしたいものです。
そこでDOKは、ユーザー側で処理内容やアプリケーションをコンテナイメージとして作成し、それをプラットフォーム上で実行してもらいます。GPUリソースを使用するのは「コンテナイメージを実行している最中」だけです。リソースを占有して環境構築やアプリケーションの設定などをする必要がないため、コストを抑えながら高性能な計算資源を利用できます。
Dockerコンテナをそのまま実行するものなので、サービス上で環境を作り込む必要がなく、移行も容易です。もちろん、別の環境で同じアプリケーションを再利用できます。
これらの仕組みによって無駄なリソースを消費せず、効率的に生成AIの開発がおこなえます。
同じ高火力シリーズの「高火力 PHY」との違いは何でしょうか?
「高火力 PHY」(以下、PHY)は、高火力シリーズの最初のサービスです。ベアメタル型の物理サーバーで、おもに大規模なプロジェクトや研究機関向けに設計されています。
PHYは、莫大な計算を要するタスクを、高速かつ効率的に処理できるハイパフォーマンスなインフラです。AIモデルを何か月もかけてトレーニングする必要がある企業や、非常に高い計算能力が必要なプロジェクトにおいては、24時間体制でGPUを稼働し続けることになるでしょう。そのような場合はPHYが適しています。一方、月額費用や長期契約、お客さま自身による環境構築などが前提になるため、小規模なプロジェクトや短期的なニーズには向かないという課題がありました。
このような背景から、PHYのインフラをベースにDockerコンテナの実行環境を構築し、従量課金制で柔軟に使えるようにしたのがDOKです。たとえば、数時間だけ、数日間だけ使いたいような場合には、DOKのほうが割安で、使い勝手がよいはずです。
他社の製品との類似点や違う点はありますか?
類似サービスは他にもあります。ただ、民間企業や小規模なプロジェクトでは利用できるまでに待ち時間が発生してしまうケースがあるようです。需要が増えていることもあって、使いたいと思ったときにすぐ使うことができない状況にあるんですね。実際、サービス開始後、すぐにお問い合わせをいただいたのも、そういったお困りごとを持ったお客さまだったんです。「すぐに、ごく短期間だけ、GPUを使いたい」というニーズにDOKはマッチしているのだと思います。
また、DockerコンテナをそのままホスティングできるサービスはDOKだけです(NVIDIA H100の国内提供サービスにおいて。2024年10月時点)。実行時の短時間のみサービスを利用することで、たくさんのお客さまが計算リソースにアクセスでき、国内全体の生成AI開発の効率を上げられると考えています。
「純国産のビジネス向けクラウド」ブランド確立へ
今後の取り組みや高火力シリーズの展開予定についてお聞かせください。
今後は高火力シリーズに、仮想化技術を活用したクラウドサービス(VM版)を追加する予定です。PHY、DOKよりもアプリケーション寄りの環境を提供し、より多くの企業やお客さまが気軽にAIプロジェクトを実施できる機会を作りたいと考えています。
また、つい先日「外部接続機能」がリリースされ4、Jupyter Notebook(データ分析や機械学習などに広く利用される、Webブラウザ上で動作するインタラクティブな開発環境)を利用してのコード実行やアプリケーションの実行等ができるようになりました。ブラウザ上で直感的にコードを実行できるため、より迅速な開発と、アイデアの検証が可能になります。多くの方にご活用いただけるよう、順次機能追加をおこなっていく予定です。
先述した経済産業省の目標(60EFLOPS)は「到達できる見通し」とされています5が、さくらインターネットは目標到達以降も、調達や環境の整備、サービスの拡充を通して日本の生成AI開発環境を支援していきます。
コンテナー型GPUクラウドサービス 高火力 DOK(ドック)
>>サービスの詳細を見る
(撮影:ナカムラヨシノーブ)