これが1つ14億円「NVIDIA Vera Rubin NVL72 ASUS AI POD」

「革ジャン」ことNVIDIAのジェンスン・ファンCEOは6月1日、台湾・台北で開いたNVIDIA GTC(GPU Technology Conference)Taipeiで、次世代AIサーバー「Vera Rubin(ヴェラ・ルービン)」の全貌を明らかにした。ファンCEOは「AIは、自ら考え、CADやブラウザー、データベースなどのツールを使いこなし、仕事を完結させる『自律型エージェント』が実用段階に突入した」と話す。それを実現するAIサーバーがVera Rubin。エージェントAI特化型のCPU「Vera」とAI特化型次世代GPU「Rubin」を核とするものだ。「既に量産体制に入っている」という。

ファンCEOによると、CPUのVeraは「GPUを待たせないための極めて高い処理速度を実現。例えば従来のx86CPU比で、SQL処理で3倍、ニューヨーク証券取引所などでのリアルタイム・ストリームデータ処理で6倍の高速化を達成する」という。GPUのRubinは「Veraとの相乗効果でサーバー全体の処理速度を50%高速化。旧世代GPUとの比較で推論コストを最大10分の1に引き下げる」とした。現在AIは、OpenAIのChatGPTやAnthropicのClaudeなど、LLM(Large Language Model=大規模言語モデル)開発に資金と計算資源が集中している。一方で、徐々にAIを使う「推論」に資金と計算資源がシフトし始め、AIのエージェント化が進行している。NVIDIAではこうした動きを受け、Vera Rubinを本格投入する。

6月2日から5日まで台北で開催された、COMPUTEX 2026では早速、このVera Rubinの実機が展示されていた。例えばASUSブースでは「NVIDIA Vera Rubin NVL72 ASUS AI POD」の実機を展示。1ラックにCPUのVeraを36基、GPUのRubinを72基搭載し、メモリーは高帯域幅の「HBM4」を計75TB備える。100%完全液冷と配線・配管を排除したミッドプレーン設計を採用し、熱設計電力(TDP)は最大227kW。AIのパフォーマンスは、推論で3.6EFLOPS(エクサフロップス)、学習で2.5EFLOPSを叩き出す。NVIDIAもASUSも詳細価格は発表していないが、カナダのテック系メディアWccftechが報じた米Bernstein Researchの試算によれば、1ラックあたりの価格は総額約910万米ドル。日本円にしておよそ14億6000万円。性能も価格も超ド級のAIサーバーだ。ちなみに価格を金塊に換算するとおよそ60kg前後に相当する。こんな高価なモノが無造作に展示されているのを見て、盗まれないのかと心配になったほどだ。まあ、重量は2トン近くもあるので、そう簡単に盗むことはできないだろうが。

このVera Rubin NVL72を、ちょっと乱暴だが、日本が誇るスーパーコンピューター(スパコン)「富岳」と比べてみた。供用開始が2021年3月。5年も前のマシンだ。汎用スパコンとAI特化型サーバーで用途も異なる。富岳にはGPUもないのでAI用途では大いに不利だ。そのうえであえて比較すると、130億パラメータークラスの中規模AIモデルでのLLM推論速度は、富岳で毎秒、数十から数百トークン。一方NVIDIAの発表値から推定すると、Vera Rubinは数千から数万トークン。圧倒的な性能差がある。それでいて、富岳は建物全体の432ラック分の巨大システム。かたやVera Rubin NVL72は大型冷蔵庫サイズの1ラックのみ。設置面積もはるかに小さい。当然消費電力も桁違いに小さい。富岳が約18MW~30MWであるのに対し、Vera Rubin NVL72は0.227MWとおよそ100分の1だ。そして富岳は総開発費1300億円。Vera Rubin NVL72は約15億円。わずか5年とはいえ、ハードの進歩も目を見張るものがある。

人間の欲望にはキリがない。AI需要はこれから爆発的に拡大するだろう。1ラック10億円単位のサーバーを何十、何百も並べたAIデータセンターが世界中にどんどん増えていくことになる。いくら省電力になったとはいえ、莫大な電力と水を消費することには変わりない。この、突然降って湧いたようなとてつもないエネルギー需要を、果たして人類は乗り越えることができるのだろうか。革ジャンの話を聞きつつ、そんな懸念も心をよぎった。(BCN・道越一郎)