仕様

総ノード数

総ノード数

158,976ノード

総理論性能

総演算性能

通常モード
(CPU動作クロック周波数2 GHz)
・倍精度理論最高値(64 bit)488 ペタフロップス
・単精度理論最高値(32 bit)977 ペタフロップス
・半精度(AI学習)理論最高値(16 bit)1.95 エクサフロップス
・整数(AI推論)理論最高値(8 bit)3.90 エクサオップス

ブーストモード
(CPU動作クロック周波数2.2 GHz)
・倍精度理論最高値(64 bit)537 ペタフロップス
・単精度理論最高値(32 bit)1.07 エクサフロップス
・半精度(AI学習)理論最高値(16 bit)2.15 エクサフロップス
・整数(AI推論)理論最高値(8 bit)4.30 エクサオップス

総メモリ容量

4.85 PiB

総メモリバンド幅

163 PB/s

ノード仕様

命令セットアーキテクチャ

Armv8.2-A SVE 512 bit
富士通拡張: ハードウェアバリア,セクタキャッシュ,プリフェッチ

演算コア数

アシスタントコア数

48 コア

計算ノード: 2 コア
IO兼計算ノード: 4 コア

演算性能

通常モード
(CPU動作クロック周波数2 GHz)
倍精度: 3.072 テラフロップス, 単精度: 6.144 テラフロップス, 半精度: 12.288 テラフロップス

ブーストモード
(CPU動作クロック周波数2.2 GHz)
倍精度: 3.3792 テラフロップス, 単精度: 6.7584 テラフロップス, 半精度: 13.5168 テラフロップス

キャッシュ(注1) (注2)

L1D/core: 64 KiB, 4way, 256 GB/s (load), 128 GB/s (store)

L2/CMG: 8 MiB, 16way
L2/node: 4 TB/s (load), 2 TB/s (store)
L2/core: 128 GB/s (load), 64 GB/s (store)

メモリ / インターコネクト / I/O / テクノロジー

HBM2 32 GiB, 1024 GB/s / Tofu Interconnect D (28 Gbps x 2 lane x 10 port) / PCIe Gen3 x16 / 7nm FinFET

ストレージ

第一階層

LLIO(Lightweight Layered IO-Accelerator)
ジョブ実行専用領域
以下の3種類の領域をジョブに提供
・ノード内テンポラリ領域
・共有テンポラリ領域
・第2階層ストレージのキャッシュ領域

第二階層

FEFS(Fujitsu Exabyte File System)
ユーザー及びジョブが利用する大容量の共有領域
Lustreベースのファイルシステム

第三階層

商用クラウドストレージ

プログラミング環境

コンパイラ

Fortran2008 & Fortran2018サブセット
C11 & GNU拡張仕様・Clang拡張仕様
C++14 & C++17サブセット & GNU拡張仕様・Clang拡張仕様
OpenMP 4.5 & OpenMP 5.0サブセット
Java

並列プログラミング

XcalableMP
FDPS

スクリプト言語

Python + Numpy + Scipy, Ruby

科学技術計算用ライブラリ

BLAS, LAPACK, ScaLAPACK
SSL II (Fujitsu)
EigenExa, Kevd, Batched BLAS, 2.5D-PDGEMM

システムソフトウェア

OS

Red Hat Enterprise Linux 8
McKernel

MPI

Fujitsu MPI (Based on OpenMPI), RIKEN-MPICH (Based on MPICH)

File IO

LLIO
Application-oriented file IO libraries