仕様
総ノード数
158,976ノード
総理論性能
通常モード
(CPU動作クロック周波数2 GHz)
・倍精度理論最高値(64 bit)488 ペタフロップス
・単精度理論最高値(32 bit)977 ペタフロップス
・半精度(AI学習)理論最高値(16 bit)1.95 エクサフロップス
・整数(AI推論)理論最高値(8 bit)3.90 エクサオップス
ブーストモード
(CPU動作クロック周波数2.2 GHz)
・倍精度理論最高値(64 bit)537 ペタフロップス
・単精度理論最高値(32 bit)1.07 エクサフロップス
・半精度(AI学習)理論最高値(16 bit)2.15 エクサフロップス
・整数(AI推論)理論最高値(8 bit)4.30 エクサオップス
4.85 PiB
163 PB/s
ノード仕様
Armv8.2-A SVE 512 bit
富士通拡張: ハードウェアバリア,セクタキャッシュ,プリフェッチ
アシスタントコア数
48 コア
計算ノード: 2 コア
IO兼計算ノード: 4 コア
通常モード
(CPU動作クロック周波数2 GHz)
倍精度: 3.072 テラフロップス, 単精度: 6.144 テラフロップス, 半精度: 12.288 テラフロップス
ブーストモード
(CPU動作クロック周波数2.2 GHz)
倍精度: 3.3792 テラフロップス, 単精度: 6.7584 テラフロップス, 半精度: 13.5168 テラフロップス
L1D/core: 64 KiB, 4way, 256 GB/s (load), 128 GB/s (store)
L2/CMG: 8 MiB, 16way
L2/node: 4 TB/s (load), 2 TB/s (store)
L2/core: 128 GB/s (load), 64 GB/s (store)
HBM2 32 GiB, 1024 GB/s / Tofu Interconnect D (28 Gbps x 2 lane x 10 port) / PCIe Gen3 x16 / 7nm FinFET
- (注1) キャッシュ性能は2 GHz動作時
- (注2) 詳細は https://github.com/fujitsu/A64FX 参照
ストレージ
LLIO(Lightweight Layered IO-Accelerator)
ジョブ実行専用領域
以下の3種類の領域をジョブに提供
・ノード内テンポラリ領域
・共有テンポラリ領域
・第2階層ストレージのキャッシュ領域
FEFS(Fujitsu Exabyte File System)
ユーザー及びジョブが利用する大容量の共有領域
Lustreベースのファイルシステム
商用クラウドストレージ
プログラミング環境
Fortran2008 & Fortran2018サブセット
C11 & GNU拡張仕様・Clang拡張仕様
C++14 & C++17サブセット & GNU拡張仕様・Clang拡張仕様
OpenMP 4.5 & OpenMP 5.0サブセット
Java
XcalableMP
FDPS
Python + Numpy + Scipy, Ruby
BLAS, LAPACK, ScaLAPACK
SSL II (Fujitsu)
EigenExa, Kevd, Batched BLAS, 2.5D-PDGEMM
システムソフトウェア
Red Hat Enterprise Linux 8
McKernel
Fujitsu MPI (Based on OpenMPI), RIKEN-MPICH (Based on MPICH)
LLIO
Application-oriented file IO libraries