Data publikacji: 17 listopada 2021
|Aktualności, CNT, MCB

CATO – nasz superkomputer

System CATO jest spójnym systemem obejmującym swoim zakresem zarówno podsystem wielkoskalowego przetwarzania danych jak i podsystem przechowywania i udostępniania danych. Komplementarną częścią systemu są pakiety oprogramowania działające w poszczególnych warstwach systemu.
Superkomputer o wysokiej wydajności (HPC - High Performance Computing) realizujący wielkoskalowe obliczenia, rozszerzone o zadania sztucznej inteligencji (AI - Artificial Intelligence) i wysokowydajnej analizy danych (HPDA - High Performance Data Analytics), adresujące zagadnienia modelowania i symulacji, zjawisk i procesów, w oparciu o duże zbiory danych.

Jednym z trendów budowania platform obliczeniowych dla zaawansowanej analityki jest stosowanie akceleratorów i przetwarzania opartego już nie tylko o jednostki CPU, ale właśnie o architektury heterogeniczne. Układy GPGPU oprócz oczywistych zastosowań w dziedzinie ogólnie pojętego przetwarzania obrazu, mogą być – i są – z powodzeniem wykorzystywane do wykonywania złożonych obliczeń numerycznych ogólnego przeznaczenia, zwłaszcza takich, które poddają się operacji zrównoleglenia. Obecnie, wydajne akceleratory są niezwykle dynamicznie rozwijającą się gałęzią rynku, na którą z wielkim zainteresowaniem spoglądają nie tylko jednostki badawcze z całego świata (jak nasze Centrum Cyfrowej nauki i Technologii), ale także coraz częściej firmy komercyjne. Dzisiaj, akcelerowane na układach GPU technologie obliczeniowe stanowią najbardziej powszechną, dostępną i energooszczędną drogę rozwoju centrów danych i wysokowydajnych technologii obliczeniowych oraz jak się okazuje napędzają najszybsze superkomputery.

budowa cato, hardware

Podsystem obliczeniowy oparty jest o serwery IBM Power Systems AC922, wyposażone w procesory CPU POWER9 oraz układy GP-GPU (General Purpose GPU) NVIDIA Volta V100 32GB HBM2. Unikalna architektura magistral systemowych NVLink 2.0 (CPU:GPU, GPU:GPU) wpływa znacząco na efektywność przetwarzania danych na heterogenicznej platformie AC922, wspierając potencjał akceleracji masywnie zrównoleglonych jednostek V100, do wykonywania złożonych obliczeń numerycznych ogólnego przeznaczenia.

System CATO posiada 8 węzłów IBM Power Systems AC922, z których dwa pełnią rolę węzłów dostępowych tzw. login node, natomiast 6 wykorzystywanych jest jako węzły obliczeniowe tzw. compute nodes.
Każdy węzeł zawiera dwa układy GPGPU o następującej charakterystyce obliczeniowej:
    • 125 TFLOPS w operacjach głębokiego uczenia,
    • 7,8 TFLOPS w operacjach podwójnej precyzji (Double-Precision floating point FP64),
    • 15,7 TFLOPS w operacjach pojedynczej precyzji (Single-Precision floating point FP32).

Moc obliczeniowa systemu oparta o układy GPGPU w węzłach obliczeniowych wynosi 1,5 PFLOPS w operacjach głębokiego uczenia, z uwzględnieniem węzłów dostępowych 2,1 PFLOPS.

Przechowywanie i udostępnianie danych realizuje podsystem pamięci masowej oparty o komponenty IBM Elastic Storage Server (ESS). Przestrzeń dyskowa oparta o dyski SSD (96 x 16TB) oraz NL-SAS (332 x 8TB), udostępniania jest w ramach równoległego systemu plików IBM Spectrum Scale, zapewniającego jedną, spójną przestrzeń nazw. ESS w oparciu o swoje komponenty zapewnia wydajność, przepustowość i skalowalność całego systemu dyskowego. Użytkowa przestrzeń dyskowa wynosi 3PB.

Podsystem pamięci masowej połączony jest z podsystemem obliczeniowym z wykorzystaniem sieci InfiniBand, charakteryzującej się wysoką przepustowością i niskim czasem dostępu. Implementacja została wykonana w pełni nieblokującej topologii, tzw. Fat-Tree w standardzie EDR na bazie komponentów sprzętowych firmy Mellanox. Sieć InfiniBand wykorzystywana jest również do zapewnienia komunikacji między węzłami obliczeniowymi w sieci prywatnej klastra niezależnie od technologii sieci Ethernet 10 GbE SR.

CATO jest już dostępny. skontaktuj się z nami, by z niego skorzystać

Skip to content