Aufbau der Cloud-Hardware
Die IaaS-Cloud-Infrastruktur beinhaltet insgesamt 32 Server und Switche, die vom ZIMT installiert wurden und betrieben werden. In Folgenden sind die Eckdaten der Server bzw. Hosts aufgelistet:
16x Compute-Nodes
Die CPU-Server stellen die Computing Ressourcen (CPU und RAM) für die virtuellen Maschinen bereit.
Merkmale | |
---|---|
CPU | 96 vCPUs (2x 48-Core AMD EPYC 7402) |
RAM | 256 GB |
Speicher | 3,84 TB NVMe-SSD |
Netzwerk | 4x 10 GBit/s Ethernet SFP+ |
Insgesamt 786 Kerne/ 1.536 Threads und 4.096 GB Hauptspeicher.
4x GPU-Nodes
Die GPU-Nodes werden für Inferenz- und KI-Berechnungen verwendet. GPUs (Graphics Processing Units) sind aufgrund ihrer parallelen Verarbeitungsfähigkeiten besonders gut für Aufgaben geeignet, die eine hohe Rechenleistung erfordern, wie zum Beispiel maschinelles Lernen, Deep Learning, neuronale Netzwerke und andere anspruchsvolle Datenverarbeitungs- und Analyseverfahren. Durch den Einsatz von GPUs können komplexe Berechnungen beschleunigt werden, was insbesondere bei KI-Anwendungen von Vorteil ist, da diese oft große Datenmengen verarbeiten und komplexe mathematische Operationen durchführen müssen. Die GPU-Nodes in diesem Szenario dienen also dazu, die erforderlichen Ressourcen für KI-Berechnungen und Inferenzen bereitzustellen.
Typ A
Anzahl: 3 Stück
Komponente | |
---|---|
CPU | 2x Intel Xeon Gold 6242R |
RAM | 256 GB |
Speicher | 3,84 TB NVMe SSD |
Grafikkarten | 4x NVIDIA A100 40 GB PCIe |
Netzwerk | 4x 10 GBit/s Ethernet SFP+ |
Typ B
Anzahl: 1 Stück
Dieser GPU-Node wird ausschließlich von einer einzelnen Foschungsgruppe verwendet und ist nicht für die allgemeine Nutzung vorgesehen.
Komponente | |
---|---|
CPU | 2x AMD EPYC 2782 |
RAM | 256 GB |
Speicher | 2x 960 GB Intel SSD D3-S4510 |
Grafikkarten | 1x NVIDIA A100 80 GB PCIe |
Netzwerk | 4x 10 GBit/s Ethernet SFP+ |
9x Storage-Server
Hauptspeicherplatz für die Cloud. Dieser Storage-Cluster ist als sogenanntes Software-Defined Storage mit Ceph eingerichtet.
Komponente | |
---|---|
CPU | 2x Intel Xeon E5-2650 V4 |
RAM | 256 GB |
Netzwerk | 4x 10 GBit/s Ethernet SFP+ |
Speicherplatz
Typ | Anzahl | Speicherplatz | Gesamt-Speicherplatz |
---|---|---|---|
HDD | 4 | 1,92 TB | 7,68 TB |
HDD | 30 | 8 TB | 240 TB |
SSD | 2 | 3,2 TB | 6,4 TB |
SSD | 2 | 0,24 TB | 0,48 TB |
Insgesamt stehen ca. 1,25 TB Speicherplatz zur Verfügung.
3x Management-Server
Die Management-Server dienen zum Betrieb der Apache CloudStack-Software und des Storage-Clusters und stellen keine Ressourcen für virtuelle Maschinen bereit.
4x Netzwerkswitche
Geräte für die Vernetzung der Cloud-Hardware untereinander.
Ethernet | Anzahl |
---|---|
40 GBit QSFP+ | 6x |
10 GBit SFP+ | 48x |
IoT-Hardware
Mit dem SPARCI-Projekt wurden zum einen ein Computercluster, bestehend aus insgesamt 32 Servern und 4 Switche und zum anderen eine Vielzahl an IoT-Microcontroller und -Sensoren des Herstellers „Pycom“ beschafft. Da die Beschaffung der Hardware für die IaaS-Cloud abgeschlossen ist, steht eine begrenzte Anzahl an Ressourcen (CPU, RAM, Speicherplatz) für VMs zur Verfügung. Somit kann auch nur eine begrenzte Anzahl an virtuellen Maschinen auf der Cloud erstellt und betrieben werden.