Tous les serveurs sauf 3 (une panne et 2 réservés) sont de nouveau disponibles. Les jobs encore en attente de son lancés automatiquement sur ces ressources de nouveau disponibles. Le supercalculateur reste soos surveillance étroite.
Les calculs en cours sur la partition ARMGPU sont malheureusement perdus et devrons être relancès.
L’état actuel de nos investiguations semblent indiquer une microcoupure du réseau électrique. Ce diagnostique reste a confirmer.
Un intervenant du constructeur sera présent ce midi pour confirmer le bon état du matériel sous garantie et nous donner feu vert avant toute tentative de redemarrage.
Un problème non identifié a rendu les nœuds de calculs GPU indisponibles depuis environ 3h30 ce matin du lundi 4 mai 2026. Nous tentons de corriger la situation au plus vite.
Last updated: May 4, 2026 at 3:30 AM UTC