Le 19 mars pour une opération de maintenance nécéssitant une intervention sur l’ensemble des serveurs de calcul ARM GPU, ceux ci seront indisponibles toute la journée.
Update 16:00
Les noeuds de calcul ARM GPU ont été tous relancés. La maintenance de toutes les lames GPU effectuée par ATOS/Bull a confirmée la présence de micro fuites sur 3 lames (6 serveurs) qui nécéssitent un retour en usine quelques temps des lames en questions pour réparation. Ces serveurs sont donc non disponibles actuellement.
Lors de cette maintenance les drivers Nvidia ont également été mis à jour en 590.48.01, CUDA 13 sera donc bientot disponible dans Spack. Si votre environnement logiciel (conda, python, autre) ne voit plus les GPU, il est possible que vous soyez obligés de le recréer (ou de reinstaller certains packages comme ‘cudnn’).
La partie GPU de ROMEO sera de nouveau disponible pour vos jobs à partir de 16h20.
Last updated: March 19, 2026 at 4:44 PM UTC