Mentions légales du service

Skip to content

Nvidia GPU detection

RINGOT Patrice requested to merge bugs/#10436 into master

A signaler le problème lié à orion:

  • les cartes ne sont pas visibles via nvidia-smi
  • la description des cartes a été faite à la main dans le reference-repository
  • comme le plugin OHAI pour les GPUs s'appuie sur nvidia-smi, on ne peut pas détecter les cartes des orion
  • le test (lib/g5kchecks/specs/gpu/gpu_spec.rb) qui compte que le nombre de cartes est conforme à ce qui est enregistré dans l'api a été modifié pour tenir compte de ce cas (on ne compte pas dans l'API les cartes dont le modèle figure dans une liste, en l'occurrence celles d'orion)
  • on peut se poser la question du support des GPU d'orion (le driver nvidia qui permet de faire du cuda 10 est trop récent pour ce modèle de cartes)

Le test Jenkins g5kcheckstester sur tous les clusters en mode BEST a ramené des choses à corriger dans lib/refrepo/g5kchecks_importer.rb:

  • grcinq - RuntimeError Unknown key to sort array eno1
  • uvb - RuntimeError Unknown key to sort array ib0.8100
  • yeti - RuntimeError Unknown key to sort array nvme1n1

Ref: https://intranet.grid5000.fr/bugzilla/show_bug.cgi?id=10436

Edited by Lucas Nussbaum

Merge request reports