Mentions légales du service

Skip to content
Snippets Groups Projects

[gpu] add flops and microarch to gpu information

Merged POUILLOUX Laurent requested to merge add_gpu_flops into master
1 unresolved thread

Merge request reports

Loading
Loading

Activity

Filter activity
  • Approvals
  • Assignees & reviewers
  • Comments (from bots)
  • Comments (from users)
  • Commits & branches
  • Edits
  • Labels
  • Lock status
  • Mentions
  • Merge request status
  • Tracking
  • Oui, ça marche.

  • assigned to @lnussbau

  • added 1 commit

    • 1219b157 - [gpu] replace microarch by microarthitecture

    Compare with previous version

  • reopened

  • POUILLOUX Laurent changed title from add flops and microarch to gpu information to [gpu] add flops and microarch to gpu information

    changed title from add flops and microarch to gpu information to [gpu] add flops and microarch to gpu information

  • POUILLOUX Laurent added 9 commits

    added 9 commits

    • 214f17d8...2d17a26b - 2 commits from branch master
    • a53d8400 - [gpu] adding FLOPS and microarch for gpus
    • a97219e0 - [gpu] rename method to get numbers of cores
    • fd64f5d4 - [gpu] add performance and microarch in gpu information
    • 6df4290c - [gpu] updated json file with gpu performance and microarch
    • eccfd8ce - [gpu] add exception for chifflot and grafitti
    • a8c2f9b1 - [gpu] replace microarch by microarchitecture
    • 06af1f43 - [gpu] regenerate json files with microarchitecture

    Compare with previous version

  • 42 72 'alias' => 'v100-sxm2-32',
    73 'microarchitecture' => 'Volta',
    74 'performance' => {
    75 'fp-16' => 28260000000000,
    76 'fp-32' => 14130000000000,
    77 'fp-64' => 7066000000000,
    78 },
    43 79 },
    44 80 'Tesla M2075' => {
    45 81 'cores' => 448,
    46 82 'compute_capability' => '2.0',
    47 83 'short_name' => 'Tesla M2075',
    48 84 'alias' => 'm2075',
    85 'microarchitecture' => 'Maxwell',
    86 'performance' => {
    87 'fp-16' => 0,
    • Question pour ma culture personnelle : j'imagine que c'est 0 parce que le constructeur a pas donné l'info, mais est-ce que c'est possible de faire tourner du code avec des flottants "half size" ? Si la réponse est oui, est-ce qu'on peut extrapoler les flops théoriques ?

    • En effet, pas de données constructeurs, je vois pas pourquoi on pourrait pas lancer le code en half par contre pour l'extrapolation c'est pas possible (cf : A40 ou GTX 1080 Ti).

      Edited by POUILLOUX Laurent
    • Ok, du coup en gros la question c'est si on préfère mettre une valeur théorique extrapolée possiblement erronée/imprécise, ou si on garde explicitement 0 pour dire qu'on a pas la donnée constructeur ? @lnussbau tu as un avis là dessus ?

    • pas vraiment d'avis... vu l'âge de ces GPUs, je pense qu'on peut laisser comme ça

    • Please register or sign in to reply
  • J'ai laissé un commentaire anecdotique pour ma culture mais sinon LGTM :)

  • Philippe Virouleau approved this merge request

    approved this merge request

  • Lucas Nussbaum resolved all threads

    resolved all threads

  • mentioned in commit fdd63d06

  • Please register or sign in to reply
    Loading