Skip to content
GitLab
Projects Groups Topics Snippets
  • /
  • Help
    • Help
    • Support
    • Community forum
    • Submit feedback
    • Contribute to GitLab
  • Sign in
  • vidjil vidjil
  • Project information
    • Project information
    • Activity
    • Labels
    • Members
  • Repository
    • Repository
    • Files
    • Commits
    • Branches
    • Tags
    • Contributor statistics
    • Graph
    • Compare revisions
  • Issues 1.7k
    • Issues 1.7k
    • List
    • Boards
    • Service Desk
    • Milestones
  • Merge requests 116
    • Merge requests 116
  • CI/CD
    • CI/CD
    • Pipelines
    • Jobs
    • Schedules
  • Deployments
    • Deployments
    • Environments
    • Releases
  • Packages and registries
    • Packages and registries
    • Container Registry
  • Monitor
    • Monitor
    • Incidents
  • Analytics
    • Analytics
    • Value stream
    • CI/CD
    • Repository
  • Snippets
    • Snippets
  • Activity
  • Graph
  • Create a new issue
  • Jobs
  • Commits
  • Issue Boards
Collapse sidebar
  • vidjilvidjil
  • vidjilvidjil
  • Issues
  • #3944
Closed
Open
Issue created Jun 27, 2019 by Thonier Florian@flothoniOwner

Pouvoir calculer des distributions

Celles-ci doivent être compatibles avec stats. Le calcul se fait depuis fuse.py.

Ajout de 2 options:

  • -d; calcul les distributions et les incluts dans le fichier vidjil sous l'entrée distributions
  • -D; génère un fichier json avec uniquement les distributions, compatible directement avec stats (lorsqu'il pourra ouvrir un fichier fournit par l'utilisateur)

Voici la liste actuelle, pour l'instant croisée pour faire toutes les combinaisons possibles. Il faudra, vu la taille et le temps de calcul, probablement évincer celles qui n'ont que peu d'intérêts.

LIST_AXES = ["germline",
  "seg5", "seg4", "seg3",
  "lenSeqConsensus", "lenSeqAverage", "GCContent", "coverage",
  "rearangment", "complete",
  "lenSeq", 
  "seg5_delRight", "seg3_delLeft", "seg4_delRight", "seg3_delLeft",
  "insert_53", "insert_54", "insert_43",
  "lenCDR3",   
  "productive", 
  #"junction_start", "junction_stop",
  # "evalue", l'arrondir ?
  # "top", # "name"
  #"seg5_stop", "seg3_start", "seg4_stop", "seg4_start",
  # nbSamples,
  # "cdr3_stop", "cdr3_start", 
]

Testé sur un ensemble de 30 fichiers --all (env 30k clones en moyenne):

  • génère un fichier de 2,3Go
  • Dure 35 minutes
  • chaque ajout dans la liste des axes multiplie par 2 le nombre de sortie calculées.
Edited Jun 27, 2019 by Thonier Florian
To upload designs, you'll need to enable LFS and have an admin enable hashed storage. More information
Assignee
Assign to
Time tracking