Skip to content

GitLab

  • Projects
  • Groups
  • Snippets
  • Help
    • Loading...
  • Help
    • Help
    • Support
    • Community forum
    • Submit feedback
    • Contribute to GitLab
  • Sign in
vidjil
vidjil
  • Project overview
    • Project overview
    • Details
    • Activity
    • Releases
  • Repository
    • Repository
    • Files
    • Commits
    • Branches
    • Tags
    • Contributors
    • Graph
    • Compare
  • Issues 1,712
    • Issues 1,712
    • List
    • Boards
    • Labels
    • Service Desk
    • Milestones
  • Merge Requests 87
    • Merge Requests 87
  • CI / CD
    • CI / CD
    • Pipelines
    • Jobs
    • Schedules
  • Operations
    • Operations
    • Incidents
    • Environments
  • Packages & Registries
    • Packages & Registries
    • Container Registry
  • Analytics
    • Analytics
    • CI / CD
    • Repository
    • Value Stream
  • Snippets
    • Snippets
  • Members
    • Members
  • Collapse sidebar
  • Activity
  • Graph
  • Create a new issue
  • Jobs
  • Commits
  • Issue Boards
  • vidjil
  • vidjilvidjil
  • Issues
  • #1596

Closed
Open
Opened Nov 29, 2016 by Vidjil Team@vidjilteamMaintainer

L'estimation du nombre de séquences est fausse pour un .gz

Dans bioreader.cpp, dans approx_nb_sequences_in_file(string f):

float ratio = (float) filesize(f.c_str()) / (float) sequences->getPos();

On ne prend pas en compte le cas où c'est compressé, bref la valeur est fausse à un facteur environ 4. Mais bon, vu que cela sert pour la e-valeur, on n'est pas à un demi-ordre de grandeur près...


  • voir si un igzstream permet de savoir où l'on est, en position compressée
  • ou voir si on peut avoir accès à la taille décompressée de tout le fichier
  • ou multiplier par 4 quand c'est un .gz

Évoqué de nouveau vendredi dernier. En plus fasta.gz et fastq.gz ne donnent pas les mêmes biais.


@magiraud @mikael-s

Edited Aug 27, 2020 by Mathieu Giraud
To upload designs, you'll need to enable LFS and have an admin enable hashed storage. More information
Assignee
Assign to
None
Milestone
None
Assign milestone
Time tracking
None
Due date
None
Reference: vidjil/vidjil#1596