Skip to content

GitLab

  • Projects
  • Groups
  • Snippets
  • Help
    • Loading...
  • Help
    • Help
    • Support
    • Community forum
    • Submit feedback
    • Contribute to GitLab
  • Sign in
vidjil
vidjil
  • Project overview
    • Project overview
    • Details
    • Activity
    • Releases
  • Repository
    • Repository
    • Files
    • Commits
    • Branches
    • Tags
    • Contributors
    • Graph
    • Compare
  • Issues 1,712
    • Issues 1,712
    • List
    • Boards
    • Labels
    • Service Desk
    • Milestones
  • Merge Requests 87
    • Merge Requests 87
  • CI / CD
    • CI / CD
    • Pipelines
    • Jobs
    • Schedules
  • Operations
    • Operations
    • Incidents
    • Environments
  • Packages & Registries
    • Packages & Registries
    • Container Registry
  • Analytics
    • Analytics
    • CI / CD
    • Repository
    • Value Stream
  • Snippets
    • Snippets
  • Members
    • Members
  • Collapse sidebar
  • Activity
  • Graph
  • Create a new issue
  • Jobs
  • Commits
  • Issue Boards
  • vidjil
  • vidjilvidjil
  • Issues
  • #4005

Closed
Open
Opened Oct 09, 2019 by Thonier Florian@flothoniMaintainer

Evaluer un fastq en amont des preprocess et analyse

Je suis tombé aujourd'hui sur des fichiers fastq comportant des erreurs :

@NB501924:75:HT525AFXY:1:11101:16318:8143 1:N:0:ATTGAGGA

+

Ni pear ni vidjil ne sont capable de prendre ces fichiers en l'état (#1723).

On pourrait imaginer l'appel d'un script qui se charge de vérifier que le format ou le contenu est correct et exploitable. Dans certain cas, il pourrait aussi corriger certaines erreurs comme celle-ci (attention dans le cas d'un merge d’ailleurs à bien prendre en compte aussi l'équivalent R2/R3).

De plus, il faudrait dans ce cas rendre disponible un rapport depuis l'interface, qui indique que tout est bon pour passer à la suite de l'analyse, ou indiquer que non et l'indiquer clairement à l'utilisateur.

Je sais qu'il existe des scripts permettant de vérifier la conformité du formatage des fasta/fastq. Je ne sais pas si il existe un script tout fait permettant de vérifier ce type d'erreurs, et d'autres qui nous viendrait en tête.

A chaud:

  • vérifier le format,
  • vérifier des erreurs d'entrées,
  • vérifier le nombre de lignes R1vsR2,
  • vérifier les séquences vides,
  • vérifier la présence de N ou autres caractères non souhaités
  • ...

@magiraud @mikael-s

To upload designs, you'll need to enable LFS and have an admin enable hashed storage. More information
Assignee
Assign to
None
Milestone
None
Assign milestone
Time tracking
None
Due date
None
Reference: vidjil/vidjil#4005