Skip to content

GitLab

  • Menu
Projects Groups Snippets
    • Loading...
  • Help
    • Help
    • Support
    • Community forum
    • Submit feedback
    • Contribute to GitLab
  • Sign in
  • vidjil vidjil
  • Project information
    • Project information
    • Activity
    • Labels
    • Members
  • Repository
    • Repository
    • Files
    • Commits
    • Branches
    • Tags
    • Contributors
    • Graph
    • Compare
  • Issues 1,715
    • Issues 1,715
    • List
    • Boards
    • Service Desk
    • Milestones
  • Merge requests 91
    • Merge requests 91
  • CI/CD
    • CI/CD
    • Pipelines
    • Jobs
    • Schedules
  • Deployments
    • Deployments
    • Environments
    • Releases
  • Monitor
    • Monitor
    • Incidents
  • Packages & Registries
    • Packages & Registries
    • Container Registry
  • Analytics
    • Analytics
    • Value stream
    • CI/CD
    • Repository
  • Snippets
    • Snippets
  • Activity
  • Graph
  • Create a new issue
  • Jobs
  • Commits
  • Issue Boards
Collapse sidebar
  • vidjil
  • vidjilvidjil
  • Issues
  • #2767

Closed
Open
Created Oct 31, 2017 by Thonier Florian@flothoniOwner

Vidjil-algo ne trouve pas la correspondance si déletion supérieur à 100nt.

Une séquence fournie par un utilisateur n'est pas correctement annotée par vidjil. Je met cette séquence dans le should-vdj.

J'ai fait un alignement entre les séquences V4-39 (trouvé par vidjil, erroné), les V4-59 (attendues) et la sequence brut. On voit bien qu'effectivement la séquence avec une identité la plus forte est le V4-59 (enfin les, mais les variations sont minimes). Cependant, l'algo ne les considère même pas. Pire, si on lui fournit un jeu de séquences dans lequel l'ensemble des IGHV ne contient que les V4-59, il trouve la séquence en unseg.

Pensant aux evaleurs qui pourraient être faussées par le nombre de séquences, j'ai laissé les autres séquences mais remplacé les A par des G pour fausser la détéction sur les autres segments (solution barbare) : idem, il ne retrouve pas les V4-59.

Dernier point : un caractère inadéquate dans le header des séquences v4-59. A priori non. (J'ai testé d'intervertir avec le header du v4-39)

Je n'ai pas d'explications...

@mikael-s @magiraud

Edited Nov 09, 2017 by Thonier Florian
To upload designs, you'll need to enable LFS and have an admin enable hashed storage. More information
Assignee
Assign to
Time tracking