Skip to content

GitLab

  • Projects
  • Groups
  • Snippets
  • Help
    • Loading...
  • Help
    • Help
    • Support
    • Community forum
    • Submit feedback
    • Contribute to GitLab
  • Sign in
vidjil
vidjil
  • Project overview
    • Project overview
    • Details
    • Activity
    • Releases
  • Repository
    • Repository
    • Files
    • Commits
    • Branches
    • Tags
    • Contributors
    • Graph
    • Compare
  • Issues 1,701
    • Issues 1,701
    • List
    • Boards
    • Labels
    • Service Desk
    • Milestones
  • Merge Requests 92
    • Merge Requests 92
  • CI / CD
    • CI / CD
    • Pipelines
    • Jobs
    • Schedules
  • Operations
    • Operations
    • Incidents
    • Environments
  • Packages & Registries
    • Packages & Registries
    • Container Registry
  • Analytics
    • Analytics
    • CI / CD
    • Repository
    • Value Stream
  • Snippets
    • Snippets
  • Members
    • Members
  • Collapse sidebar
  • Activity
  • Graph
  • Create a new issue
  • Jobs
  • Commits
  • Issue Boards
  • vidjil
  • vidjilvidjil
  • Issues
  • #2767

Closed
Open
Opened Oct 31, 2017 by Thonier Florian@flothoniMaintainer

Vidjil-algo ne trouve pas la correspondance si déletion supérieur à 100nt.

Une séquence fournie par un utilisateur n'est pas correctement annotée par vidjil. Je met cette séquence dans le should-vdj.

J'ai fait un alignement entre les séquences V4-39 (trouvé par vidjil, erroné), les V4-59 (attendues) et la sequence brut. On voit bien qu'effectivement la séquence avec une identité la plus forte est le V4-59 (enfin les, mais les variations sont minimes). Cependant, l'algo ne les considère même pas. Pire, si on lui fournit un jeu de séquences dans lequel l'ensemble des IGHV ne contient que les V4-59, il trouve la séquence en unseg.

Pensant aux evaleurs qui pourraient être faussées par le nombre de séquences, j'ai laissé les autres séquences mais remplacé les A par des G pour fausser la détéction sur les autres segments (solution barbare) : idem, il ne retrouve pas les V4-59.

Dernier point : un caractère inadéquate dans le header des séquences v4-59. A priori non. (J'ai testé d'intervertir avec le header du v4-39)

Je n'ai pas d'explications...

@mikael-s @magiraud

Edited Nov 09, 2017 by Thonier Florian
To upload designs, you'll need to enable LFS and have admin enable hashed storage. More information
Assignee
Assign to
Algo 2017.11
Milestone
Algo 2017.11
Assign milestone
Time tracking
None
Due date
None
Reference: vidjil/vidjil#2767