FineSegmenter donne UNSEG < delta_min sur des belles séquences -> supprimer delta_min
@flothoni : J'ai quelques séquences qui sont retrouvées dasn vidjil mais qui n'ont pas de noms définis. En investigants un peu sur celles-ci (via imgt-quest), il semblerait que vidjil n'ai pas assez d'informations pour discriminer les segments, en general entre les alleles. J'ai essayé de jouer sur la eval pour discriminer grossièrement, mais ça ne marche pas non plus.
Je ne sais aps si vous avez déjà eu le cas ou non. Du coup, il faudrait que vidjil retourne au moins le nom du seg, même si il ne peut pas discriminer l'allele quand ceux qu'il identifie son similaires.
Vous voyez une autre raison ou méthode pour "recupérer" ces séquences ?
Ps , les fichiers vidjil sont en pj.
@magiraud : L'algo parfois segmente certaines séquences par l'heuristique des k-mers (SEG_+
/SEG_-
) mais n'arrive pas à faire la désignation V(D)J (ce qu'on appelle le "FineSegmenter"), par exemple si les séquences sont vraiment bizarres (et dans ce cas on garde quand même la séquence dans le .vidjil, un clone est identifié, mais on ne sait pas le désigner)
... mais ici c'est clairement un bug, ce sont des beaux réarrangements.
algo/tests/bugs/bug20150909.fa
@magiraud : c5c781ec. On enlève le test, tout se passe bien. (Les séquences ont d'autres bugs, autre tâche)