Configuration trop stringeante sur la recherche du D

Exemple : http://rbx.vidjil.org/browser/index.html?patient=3837&config=2 On prend le gros clone et les petits clones autour. La moitié a un D trouvé, pas l'autre moitié. Le D fait 22bp il n'est pas trouvé dès qu'il y a une erreur/mutation.

Alors il y a bien un problème mais il n'a rien à voir. Voir « Le résultat de la segmentation change selon le contexte » #2003

Notons que toutes les séquences ici ont normalement le même "multiplier" de E-value (nb de clones analysés).

... et effectivement, il y a bien un problème (de calcul de p-valeur) : cela semble gros qu'une seule mutation sur 22pb fasse tout louper.

Surtout qu'il y a une séquence avec une mutation dans le D, où le D est bien trouvé...

Seuil de e-valeur pour le D : .05 J'imagine qu'il y a une raison pour cette faible valeur, mais les D sont courts et atteindre de très faibles e-valeur est compliqué (à l'inverse de ce qu'on a avec le kmer segmenteur). Pourquoi le seuil est-il à 0,05 ?

@magiraud @mikael-s

To upload designs, you'll need to enable LFS and have an admin enable hashed storage. More information