Configuration trop stringeante sur la recherche du D
Exemple : http://rbx.vidjil.org/browser/index.html?patient=3837&config=2 On prend le gros clone et les petits clones autour. La moitié a un D trouvé, pas l'autre moitié. Le D fait 22bp il n'est pas trouvé dès qu'il y a une erreur/mutation.
Alors il y a bien un problème mais il n'a rien à voir. Voir « Le résultat de la segmentation change selon le contexte » #2003
Notons que toutes les séquences ici ont normalement le même "multiplier" de E-value (nb de clones analysés).
... et effectivement, il y a bien un problème (de calcul de p-valeur) : cela semble gros qu'une seule mutation sur 22pb fasse tout louper.
Surtout qu'il y a une séquence avec une mutation dans le D, où le D est bien trouvé...
Seuil de e-valeur pour le D : .05 J'imagine qu'il y a une raison pour cette faible valeur, mais les D sont courts et atteindre de très faibles e-valeur est compliqué (à l'inverse de ce qu'on a avec le kmer segmenteur). Pourquoi le seuil est-il à 0,05 ?