P-value / E-value du segmenter (nb de k-mers gauche + droite)
C'est clairement ce qu'il nous faut. Cela permettrait d'aller essayer de nouvelles germlines bizarres, des translocations, le MAX12...
Pour simplifier, supposons que le point de segmentation est fixé.
Version simple : e-valeur d'avoir le nb de V à gauche, et le nb de J à droite. Juste deux appels à ce qui existe déjà. Cela permettra déjà d'enlever les cas où il y a un pauvre V tout seul qui traîne.
Version mieux : On se rapproche de la e-valeur d'une recombinaison. A gauche, on regarde aussi le nb de J, et il ne doit pas être gros. (mais finalement, notre heuristique pour trouver le point de seg garantit déjà qu'il n'y a pas trop de J à gauche).
Dans les deux cas, on pourrait avoir le index_load pour V et J différents, mais, bon, on peut prendre le même dans un premier temps. (et dans les deux cas, on pourrait itérer sur le point de seg pour avoir une formule exacte ? euh, pas sûr)
34068e0b, version simple. À un moment, j'ai pensé combiner gauche et droite, mais cela ne marche tout simplement pas (on peut avoir 1e-60 à droite, et du bruit à gauche).