Aho : Séquences segmentées VD au lieu de VJ
La séquence IGH suivante devrait être segmentée en IGH :
>IGHV4-31*03 0/TCCT/1 IGHD3-22 3/AGCG/8 IGHJ4 [IGH]
AGGTGCAGTGGAGCAGTCGGGCCCAGGACTGGTGAAGCCTTCACAGACCCTGTCCCTCACCTGCACTGTCTCTGGTGGTCCATAGCAGTGGTGGTTACTACTGGAGCTGGATCCGCCAGCACCCAGGGAAGGGCCTGGAGTGGATTGGGTACATCTATTACAGTGGGAGCACCTATACAACCCGTCCCTCAAGAGTCGAGTTACCATATCAGTAGACACGTCTAAGAACCAGTTCTCCCTGAAGCTGAGCTCTGTGACTGCCGCGGACACGGCCGTGTATTACTGTGCGAGAGATCCTTATTACTATGATAGTAGTGGTTATTACAGCGGACTACTGGGGCCAGGAACCTGGTCACCGTCGTCCTGCAGGTAAG
Mais avec Aho ce n'est pas le cas. Car dans le cas où le germline est unexpected, il y a plus de k-mers Dh (les +V
ci-dessous) que de k-mers Jh (les +h
ci-dessous). Du coup la e-valeur est meilleure en faisant du V-D que du V-J !
# 258 + VJ 1 292 299 374 seed unexpected SEG_+ 3.376699e-37 0.000000e+00/3.376699e-37
_ _ _+H _ _+G _ _ _ _ _ _ _+H+H+H+H+H+H+H ?+H+H+H+H+H+H+H+H+H ?+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H
+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H _ _ _ _ _ _ _ _ _ _ _ _+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H
+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H ?+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+A _
+H ?+H+H+H+H+H+H _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _+V+V+V ?+V+V+V+V+V+V+V+V+V+V+V _ _ _ _ _ _ _+L _ _ _
_ _ _ _ _+h+h+h+h _ _ _ _ _ _ _ _ _ _ _ _ _ _+h _ _ _ _ _ _ _ _ _ _ _ _+K-L _ _ _ _ _ _ _ _ _ _ _ _
@magiraud Une idée autre que celle de pénaliser arbitrairement le unexpected ?
Et pas sûr que #1878 arrange les choses là-dessus.