notable/1541 : FineSegmenter
Ses reads sont courts (101bp de médiane) mais lancer vidjil avec -t 0
change tout.
Un clone majoritaire à 78,8% arrive :
>clone-001--IGH--0116483--78.8%--window
GTCCAGCCTGGTGGTAATAACTCGTAGCCGCGTCGTCAGGAAACCCTGGT
>clone-001--IGH--0116483--78.8%--YV85U:00714:00176-[13,94]-#4 - 82 bp (81% of 100.4 bp) ! @38 @37 IGH UNSEG only J/3' 2.046417e+02 2.046417e+02/1.306989e-09
GCAGTCGGGGGGGGGCGTGGTCCAGCCTGGTGGTAATAACTCGTAGCCGCGTCGTCAGGAAACCCTGGTCACCGTCTCCTCA
Ses reads sont courts : pourquoi ? La segmentation est-elle fiable ?
# 24 + VJ 0 42 73 100 seed IGH SEG_+ 1.816426e-14 2.318792e-17/1.814107e-14 _ _ _ _ _+H+H _ _ _ _ _ _ _ _ _ _ _ _ _+H+H+H+H+H+H+H+H+H+H+H _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _+h+h+h+h+h+h+h+h+h+h+h _ _ _ _ _
AGGTGCAGCTGCTGCAGTCGGGGGGGGGCGTGGTCCAGCCTGGTGGTAATAACTCGTAGCCGCGTCGTCAGGAAACCCTGGTCACCGTCTCCTCAGGTAAG
<------------------------FR1-IMGT------------------------->
S G G G V V Q P G G N N S * P R R Q E T L V T V S S
Query_1 3 AGTCGGGGGGGGGCGTGGTCCAGCCTGGTGGTAATAACTCGTAGCCGCGTCGTCAGGAAACCCTGGTCACCGTCTCCTCA 82
V 96.4% (27/28) IGHV3-30*12 17 ....T.......................---------------------------------------------------- 44
S G G G V V Q P G
V 90.3% (28/31) IGHV3-NL1*01 17 ....T.....A.................G..------------------------------------------------- 47
V 90.3% (28/31) IGHV3-30-5*02 17 ....T.....A.................G..------------------------------------------------- 47
D 100.0% (8/8) IGHD2-15*01 13 -------------------------........----------------------------------------------- 20
D 100.0% (8/8) IGHD4-23*01 8 --------------------------........---------------------------------------------- 15
D 100.0% (6/6) IGHD1-7*01 4 ---------------------------------......----------------------------------------- 9
J 96.3% (26/27) IGHJ5*02 24 -----------------------------------------------------....G...................... 50
J 96.3% (26/27) IGHJ4*02 21 -----------------------------------------------------....G...................... 47
J 100.0% (22/22) IGHJ5*01 29 ----------------------------------------------------------...................... 50
(durée de vie limitée je pense) http://mobyle.pasteur.fr/data/jobs/matcher/X04396900825024/matcher.align (seq : IGHV, seq2 : le read) On est au tout début du V
http://www.imgt.org/IMGTScientificChart/Nomenclature/IMGT-FRCDRdefinition.html
Répondu à Aurélie. notable/1541
à traiter un jour : pourquoi le FineSegmenter ne trouve pas la bonne solution, même en enlevant onlyBottomTriangle dans segment.cpp ?
Pour mémoire, onlyBottomTriangle : 513a047b