Différences entre les séquences d'IMGT et celles récupérées en utilisant leur accession
Chaque gène provenant d'IMGT fait référence à un numéro d'accession et à des positions au sein de cette séquence.
Lorsqu'on récupère les germlines « classiques » on utilise directement les séquences en provenance d'IMGT alors que lorsqu'on récupère les germlines up ou down on passe en fait par le numéro d'accession pour extraire la séquence correspondante.
Avec la mise en place de #3009 (closed) il fallait vérifier que cela correspond bien.
Seule différence TRAJ13*02
.
D'après IMGT :
>AB258131|TRAJ13*02|Homo sapiens|F|J-REGION|101..163|63 nt|3| | || |63+0=63| | |
tgaattctgggggttaccagaaagttacctttggaactggaacaaagctccaagtcatcccaa
Le numéro d'accession est donc AB258131 et les positions sont 101 à 163. Mais quand on les extrait on obtient :
>AB258131.1:101-163|TRAJ13*02|Homo sapiens|F|J-REGION+down|Homo sapiens DNA, MLV integration site, partial sequence, clone: MLV-TPA-Mat-255
ttgggatgacttggagctttgttccagttccaaaggtaactttctggtaacccccagaattca
C'est en fait le reverse complement car IMGT n'indique pas dans son header que la séquence est reverse complémentée.
Je n'ai pas rencontré d'autres cas (pour les J).
Cela rend probablement nécessaire d'utiliser systématiquement les séquences d'IMGT pour ce qui est de la séquence du gène.