Réarrangements incomplets
Patient MAQ : en lançant Vidjil en ligne de commande ./vidjil -V germline/IGK-INTRON.fa -J germline/IGK-KDE.fa -c clones data.fastq on trouve un clone en Intron-KDE qui ressort fortement (35987 reads)
Pour le patient MAQ en DD2/DD3 : rien. Mais ça vient des germlines. Le DD2 fait 9nt et on utilise une graine qui s'étend sur 11. Il faudrait récupérer la séquence en amont du DD2 et en aval du DD3.
|13+0=13| |rev-compl| actgggggatacgcacagtgctacaaaacctacagagacctgtac
En utilisant ces séquences-là (en local) on a un clone à 44584 reads.
|
|9+0=9| |rev-compl| tatactgatgtgtttcattgtgccttcctac et cette séquence-là pour le DD3 :
M22152|TRDD3*01|Homo sapiens|F|D-REGION|214..226|13 nt|1|
|
Sur bioinfo-inria on a cette séquence-là pour le DD2 :
M22153|TRDD2*01|Homo sapiens|F|D-REGION|34..42|9 nt|1|
Pour récupérer automatiquement les séquences amonts on peut peut-être utiliser l'API du NCBI (pour le faire automatiquement). Sinon on peut les stocker quelque part :)
Pour TRDD201 : http://eutils.ncbi.nlm.nih.gov/entrez/eutils/efetch.fcgi?db=nuccore&id=M22153&rettype=fasta&retmode=text&to=42 Pour TRDD301 : http://eutils.ncbi.nlm.nih.gov/entrez/eutils/efetch.fcgi?db=nuccore&id=M22152&rettype=fasta&retmode=text&from=214&to=258
b43f8672 pour récupérer les fichiers avec les séquences amont/aval et cffcd742, 7aaa26fd pour gérer les réarrangements incomplets (merci Mathieu)