Adapters Illumina
Environ un tiers des fichiers *.gz
dans /mnt/upload
contiennent au moins 1000 reads avec exactement l'adaptateur Ilumina après index (25 bp) : ATCTCGTATGCCGTCTTCTGCTTG
Ce n'est pas un bug de notre côté mais de nos utilisateurs....
https://support.illumina.com/downloads/illumina-customer-sequence-letter.html https://support.illumina.com/content/dam/illumina-support/documents/documentation/chemistry_documentation/experiment-design/illumina-customer-sequence-letter.pdf
Outils pour enlever adaptateurs : http://www.usadellab.org/cms/?page=trimmomatic
Pourquoi ces adaptateurs sont là ?
Dans Vidjil, faire un warning s'il y a beaucoup d'adaptateurs ? #2247 (closed) Faire un traitement spécifique avec une cause de non-segmentation ? (d'un autre côté, on peut segmenter si la séquence est propre ensuite...)
Dans le git bonsai, vdj/seq/adapters.fa