De-duplication de reads de capture
David BEL-Belfast souhaite enlever les doublons exacts de séquence. Pour de la bio-capture, la position des reads est plus ou moins aléatoire, bref ils ne devraient pas être exactement les mêmes. On pourrait avoir un server-pre-process qui fait cela.
C'est par contre problématique pour quantifier précisément (et/ou si on a beaucoup de reads. "Pour de la MRD il faudrait des UMI, mais pour le diag pas besoin."