De-duplication de reads de capture

David BEL-Belfast souhaite enlever les doublons exacts de séquence. Pour de la bio-capture, la position des reads est plus ou moins aléatoire, bref ils ne devraient pas être exactement les mêmes. On pourrait avoir un server-pre-process qui fait cela.

C'est par contre problématique pour quantifier précisément (et/ou si on a beaucoup de reads. "Pour de la MRD il faudrait des UMI, mais pour le diag pas besoin."

cc @mikael-s @flothoni

To upload designs, you'll need to enable LFS and have an admin enable hashed storage. More information