Mettre au point le clustering automatique
Les clusters fonctionnent, comme par exemple avec la config TRG-cluster. Il faut se replonger dans les distances et tutti quanti
Tests de la config TRG + Cluster sur Van Cel
Au programme du prochain Vidjil Day
Il faut le faire un jour. Discussion métro : autant faire en .js plutôt qu'en C++
Pas vraiment de merge automatique (c'est toujours l'user), mais
- soit on visualise le graphe (hum, pas super facile)
- soit on visualise le graphe restreint à un clone (distance de tous les autres clones par rapport au clone sélectionné)
- ou on visualise le graphe en "paquets", 8-16 paquets principaux à des positions fixes
- ou même, sans visualisation, auto-sélection : on sélectionne un clone, il sélectionne ceux qui sont à une distance <= epsilon. Pratique, on n'a plus qu'à aligner, vérifier et merger
Voici un argument contre le clustering automatique : QC29 faits par plusieurs centres avec différents séquenceurs. Il y a des petites mutations reproductibles indépendamment du centre de séquençage. Du clustering les aurait regroupés, cachant ces sous-clones.
ping
#1323 (closed), #1324 (closed)