Filtrage par automate: prendre les N meilleures séquences
@boreec garde pour l'instant tous les gènes qui ont au moins 1 k-mer ayant matché. C'est plutôt ce critère (...) pur lequel on va jouer. Juste pour tester tu peux augmenter significativement ce critère (10 par exemple).
Après avoir fait cela, on pourra aussi tester de ne garder que les 5, 10 ou 20 gènes aillant le plus de k-mers (donc avec un sort
après le comptage par automate). Pour IGHV, cela garantira que tout ira bien plus vite... par contre il faudra vérifier la sensibilité.