vidjil issueshttps://gitlab.inria.fr/vidjil/vidjil/-/issues2016-12-06T10:22:13+01:00https://gitlab.inria.fr/vidjil/vidjil/-/issues/1936Véracité des causes de non segmentation (et implications du -t ou -2)2016-12-06T10:22:13+01:00Vidjil TeamVéracité des causes de non segmentation (et implications du -t ou -2)Les causes de non segmentation varient grandement en fonction des paramètres utilisés, ce qui induit en erreur.
Par exemple sur des données de LLC, ajouter un -t 0 (par défaut -t 100), conduit à considérer le V dans toute sa longueur et ...Les causes de non segmentation varient grandement en fonction des paramètres utilisés, ce qui induit en erreur.
Par exemple sur des données de LLC, ajouter un -t 0 (par défaut -t 100), conduit à considérer le V dans toute sa longueur et donc le UNSEG too few V/J passe de ~10^5 à ~10^3, les séquences passant en fait en « UNSEG only V/5' ». Cela amène d'ailleurs à se poser la question de la pertinence de -t 100 : il y a des séquences qui contiennent vraiment du V mais dont on pense qu'elles n'en ont pas à cause du -t 100.
Par ailleurs sur ces mêmes données, utiliser un -2 fait passer une très grosse partie des séquences de « UNSEG only V/5' » à « UNSEG only J/3' » pour une raison que je n'explique pas.
Les données en question : patient 1803 et 1806 (Lille).
***
@magiraud @mikael-shttps://gitlab.inria.fr/vidjil/vidjil/-/issues/5065Warning si deux clonotype sont similaire hors primers + Mieux afficher primers2022-10-12T12:03:08+02:00Thonier FlorianWarning si deux clonotype sont similaire hors primers + Mieux afficher primers~"LIL-Lille" nous montre un sample avec 2 clonotypes identiques à un nucléotide près. Ce nucléotide est en fait une divergence présente dans les primers JH et ne devrait donc pas mener a voir deux clonotypes différents.
* [x] Il faudrai...~"LIL-Lille" nous montre un sample avec 2 clonotypes identiques à un nucléotide près. Ce nucléotide est en fait une divergence présente dans les primers JH et ne devrait donc pas mener a voir deux clonotypes différents.
* [x] Il faudrait déjà pouvoir les détecter et indiquer que les séquences sont extrêmement similaires. Probablement déjà la cas, mais nous n'avons pas accès aux données pour le moment. -> Il y a déjà bien le warning W53 (highly similar).
* [ ] Être plus spécifique en indiquant que la variation est située au niveau du primer. Pour ça, il faut être capable d'exploiter les données des primers.
* [ ] À terme, pouvoir en faire un merge automatique depuis l'algo, mais dans ce cas il faut trancher sur le nucléotide à privilégier. Dans le cas présent, les deux clonotypes sont présent dans la même proportion. S'appuyer sur la séquence germline ?https://gitlab.inria.fr/vidjil/vidjil/-/issues/1582stanford-label-FaW.should_get et -t 1002019-03-08T17:27:59+01:00Vidjil Teamstanford-label-FaW.should_get et -t 100qu'est-ce ?
***
3e6ace0. Cela ne doit pas être bien grave, mais j'y suis pas arrivé en 5 minutes.
-t 100 change les fenêtres de S22
***
@magiraud @mikael-squ'est-ce ?
***
3e6ace0. Cela ne doit pas être bien grave, mais j'y suis pas arrivé en 5 minutes.
-t 100 change les fenêtres de S22
***
@magiraud @mikael-s