vidjil issueshttps://gitlab.inria.fr/vidjil/vidjil/-/issues2020-12-11T13:15:02+01:00https://gitlab.inria.fr/vidjil/vidjil/-/issues/3304Calcul de la séquence consensus : changer le choix des reads utilisés2020-12-11T13:15:02+01:00Mikaël SalsonCalcul de la séquence consensus : changer le choix des reads utilisésPour des questions d'optimisation tous les reads ne sont pas stockés et nous n'utilisons qu'un échantillon des reads d'un clone (pour les gros clones) afin de calculer le consensus. Ce choix est géré dans la classe `ReadQualityScore` du ...Pour des questions d'optimisation tous les reads ne sont pas stockés et nous n'utilisons qu'un échantillon des reads d'un clone (pour les gros clones) afin de calculer le consensus. Ce choix est géré dans la classe `ReadQualityScore` du fichier `read_score.cpp` : on se base à la fois sur le dernier percentile de la qualité du read et sur la longueur du read. Les reads les plus longs et de meilleure qualité sont donc choisis.
On va donc biaiser le choix en faveur des séquences les plus longues. Ce qui est à la fois souhaitable : pour des raisons de qualité de séquençage on pourrait se retrouver avec uniquement une faible portion des reads du clone qui sont de pleine longueur (si on a beaucoup d'erreurs sur R2 le merge va échouer par exemple). Et c'est à la fois non souhaitable car on va privilégier les séquences les plus longues qui ne sont pas forcément représentatives du clone (cf. #3290).
Une solution serait de se contenter d'un échantillon aléatoire des reads de meilleure qualité (ce qui est plus représentatif du clone). Cela pose la question de comment constituer cet échantillon aléatoire au fur et à mesure sans connaitre a priori la taille du clone et sans biaiser en faveur des premiers ou des derniers reads.
Si cette solution donne une séquence consensus dont la longueur n'est pas satisfaisante on peut ensuite passer à une autre stratégie privilégiant les longueurs les plus élevées.
Mais je n'arrive pas à voir une solution unique qui donnerait le résultat attendu dans tous les cas.https://gitlab.inria.fr/vidjil/vidjil/-/issues/3301Allèles non *01 (non-génome de référence) et up-downstream2018-07-20T15:38:51+02:00Mathieu GiraudAllèles non *01 (non-génome de référence) et up-downstreamSpécialisation de #3009 pour les allèles `*02` et autres
@mikael\-s, https://gitlab.inria.fr/vidjil/vidjil/merge_requests/148#note_99385:
> En fait on ne sait pas récupérer la séquence aval de IGHJ6*02 car c'est un allèle
Décide-t-on...Spécialisation de #3009 pour les allèles `*02` et autres
@mikael\-s, https://gitlab.inria.fr/vidjil/vidjil/merge_requests/148#note_99385:
> En fait on ne sait pas récupérer la séquence aval de IGHJ6*02 car c'est un allèle
Décide-t-on de
- prendre la même séquence aval que le génome (et que `*01`) ? Pourquoi pas, mais... il peut y avoir aussi des mutations dans les séquences aval, non connues dans le génome de référence et cachées ailleurs
- ne pas prendre de séquence aval pour `*02` ? Cela crée une dissymétrie, mais, d'un autre côté, si on a beaucoup d'aval qui colle parfaitement avec `*01`, c'est difficile de dire qu'on devrait coller à `*02` ?https://gitlab.inria.fr/vidjil/vidjil/-/issues/3225Filtrage par automate : prendre les N meilleures séquences et leurs « voisines »2018-10-10T15:37:05+02:00Mikaël SalsonFiltrage par automate : prendre les N meilleures séquences et leurs « voisines »En général je pense que #3217 avec N = 1 donnera de bons résultats (en gérant les ex-aequo). Mais on aura probablement des situations où la vraie séquence est en fait en 2è ou 3è position mais juste avec quelqes k-mers de moins.
On pour...En général je pense que #3217 avec N = 1 donnera de bons résultats (en gérant les ex-aequo). Mais on aura probablement des situations où la vraie séquence est en fait en 2è ou 3è position mais juste avec quelqes k-mers de moins.
On pourrait dire qu'on prend N = 5 pour prendre une marge de sécurité pour ces cas-là. Mais c'est dommage de prendre 5 gènes dans le cas où le premier est largement devant en termes de nombres de k-mers trouvés.
On pourrait plutôt se dire qu'on prend les N meilleures séquences et leurs voisines proches en termes de nombres de k-mers trouvés, si elles existent. Toute la question est comment définir que le nombre d'occurrences est suffisamment proche ?
S'il est à 0, on a un ex aequo et on considère déjà qu'on doit le prendre.
Si on a 1 k-mer de moins, on sent bien que ce n'est pas très significatif et qu'on devrait prendre ce gène en considération aussi.
Si on a une erreur de séquençage qui nous éloigne du vrai gène et qui nous rapproche, à tort, d'un autre gène, cela peut nous faire perdre k k-mers.
Mais la distance permise dépend aussi de la longueur du gène : il est normal de tolérer une distance plus grande pour des gènes plus grands.
Faut-il avoir des calculs de probabilités ?Algo 2018.09https://gitlab.inria.fr/vidjil/vidjil/-/issues/3219Fusion de reads : essayer Flash (et BBMerge ?)2020-03-20T12:51:41+01:00Mikaël SalsonFusion de reads : essayer Flash (et BBMerge ?)Dans la publi d'OAS (cf. vdj#677) ils disent utiliser FLASH pour fusionner les reads :
* Site d'origine : https://ccb.jhu.edu/software/FLASH/
* Github : https://github.com/dstreett/FLASH2
L'avantage c'est que c'est open source.
Un arti...Dans la publi d'OAS (cf. vdj#677) ils disent utiliser FLASH pour fusionner les reads :
* Site d'origine : https://ccb.jhu.edu/software/FLASH/
* Github : https://github.com/dstreett/FLASH2
L'avantage c'est que c'est open source.
Un article compare plusieurs logiciels de fusion (dont le leur, BBMerge, qui est évidemment le meilleur) : http://journals.plos.org/plosone/article?id=10.1371/journal.pone.0185056
Flash semble faire moins d'erreur que PEAR et être plus rapide. Flash est aussi plus rapide que BBMerge sur 1 thread. Mais il semble moins correct que BBMerge (d'après leur évaluation…). C'est Flash 1 qui est testé et non Flash 2. BBMerge ne semble pas être distribué seul mais au sein d'un package regroupant d'autres logiciels ce qui risque de rendre la distribution moins pratique.Thonier FlorianThonier Florianhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/3178Ajout de samples : « specific set » est peu clair2018-04-17T14:58:48+02:00Mikaël SalsonAjout de samples : « specific set » est peu clairOn ne sait pas bien à quoi se rapporte le champ « specific set ».
Être plus clair : « Associated patient/run/set » ?
De même il y a le champ « Common set », à remplacer par « Common patient/run/set » ?On ne sait pas bien à quoi se rapporte le champ « specific set ».
Être plus clair : « Associated patient/run/set » ?
De même il y a le champ « Common set », à remplacer par « Common patient/run/set » ?https://gitlab.inria.fr/vidjil/vidjil/-/issues/3130Informations pour la LLC dans le rapport2022-04-19T17:14:54+02:00Mikaël SalsonInformations pour la LLC dans le rapportDans le rapport on ne sort pas des informations comme la productivité (calculée par Vidjil) ou sur le % d'homologie avec le V (récupéré d'IMGT (cf. #2819) ou si on le calcule en interne (#3131)) qui sont pertinentes pour la LLC.Dans le rapport on ne sort pas des informations comme la productivité (calculée par Vidjil) ou sur le % d'homologie avec le V (récupéré d'IMGT (cf. #2819) ou si on le calcule en interne (#3131)) qui sont pertinentes pour la LLC.Web 2022.05https://gitlab.inria.fr/vidjil/vidjil/-/issues/3111Inclure les données de diversité dans le resultat de fuse2018-03-30T10:07:17+02:00Thonier FlorianInclure les données de diversité dans le resultat de fuseLes données de diversité ne sont pas inclussent dans le résultat du fuse. Il faudrait les prendre en compte.
Vous validez ?
@magiraud @mikael-sLes données de diversité ne sont pas inclussent dans le résultat du fuse. Il faudrait les prendre en compte.
Vous validez ?
@magiraud @mikael-sThonier FlorianThonier Florianhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/3104Comment organiser les recombinaisons vdj mediées2018-08-07T09:17:20+02:00Thonier FlorianComment organiser les recombinaisons vdj mediéesOn est confronté avec ikaros et ERG à un nouveau type de germline. Il faut prévoir une protocole assez flexible pour permettre d'intégré à la volée des systèmes similaires.
Pour l'instant je propose de passer par un germline ``homo-sapi...On est confronté avec ikaros et ERG à un nouveau type de germline. Il faut prévoir une protocole assez flexible pour permettre d'intégré à la volée des systèmes similaires.
Pour l'instant je propose de passer par un germline ``homo-sapiens-xxx.g`` spécifique de toutes ces configurations.
Je rajouterais aussi dans ce cas un point dans le doc du germline pour expliquer la démarche (il doit déjà y avoir un mot de souvenir).
cf #2139;
cc @magiraud @mikael-sThonier FlorianThonier Florianhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/3063conserver le path lors du chargement de plusieurs fichiers2018-03-05T16:54:28+01:00Thonier Florianconserver le path lors du chargement de plusieurs fichiersAurélie qui semble utiliser le chargement directement depuis le serveur ne conserve pas le chemin relatif précédent à ses anciens chargements. Plus précisément, lors du chargement de chaque fichier, elle doit dérouler l'ensemble de son a...Aurélie qui semble utiliser le chargement directement depuis le serveur ne conserve pas le chemin relatif précédent à ses anciens chargements. Plus précisément, lors du chargement de chaque fichier, elle doit dérouler l'ensemble de son arborescence pour retrouver le nouveau fichier à uploader (à priori 7 sous-dossiers a traverser).
Je ne sais pas quelle serait la meilleur solution.
* On peut conserver dans la session le chemin relative au chargement précédent et le précharger dans le `jstree` ?
* Autre point, si on connaît le dossier à partir duquel tous les fichiers sont chargés, on peut modifier le point de montage par défaut pour qu'il pointe dessus, mais pour ça il faut que tous les fichiers a charger proviennent de ce dossier.
cc @RyanHerb @mikael-s @magiraudhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/3054Avoir plus d'informations sur PEAR2021-02-03T09:06:41+01:00Thonier FlorianAvoir plus d'informations sur PEARJ'ai eu le cas dernièrement d'un assemblage de PEAR qui retournait des reads très courts, et donc avec 60% qui n'ont pas pu être mergés. J'aurais aimé avoir plus d'informations sur l'état des fastq avant/après le merge, et quelques infor...J'ai eu le cas dernièrement d'un assemblage de PEAR qui retournait des reads très courts, et donc avec 60% qui n'ont pas pu être mergés. J'aurais aimé avoir plus d'informations sur l'état des fastq avant/après le merge, et quelques informations en plus comme par exemple en #2242.
Ici l'idée serait de rajouter dans le rapport un petit script/soft qui vérifie combien de reads étaient dans les fichiers de départ, la longueur moyenne, médiane, ...
cc @magiraud @mikael-s https://gitlab.inria.fr/vidjil/vidjil/-/issues/2898Menu normalisation quand il n'y a pas eu de normalisation2023-11-06T11:47:32+01:00Mathieu GiraudMenu normalisation quand il n'y a pas eu de normalisationà réfléchir : enlever le none ? autre chose ?
cc @aurelBZHà réfléchir : enlever le none ? autre chose ?
cc @aurelBZHprod-client-nexthttps://gitlab.inria.fr/vidjil/vidjil/-/issues/2848Avoir l'info du login/logout toujours visible en haut à droite2020-11-19T12:02:20+01:00Thonier FlorianAvoir l'info du login/logout toujours visible en haut à droiteL'idée ici est de ne pas passer par l'ouverture de la DB pour se déconnecter. De plus, avoir une vue rapide sur l'utilisateur que l'on est (cas d'un labo avec un pc servant à plusieurs tech par exemple).
Cette information pourrait se t...L'idée ici est de ne pas passer par l'ouverture de la DB pour se déconnecter. De plus, avoir une vue rapide sur l'utilisateur que l'on est (cas d'un labo avec un pc servant à plusieurs tech par exemple).
Cette information pourrait se trouver dans la barre de menu, à droite.https://gitlab.inria.fr/vidjil/vidjil/-/issues/2843La valeur des paramètres n'est pas forcement celle appliquée lors d'un charge...2022-06-22T10:02:08+02:00Thonier FlorianLa valeur des paramètres n'est pas forcement celle appliquée lors d'un chargement d'analyselié à #2842:
lors d'un chargement d'un fichier et de son analyse, on se retrouve parfois avec les settings qui ont été enregistrés et sauvegardés dans le `analysis` (il me semble), cependant, on ne positionne pas les settings sur cett...lié à #2842:
lors d'un chargement d'un fichier et de son analyse, on se retrouve parfois avec les settings qui ont été enregistrés et sauvegardés dans le `analysis` (il me semble), cependant, on ne positionne pas les settings sur cette valeur ce qui provoque une discordance.
Il faut donc modifier lors du chargement d'une analyse la valeur du setting.https://gitlab.inria.fr/vidjil/vidjil/-/issues/2838Pouvoir unifier le short_name et l'affichage des insert2018-08-07T09:13:18+02:00Thonier FlorianPouvoir unifier le short_name et l'affichage des insertUne remaque d'Aurélie à ~"LIL-Lille" lié à #2789: Elle trouve plus propre d'avoir une clone name où les insert sont unifié (remarque qui n'est pas partagé par Nathalie).
Du coup, on revient à ce qui était proposé au début de cette tâche...Une remaque d'Aurélie à ~"LIL-Lille" lié à #2789: Elle trouve plus propre d'avoir une clone name où les insert sont unifié (remarque qui n'est pas partagé par Nathalie).
Du coup, on revient à ce qui était proposé au début de cette tâche. On ne peux pas imaginer avec une autre option de setting pour ce format ?
PS : je creer une autre tâche que la #2789 car il s'agit ici de proposer une option dans le setting et non pas de la valeur seuil.https://gitlab.inria.fr/vidjil/vidjil/-/issues/2721Pre-process : essayer VDJPipe2023-06-28T17:06:58+02:00Mikaël SalsonPre-process : essayer VDJPipehttps://bmcbioinformatics.biomedcentral.com/articles/10.1186/s12859-017-1853-z
Ils font notamment du read merging (remplacer PEAR ?), et de-duplicating (intéressant pour la capture).https://bmcbioinformatics.biomedcentral.com/articles/10.1186/s12859-017-1853-z
Ils font notamment du read merging (remplacer PEAR ?), et de-duplicating (intéressant pour la capture).https://gitlab.inria.fr/vidjil/vidjil/-/issues/2676Aligneur : inspiration externe2020-10-14T13:50:01+02:00Mikaël SalsonAligneur : inspiration externeVoici un exemple de ce qui se fait ailleurs, pour des fonctionnalités qui ressemblent en partie à notre segmenteur : https://franklin.lelab.tailordev.fr/
La partie avec la séquence et les soulignements est faite en SVG.
À voir si des c...Voici un exemple de ce qui se fait ailleurs, pour des fonctionnalités qui ressemblent en partie à notre segmenteur : https://franklin.lelab.tailordev.fr/
La partie avec la séquence et les soulignements est faite en SVG.
À voir si des choses nous inspirent.https://gitlab.inria.fr/vidjil/vidjil/-/issues/2609ajouter information sur les patients ouvert par un utilisateur dans la database2022-06-21T14:05:14+02:00Thonier Florianajouter information sur les patients ouvert par un utilisateur dans la databasePour faire suite aux remarques en #2605, # 2606 et #2607, voici mes petites réflexions initiales :
Il faut pour pouvoir effectuer ces tâches que l’information soit présente dans la base de données.
En y réfléchissant un peu plus, je p...Pour faire suite aux remarques en #2605, # 2606 et #2607, voici mes petites réflexions initiales :
Il faut pour pouvoir effectuer ces tâches que l’information soit présente dans la base de données.
En y réfléchissant un peu plus, je pense que le mieux serait d’avoir l' information pour chaque utilisateur et non pas sur les fichiers, comme ça même si plusieurs membres d'une équipe consulte le même patient (par exemple le tech qui lance le run et vérifie son bon déroulement, et le praticien qui consulte les résultat pour les interpréter) ne se croiserait pas.
Il faut donc que lorsqu'un job se met en attente, tourne ou se termine, il mette à jours ses entrée pour l'ensemble des membre du groupe dans le DB.https://gitlab.inria.fr/vidjil/vidjil/-/issues/2607ajouter une colonne statut dans le vue patient2022-06-21T13:56:48+02:00Thonier Florianajouter une colonne statut dans le vue patientUne idée saugrenue serait d’afficher dans la liste des patients (ou runs/sets) une colonne avec une petite gomette qui indiquerait l'état d'analyse du patient.
Par exemple :
* rond blanc : patient crée mais pas de données dispo
* gris,...Une idée saugrenue serait d’afficher dans la liste des patients (ou runs/sets) une colonne avec une petite gomette qui indiquerait l'état d'analyse du patient.
Par exemple :
* rond blanc : patient crée mais pas de données dispo
* gris, pas d'analyse lancée, mais des fichiers déposés
* orange : des jobs sont en attente/cours
* vert : tous les jobs du patient sont terminées.
* autre couleur (sur la ligne cette fois) : le patient a été ouvert par l'utilisateur depuis les dernières analyses. Permettrait de faire ressortir directement les patients ayant été récemment mis à jours.
Ps: comme pour l'autre nécessiterait un ajout dans la DB.
@magiraud @mikael-s @RyanHerbhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/2567possibilité de revenir en arrière après normalisation2021-11-23T15:43:40+01:00Ghost Userpossibilité de revenir en arrière après normalisationIl pourrait etre utile de permettre un retour au valeur de base apres normalisation. avec peut etre un bouton annuler?Il pourrait etre utile de permettre un retour au valeur de base apres normalisation. avec peut etre un bouton annuler?https://gitlab.inria.fr/vidjil/vidjil/-/issues/2566clareté de l'affichage de la normalisation2021-11-23T15:40:24+01:00Ghost Userclareté de l'affichage de la normalisationDans l'interface rien n'indique qu'une normalisation a eu lieu . Il pourrait etre interessant d'afficher le pourcentage normaliser tout en laissant affiché le pourcentage non normalisé.Dans l'interface rien n'indique qu'une normalisation a eu lieu . Il pourrait etre interessant d'afficher le pourcentage normaliser tout en laissant affiché le pourcentage non normalisé.