vidjil issueshttps://gitlab.inria.fr/vidjil/vidjil/-/issues2021-01-26T13:29:14+01:00https://gitlab.inria.fr/vidjil/vidjil/-/issues/2767Vidjil-algo ne trouve pas la correspondance si déletion supérieur à 100nt.2021-01-26T13:29:14+01:00Thonier FlorianVidjil-algo ne trouve pas la correspondance si déletion supérieur à 100nt.Une séquence fournie par un utilisateur n'est pas correctement annotée par vidjil. Je met cette séquence dans le should-vdj.
J'ai fait un alignement entre les séquences `V4-39` (trouvé par vidjil, erroné), les `V4-59` (attendues) et la ...Une séquence fournie par un utilisateur n'est pas correctement annotée par vidjil. Je met cette séquence dans le should-vdj.
J'ai fait un alignement entre les séquences `V4-39` (trouvé par vidjil, erroné), les `V4-59` (attendues) et la sequence brut. On voit bien qu'effectivement la séquence avec une identité la plus forte est le V4-59 (enfin les, mais les variations sont minimes). Cependant, l'algo ne les considère même pas. Pire, si on lui fournit un jeu de séquences dans lequel l'ensemble des IGHV ne contient que les V4-59, il trouve la séquence en `unseg`.
Pensant aux evaleurs qui pourraient être faussées par le nombre de séquences, j'ai laissé les autres séquences mais remplacé les A par des G pour fausser la détéction sur les autres segments (solution barbare) : idem, il ne retrouve pas les V4-59.
Dernier point : un caractère inadéquate dans le header des séquences v4-59. A priori non. (J'ai testé d'intervertir avec le header du v4-39)
Je n'ai pas d'explications...
@mikael-s @magiraudAlgo 2017.11Mikaël SalsonMikaël Salsonhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/1208Regénérer test.data/test.vidjil2016-11-29T14:33:12+01:00Vidjil TeamRegénérer test.data/test.vidjilLe fichier test.data ne fonctionne plus sur rbx : http://rbx.vidjil.org/browser/?data=http://rbx.vidjil.org/browser/test.vidjil on a maintenant un message d'erreur. Il faudrait le regénérer mais quel est le patient qui a servi au test.da...Le fichier test.data ne fonctionne plus sur rbx : http://rbx.vidjil.org/browser/?data=http://rbx.vidjil.org/browser/test.vidjil on a maintenant un message d'erreur. Il faudrait le regénérer mais quel est le patient qui a servi au test.data ? On devrait avoir un lien symbolique (sur le système) pour montrer quel est le fichier d'origine.
***
Fait, et fonctionne vidjil+analysis. Notons qu'on ne peut pas mettre de lien symbolique vers un fichier de la db, ce ne serait pas robuste.
***
@Duez @mikael-s @magiraudhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/1164test.data : faire un nouveau fichier2021-11-08T16:18:36+01:00Vidjil Teamtest.data : faire un nouveau fichierMessages d'erreur de la console Chromium :
GET http://vidjil.local/js/lib/jquery.min.map 404 (Not Found) /js/lib/jquery.min.map:1
Uncaught TypeError: Cannot read property 'selectAll' of undefined graph.js:331
***
Mikaël, est-ce toujou...Messages d'erreur de la console Chromium :
GET http://vidjil.local/js/lib/jquery.min.map 404 (Not Found) /js/lib/jquery.min.map:1
Uncaught TypeError: Cannot read property 'selectAll' of undefined graph.js:331
***
Mikaël, est-ce toujours confirmé ?
***
Oui et non. Le fichier test.data a été supprimé par 284c296 (hum) ce qui m'empêche de vérifier. Ce qui empêche aussi de lancer les tests browser…
***
aïe, désolé... cela ne se produira plus lorsque les tests browsers seront intégrés :)
Sur rbx, il y a maintenant demo/LIL-L2.vidjil (quand je l'avais mis, c'était pour avoir aussi le nouveau format).
Ok pour remettre cela sur le git... autant faire directement la tache "avoir un meilleur fichier de démo"
***
Fichier de test ≠ Fichier démo, non ? Pourquoi les deux devraient être identiques ? Les tests navigateurs de Marc ont été faits pour (l'ancien) test.data si on utilise d'autres données les concentrations, couleurs, séquences ne seront plus les mêmes et casseront du coup les tests.
***
ah oui. Et bien tu peux essayer un "git revert 284c296"... mais le fichier n'est plus reconnu, le format n'est pas le bon.
Faut-il essayer de le réparer ? Ou de le reprendre d'ailleurs (est-ce LIL-L2 ?)
Ou bien d'en choisir un autre, quitte à remettre certaines valeurs ?
(Si test ≠ démo, le fichier test pourrait être plus petit et truandé à la main pour avoir tous les cas bizarres que l'on veut)
***
(Le fichier demo sur rbx est bien différent de l'ancien test.data)
***
je peux être volontaire pour remettre les bonnes valeurs numériques si on prend un nouveau fichier propre
***
- multisystème (dont un incomplet)
- plusieurs clones (tester cluster)
- plusieurs points
***
@magiraud @mikael-s @Duezhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/3216Utilisation des séquences "cibles"2023-06-28T16:58:04+02:00Thonier FlorianUtilisation des séquences "cibles"Problème de Patrick :
> comparer le nombre de read d’un patient (pour une cible) à la moyenne des reads de cette cible sur l’ensemble des patients (ou sur une cohorte définie, par exemple 200 patients de notre site). Ceci nous permettra...Problème de Patrick :
> comparer le nombre de read d’un patient (pour une cible) à la moyenne des reads de cette cible sur l’ensemble des patients (ou sur une cohorte définie, par exemple 200 patients de notre site). Ceci nous permettra d’avoir des critères d’acceptation du run.
Pour ce faire, il faut faire une recherche de cette cible sur l’ensemble des samples sélectionnées:
* Premier point : il faut déjà pouvoir spécifier la cible.
* Pouvons-nous nous contenter de le faire sur la liste des clones disponible dans les fichiers vidjil ? Nous pourrions alors passer à côté d'une séquence qui ne correspond pas à un clone du top 100, mais qui pourrait avoir son intérêt quand même.
* Rechercher sur le fichier source de séquençage ? Certainement plus long d'un point de vue informatique, mais cela reste-t-il de l'ordre du raisonnable ?
* Faudra-t-il utiliser des séquences dégénérées ?
Autre solution: passer par cloneDB. Serait-ce plus simple d'un point de vue technique ? Cela permettrai-t-il la même granulométrie dans la recherche pour l'inclusion des divers échantillons ?
@Patrick : Aurais-tu un exemple de cible que tu cherches , les samples associés, et ce que tu as (ou t'attends) a retrouver stp ?
@magiraud @mikael\-shttps://gitlab.inria.fr/vidjil/vidjil/-/issues/1367Rentrer des données externes depuis le client ou la db2019-11-26T18:36:50+01:00Vidjil TeamRentrer des données externes depuis le client ou la dbOn aimerait pouvoir rentrer les données qPCR transmises par Aurélie sur un certain nb de points. On pourrait à la main éditer les fichiers .analysis, mais ce n'est pas génial.
Faut-il faire une interface pour rentrer / corriger un point...On aimerait pouvoir rentrer les données qPCR transmises par Aurélie sur un certain nb de points. On pourrait à la main éditer les fichiers .analysis, mais ce n'est pas génial.
Faut-il faire une interface pour rentrer / corriger un point de données externes ? Directement sur le browser ? ou sur la page de db (bof) ?
Vidjil n'est pas un tableur :-)
***
Jack serait intéressé ? (à discuter en avril)
***
@Duezhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/3263Des analyses avec des BAM ne fonctionnent pas2020-01-22T15:48:29+01:00Thonier FlorianDes analyses avec des BAM ne fonctionnent pasJe tombe depuis quelques jours sur des bugs lors de lancement d'analyses de fichiers `BAM`.
Au début, comme il y avait des souci avec le missing id, je pensais à un lien. Il apparaît très clairement maintenant que le souci est ailleurs...Je tombe depuis quelques jours sur des bugs lors de lancement d'analyses de fichiers `BAM`.
Au début, comme il y avait des souci avec le missing id, je pensais à un lien. Il apparaît très clairement maintenant que le souci est ailleurs. En regardant le log complet de vidjil, je me rend compte qu'il est incapable de traiter le fichier :
```bash
vidjil-algo: bam.cpp:77: virtual void OnlineBAM::next(): Assertion `(bam_entry->core.flag & (1 | 64 | 128)) == 0' failed.
```
Je ne comprend pas vraiment l'erreur. Comme je n'ai pas d'autres fihciers bam en main, j'en ai téléchargé un depuis le serveur vidjil poru faire des tests. Il se trouve que sur celui-ci vidjil fonctionne parfaitement. J'ai alors pensé à des fichiers corrompus. J'ai alors voulu lancé une analyse via la commande suivante:
```bash
samtools quickcheck -v *.bam > bad_bams.fofn && echo 'all ok' || echo 'some files failed check, see bad_bams.fofn'
```
Le résultat montre que les deux fichiers (celui compatible vidjil et l'autre) sont à priori correctement formatés.
En soit, il ne semble donc pas être corrompus. Je vais quand même demander à l'utilisateur de me fournir un md5sum au cas ou. Le souci est que si l'erreur est en amont, a sa propore génération par le séquenceur, ca ne résoudra pas le souci.
en attendant, si ce n'est pas la source de l'erreur, je ne sais pas quoi faire d'autre.
@mikael\-s : Toi qui a dev la fonction pour les BAM, tu as une idée de la raison ?https://gitlab.inria.fr/vidjil/vidjil/-/issues/3103Recombinaison avec ERG2018-08-30T14:51:55+02:00Thonier FlorianRecombinaison avec ERGWith the same protocole than for IKZF1 (cf #2139), some data with ERG recombination have been send to us.
I created germlines data from raw gene sequence and try the algorithm on 10 sequences.
Now, I created some should-get tests. Nee...With the same protocole than for IKZF1 (cf #2139), some data with ERG recombination have been send to us.
I created germlines data from raw gene sequence and try the algorithm on 10 sequences.
Now, I created some should-get tests. Need more examples to work correctly.
https://gitlab.inria.fr/vidjil/vidjil/-/issues/2645Base de données de germlines HGNC/NCBI2018-07-13T14:25:32+02:00Mathieu GiraudBase de données de germlines HGNC/NCBIVia HGNC/HUGO (qu'on utilise pour vidjil#1801 dans `get-CD.py`, c6cb81d) on accède librement à des données en provenance de ~"repseq-IMGT" avec les noms des gènes (mais pas les allèles).
- http://www.genenames.org/cgi-bin/genefamilies/s...Via HGNC/HUGO (qu'on utilise pour vidjil#1801 dans `get-CD.py`, c6cb81d) on accède librement à des données en provenance de ~"repseq-IMGT" avec les noms des gènes (mais pas les allèles).
- http://www.genenames.org/cgi-bin/genefamilies/set/348
- http://www.genenames.org/cgi-bin/genefamilies/set/370
On pourrait donc créer et distribuer une base de données de germlines #2639 via le NCBI qui correspondrait aux gènes officiels du HGNC.
Voir vdj#456.https://gitlab.inria.fr/vidjil/vidjil/-/issues/2642Inclure les séquences de CD dans germline*gz2017-11-19T19:27:12+01:00Mathieu GiraudInclure les séquences de CD dans germline*gzOu ailleurs. En tout cas elles prennent plusieurs minutes à être récupérées.
Voir #1801.Ou ailleurs. En tout cas elles prennent plusieurs minutes à être récupérées.
Voir #1801.https://gitlab.inria.fr/vidjil/vidjil/-/issues/2635Mettre des jeux de démo dans demo/2018-02-01T10:01:26+01:00Mathieu GiraudMettre des jeux de démo dans demo/Suite à #2611, on souhaiterait mettre dans `demo/` des jeux de séquences pertinents biologiquement, et en parler dans `doc/algo.org`. Par exemple déjà `Demo X5`.
Cela pourrait être aussi des jeux de données mis sur le serveur, voir vdj#...Suite à #2611, on souhaiterait mettre dans `demo/` des jeux de séquences pertinents biologiquement, et en parler dans `doc/algo.org`. Par exemple déjà `Demo X5`.
Cela pourrait être aussi des jeux de données mis sur le serveur, voir vdj#195.Algo 2017.11https://gitlab.inria.fr/vidjil/vidjil/-/issues/2561data_test2017-07-28T12:51:03+02:00Ghost Userdata_testLes noms des germlines correspondant aux séquences des clones dans data_test.js ne correspondent pas à des germlines présentes dans la liste des germlines (germline.js)
j'ai changé les germlines du clone 2 pour mes tests mais pas les aut...Les noms des germlines correspondant aux séquences des clones dans data_test.js ne correspondent pas à des germlines présentes dans la liste des germlines (germline.js)
j'ai changé les germlines du clone 2 pour mes tests mais pas les autres ne sachant pas si vous vouliez les garder.https://gitlab.inria.fr/vidjil/vidjil/-/issues/1568Nettoyage des fausses dates2018-11-20T09:10:55+01:00Vidjil TeamNettoyage des fausses datesIl faudrait supprimer / demander à nos utilisateurs de supprimer les dates pipo.
***
@magiraud @mikael-sIl faudrait supprimer / demander à nos utilisateurs de supprimer les dates pipo.
***
@magiraud @mikael-s