Curriculum Vitae




Coordonnées

Experience

Bio-informaticien ingénieur d’étude

CNRS UMR 5175, Centre d'Ecologie Fonctionnelle et Evolutive, Montpellier

Développement de logiciels et réalisation de chaînes de traitement de données en calcul intensif pour l’analyse et la visualisation de données massives issues du séquençage ADN haut-débit (génomique, ADN environnemental). J’assure également la veille technologique pour mettre en place de nouvelles méthodes de traitement des données et optimiser la reproductibilité scientifique.

python R C++ Singularity Docker SGE SLURM Snakemake Nextflow Jupyter notebook

Bio-informaticien stagiaire

INSERM UMR S598, Génétique des Diabètes, Paris

Développement de nouvelles fonctionnalités pour un logiciel dédié au diagnostic médical automatisé en exploitant les données de variants génétiques rares détectés sur les séquences de génomes humains.

python Qt mySQL Docker

Bio-informaticien stagiaire

INSERM UMR S1134, Dynamique des Structures et Interactions des Macromolécules en Biologie, Paris

Conception et développement d'un nouvel algorithme pour améliorer la prédiction de modélisation 3D des structures des protéines à résolution atomique.

C C++ postgreSQL HTML CSS Javascript

Formation


Projects

Génomique des populations
J'ai effectué le génotypage de 1200 individus parmis 3 espèces de poissons. Mon workflow est conçu pour analyser des données de séquençage RAD-seq.
(illumina paired-end, STACKS, vcftools, bedtools, bwa, python, snakemake, singularity, Univa Grid Engine, bash)

D'avril 2017 à décembre 2018
Etude comparative des outils pour le traitement des données metabarcoding
J'ai developpé un workflow modulable qui utilise tous les outils de l'état de l'Art disponibles. Nous avons ensuite comparé leurs performances afin de selectionner le workflow optimal.
(obitools, vsearch, cutadapt, bash, python, singularity, Univa Grid Engine)

De février 2019 à mars 2020
Carte mondiale de la diversité génétique des poissons
J'ai construit une base de données contenant plus de 50000 séquences d'ADN représentant 3815 espèces de poissons marins et 1611 espèces de poissons d'eau douce. J'ai estimé la distribution mondiale de la diversité génétique moyenne.
(julia, python, R, singularity, MUSCLE, UGENE, geonames, BOLD, shiny)

De mai 2017 à février 2020
Genbar 2
J'ai programmé un logiciel pour identifier les populations génétiques à partir de coordonnées spatiales individuelles et de données sur les génotypes individuels.
(C, C++, htslib)

De mai 2017 à février 2020
Assemblage de génomes
J'ai supervisé le séquençage et réaliser l'assemblage des génomes nucléaires et mitochondriaux de 3 nouvelles espèces de poissons.
(illumina paired-end, mate-pair, 10X genomics chromium, Abyss, Platanus, QUAST, SLURM, bash)

De janvier 2017 à novembre 2019
Metabarcoding
J'ai programmé plusieurs logiciels pour traiter les données de metabarcoding d'ADN environnemental issue de la CAMPAGNE D'EXPLORATION OCEANOGRAPHIQUE DE MONACO.
(obitools, vsearch, swarm, cutadapt, bash, python, singularity, snakemake)

De mars 2018 à aujourd'hui
Génomique des paysages
J'ai traité des données RAD-seq à faible couverture provenant de 1800 individus parmis 2 espèces de poissons, collectés dans toute la Méditerranée.
(dDocent, freebayes, vcftools, samtools, trimmomatic, bash, python, singularity, snakemake)

De juin 2017 à aujourd'hui
Etude du génome de la betterave
J'ai fait plusieurs mesures (diversité nucléotidique, D de Tajima) sur le génome de la betterave à partir de 14409 polymorphismes aléatoires de nucléotides uniques (SNP) parmi 299 accessions de betteraves cultivées.
(R, python, genpop)

De mai 2017 à mai 2018
Automatisation du contrôle qualité des séquences d'exome
J'ai développé un logiciel capable de détecter les variations génomiques humaines potentiellement pathologique mais avec une mauvaise qualité de séquençage.
(Illumina paired-end, samtools, GATK, bedtools, variation annotation, python, mySQL, qt4)

De janvier 2016 à juillet 2016
Optimisation d'une méthode de reconnaissance des repliements dans la structure des protéines
J'ai implémenté et mise à l'épreuve un nouvel algorithme qui améliore la prédiction des modélisations 3D des structure des protéines à résolution atomique.
(PDB, pymol, C, C++, python, R, html, css )

De février 2015 à juin 2015

Logiciels


Publications scientifiques

Blind assessment of vertebrate taxonomic diversity across spatial scales by clustering environmental DNA metabarcoding sequences

Virginie Marques, Pierre‐Edouard Guerin, Mathieu Rocle, Alice Valentini, Stephanie Manel, David Mouillot, Tony Dejean

Ecography. 2020 Aug 04. DOI: 10.1111/ecog.05049

New genomic ressources for three exploited Mediterranean fishes

Katharina Fietz, Elena Trofimenkoa, Pierre-Edouard Guerin Veronique Arnal, Montserrat Torres-Oliva, Stephane Lobreaux,Angel Perez-Ruzafa, Stephanie Manel, Oscar Puebla

Genomics. 2020 July 03. DOI: 10.1016/j.ygeno.2020.06.041

Global determinants of freshwater and marine fish genetic diversity

Stephanie Manel, Pierre-Edouard Guerin, David Mouillot, Simon Blanchet, Laure Velez, Camille Albouy & Loic Pellissier

Nature communications. 2020 Feb 10. DOI: 10.1038/s41467-020-14409-7

Predicting genotype environmental range from genome–environment associations

Stephanie Manel, Marco Andrello, Karine Henry, Daphne Verdelet, Aude Darracq, Pierre‐Edouard Guerin, Bruno Desprez, Pierre Devaux

Molecular Ecology. 2018 May 17. DOI: 10.1111/mec.14723

ORION : a web server for protein fold recognition and structure prediction using evolutionary hybrid profiles

Yassine Ghouzam, Guillaume Postic, Pierre-Edouard Guerin, Alexandre G. de Brevern & Jean-Christophe Gelly

Scientific Reports. 2016 Jun 20. DOI: 10.1038/srep28268


Autres activités

Sciences

Projets personnels

Triathlon

Je suis triathlète fftri et membre de l'Union Sportive des Nageurs de Montpellier USN-MONTPELLIER depuis 2017. Rejoignez-nous !