En savoir plus

Notre utilisation de cookies

« Cookies » désigne un ensemble d’informations déposées dans le terminal de l’utilisateur lorsque celui-ci navigue sur un site web. Il s’agit d’un fichier contenant notamment un identifiant sous forme de numéro, le nom du serveur qui l’a déposé et éventuellement une date d’expiration. Grâce aux cookies, des informations sur votre visite, notamment votre langue de prédilection et d'autres paramètres, sont enregistrées sur le site web. Cela peut faciliter votre visite suivante sur ce site et renforcer l'utilité de ce dernier pour vous.

Afin d’améliorer votre expérience, nous utilisons des cookies pour conserver certaines informations de connexion et fournir une navigation sûre, collecter des statistiques en vue d’optimiser les fonctionnalités du site. Afin de voir précisément tous les cookies que nous utilisons, nous vous invitons à télécharger « Ghostery », une extension gratuite pour navigateurs permettant de les détecter et, dans certains cas, de les bloquer.

Ghostery est disponible gratuitement à cette adresse : https://www.ghostery.com/fr/products/

Vous pouvez également consulter le site de la CNIL afin d’apprendre à paramétrer votre navigateur pour contrôler les dépôts de cookies sur votre terminal.

S’agissant des cookies publicitaires déposés par des tiers, vous pouvez également vous connecter au site http://www.youronlinechoices.com/fr/controler-ses-cookies/, proposé par les professionnels de la publicité digitale regroupés au sein de l’association européenne EDAA (European Digital Advertising Alliance). Vous pourrez ainsi refuser ou accepter les cookies utilisés par les adhérents de l'EDAA.

Il est par ailleurs possible de s’opposer à certains cookies tiers directement auprès des éditeurs :

Catégorie de cookie

Moyens de désactivation

Cookies analytiques et de performance

Realytics
Google Analytics
Spoteffects
Optimizely

Cookies de ciblage ou publicitaires

DoubleClick
Mediarithmics

Les différents types de cookies pouvant être utilisés sur nos sites internet sont les suivants :

Cookies obligatoires

Cookies fonctionnels

Cookies sociaux et publicitaires

Ces cookies sont nécessaires au bon fonctionnement du site, ils ne peuvent pas être désactivés. Ils nous sont utiles pour vous fournir une connexion sécuritaire et assurer la disponibilité a minima de notre site internet.

Ces cookies nous permettent d’analyser l’utilisation du site afin de pouvoir en mesurer et en améliorer la performance. Ils nous permettent par exemple de conserver vos informations de connexion et d’afficher de façon plus cohérente les différents modules de notre site.

Ces cookies sont utilisés par des agences de publicité (par exemple Google) et par des réseaux sociaux (par exemple LinkedIn et Facebook) et autorisent notamment le partage des pages sur les réseaux sociaux, la publication de commentaires, la diffusion (sur notre site ou non) de publicités adaptées à vos centres d’intérêt.

Sur nos CMS EZPublish, il s’agit des cookies sessions CAS et PHP et du cookie New Relic pour le monitoring (IP, délais de réponse).

Ces cookies sont supprimés à la fin de la session (déconnexion ou fermeture du navigateur)

Sur nos CMS EZPublish, il s’agit du cookie XiTi pour la mesure d’audience. La société AT Internet est notre sous-traitant et conserve les informations (IP, date et heure de connexion, durée de connexion, pages consultées) 6 mois.

Sur nos CMS EZPublish, il n’y a pas de cookie de ce type.

Pour obtenir plus d’informations concernant les cookies que nous utilisons, vous pouvez vous adresser au Déléguée Informatique et Libertés de l’INRA par email à cil-dpo@inra.fr ou par courrier à :

INRA
24, chemin de Borde Rouge –Auzeville – CS52627
31326 Castanet Tolosan cedex - France

Dernière mise à jour : Mai 2018

Menu Logo Principal MUSE Supagro 3BCar Labex IM2E

Laboratoire de Biotechnologie de l'Environnement

CDD 15 mois - Développeur informatique

Développement d'une plateforme web de workflows (galaxyproject.org) pour une application de classification TyPol

Contexte

Dans le cadre d'un projet de recherche INRA sur les micropolluants, les contaminants organiques sont classés non plus par familles chimiques mais selon leurs propriétés physico-chimiques (adsorption, volatilisation, leur transfert vers l'air ou les eaux, leurs effets toxicologiques, etc). Ce projet a donné lieu a un outil informatique appelé TyPol, basé sur le logiciel RStudio, et qui réalise une classification à partir de données extraire d'une base de données MySQL. Cet outil (Servien et al., 2014) effectue une  classification de plus de 300 mol écules (pesticides, compos es pharmaceutiques ...) et est utilisé pour explorer le comportement environnemental de métabolites potentiels de certains pesticides (Storck et al., 2016 ; Benoit et al., 2016). L'outil informatique actuel comporte un module d'analyse statistique s’exécutant sous RStudio et un module d'insertion de données, soit via une interface web, soit via phpmyadmin.

Mission

Le système de visualisation, d'insertion et de traitement de la donnée devra être porté sous une plateforme web de workflows (galaxyproject.org) avec un système de documentation et de versioning par une forge gitlab. 

  1. Dans un premier temps, il devra construire des outils informatiques de vérification des données de la base actuel et de récupération de données à partir d'autres bases de données via des API ou en effectuant de la fouille de données sur des données bibliographiques disponibles sur le web (Web of Science) ou directement via un répertoire contenant contenant des fichiers au format pdf. L'outil de vérification des données devra comporter des règles décrites par des experts scientifiques. Cette vérification nécessitera une mise à jour de la BD à chaque nouvelle valeur découverte. L'insertion de nouvelles données devra être facilité via des API vers d'autres bases de données comme chemspider ou PPDB.
  2. Dans un second temps, il faudra assurer le passage du système d'information TyPol sous un environnement Galaxy (galaxyproject), basé sur le langage de structure XML dans l'esprit de ce qui a déjà été réalisé en chimiométrie avec chemflow (Rossard et al., 2016). Effectivement, TyPol est de plus en plus utilisé et touche un public de plus en plus large, principalement des biologistes ne maîtrisant pas forcément le langage informatique ou le logiciel R. Il est également attendu une amélioration substantielle du programme au niveau accessibilité et de rendre l'interface utilisateur facilement utilisable. Ce passage se fera également pour des raisons de reproductibilité et de partage des résultats dans le cadre d'une démarche de science collaborative.

Profil recherché

Développement d'application web de calcul scientifique dans le domaine de la recherche en environnement.

Diplôme requis

Diplôme en enseignement supérieur dans la filière informatique

Connaissances

  • Maîtrise de langages de programmation scientifique (python, R, Matlab), orienté objet, structuré (XML), du web (html, css) ;
  • Architecture et l'environnement technique du système d'information (virtualisation, docker, réseaux, apache, etc)
  • Méthodologie de conduite de projet (méthodes agiles, tableau de bord, etc)
  • Sécurité des systèmes d'information et de communication
  • Référentiel des bonnes pratiques (documentations, gestion de version, réalisation de tests automatisés, etc)
  • Anglais technique

Compétences opérationnelles

  • Administrer de système de gestion de bases de données     
  • Faciliter la maintenance : sauvegarde automatique et de remise en route lors d'une coupure     
  • Rédiger et mettre à jour la documentation fonctionnelle et technique     
  • Travail en équipe     
  • Former, communiquer et faire preuve de pédagogie      
  • Maîtrise d'outil d'administration système     
  • Text mining     
  • Réalisation d'API
  • Web sémantique

Les ++

Un goût pour les domaines en chimie ou en biologie et pour les statistiques

Compétences comportementales

  • Sens de l'organisation   
  • Rigueur / Fiabilité   
  • Capacité de conceptualisation

Conditions du CDD

  • Durée : 15 mois
  • Localisation : Unite LBE, INRA de Narbonne
  • Rémunération : selon le niveau du diplôme et les grilles de contractuels de la fonction publique (max IE avec 2 à 5 ans d'expériences) 
  • Encadrement : Eric Latrille, Virginie Rossard, Remi Servien
  • Pour postuler : envoyer CV et lettre de motivation
  • Contact : eric.latrille_at_inra.fr ; virginie.rossard_at_inra.fr ; remi.servien_at_inra.fr

Bibliographie

  1. R. Servien, L. Mamy, Z. Li, V. Rossard, E. Latrille, F. Bessac, D. Patureau and P. Benoit. TyPol - a New Methodology for Organic Pollutants Clustering based on their Molecular Characteristics and Environmental Behavior, Chemosphere (2014), 111, 613-622.2.  
  2. V. Storck, L. Lucini, L. Mamy, F. Ferrari, E. S. Papadopoulou, S. Nikolaki, P. A. Karas, R. Servien, D. G. Karpouzas, M. Trevisan, P. Benoit and F. Martin-Laurent. Identification and characterization of tebuconazole transformation products in soil by combining suspect screening and molecular typology, Environmental Pollution (2016), 208 B, 537-545.3.  
  3. V. Rossard, J.-C. Boulet, F. Goge, E. Latrille et J.-M. Roger. ChemFlow, chemometrics using Galaxy. Presented at Galaxy Community Conference - GCC2016, Bloomington, USA (2016), 5 :1671.4.  
  4. P. Benoit, L. Mamy, R. Servien, Z. Li, E. Latrille, V. Rossard, F. Bessac, D. Patureau and F. Martin-Laurent. Categorizing chlordecone potential degradation products to explore their environmental fate, Sciences of the Total Environment (2017), 574, 781-795.