TyPol CDD 12 mois développeur.euse informatique 2023 (H/F)

TyPol CDD 12 mois développeur.euse informatique 2023 (H/F)

Développement d'une plateforme web pour une application de classification TyPol

Contexte

TyPol est un outil informatique qui a été développé au sein d’INRAE pour classer les contaminants organiques selon leurs descripteurs moléculaires (masse molaire, nombre d’atomes de C..) et leurs propriétés physico-chimiques ou comportementales (adsorption, volatilisation, dégradation, effets toxicologiques…)). La base de données contient actuellement plus de 300 molécules (pesticides, compos es pharmaceutiques ...) TyPol est basé sur le logiciel RStudio et réalise cette classification à partir de données extraites d'une base de données MySQL. L'outil informatique actuel comporte un module d'analyse statistique s’exécutant sous RStudio et un module d'insertion de données, soit via une interface web, soit via phpmyadmin. L’outil d’analyse Typol a été mis à jour sous forme de docker et a aussi été porté sous une plateforme web Galaxy de workflows (https://galaxyproject.org). Cet outil informatique est documenté et versionné via une forge GitLab institutionnelle.

Missions

Le système de traitement de données sous Galaxy devra être validé ; il devra être interfacé avec un système de curation de la base de données et avec un système d'insertion de données. 

  1. Dans un premier temps, les bases de données existantes devront être similaire ou partagé par les systèmes d’interface pour pouvoir réaliser un benchmark. Certaines erreurs depuis l’outil sous l’environnement Galaxy avec l’interactivité de RShiny devront être corrigées.
  2. Dans un second temps, il faudra interfacer et mettre en production ces outils informatiques de vérification des données de la base actuelle soit via une plateforme web soit via l’interface existante Galaxy. Effectivement, TyPol est de plus en plus utilisé par un public de biologistes ne maîtrisant ni de langage informatique, ni le logiciel R. Il est également attendu une amélioration substantielle du programme au niveau accessibilité et de rendre l'interface utilisateur facilement utilisable. Ce passage se fera également pour des raisons de reproductibilité et de partage des résultats dans le cadre d'une démarche de science collaborative.
  3. Dans un troisième temps, il sera créé un système d’insertion de données notamment en récupérant des données à partir d'autres bases de données via des API ou en effectuant de la fouille de données sur des données bibliographiques disponibles sur le web (Web of Science) ou directement via un répertoire contenant des fichiers au format pdf. L'outil de vérification des données devra comporter des règles décrites par des experts scientifiques. Cette vérification nécessitera une mise à jour de la BD à chaque nouvelle valeur découverte. L'insertion de nouvelles données devra être facilité via des API vers d'autres bases de données comme chemspider ou PPDB.
  4. Dans un quatrième temps, en lien avec des scientifiques et statisticiens de l’unité, il s’agira d’améliorer la capacité prédictive de l’outil : des techniques de fouille de données et de recherche de structuration des données (pattern recognition) à l’aide d’algorithme d’apprentissage profond (deep learning) seront mises en œuvre pour améliorer l’analyse et la prédiction de l’outil pour ce qui concerne spécifiquement les processus biotiques et abiotiques de transformation des contaminants.

Outils à développer : 

  • Améliorations méthodologiques : développement d’API pour la récupération automatique des informations dans les bases de données existantes pour les inclure dans TyPol. 
  • Poursuite de l’ajout de paramètres environnementaux et comportementaux pour l’ensemble des contaminants perturbateurs endocriniens présents dans TyPol en lien avec une personne contractuelle.

Profil recherché

Développement d'application web

Diplôme requis

Diplôme en enseignement supérieur dans la filière informatique

Connaissances

  • Maîtrise d’au moins un langage de programmation scientifique (python, R, Matlab) et d’un langage orienté objet ;
  • Maîtrise des langages structurés (XML) et du web (html, css) ;
  • Architecture et l'environnement technique du système d'information (virtualisation, docker, réseaux, apache, etc)
  • Méthodologie de conduite de projet (méthodes agiles, tableau de bord, etc)
  • Sécurité des systèmes d'information et de communication
  • Référentiel des bonnes pratiques (documentations, gestion de version avec GIT, réalisation de tests automatisés, etc)
  • Anglais technique

Compétences opérationnelles

  • Administrer le système de gestion de bases de données     
  • Faciliter la maintenance : sauvegarde automatique et de remise en route lors d'un arrêt     
  • Rédiger et mettre à jour la documentation fonctionnelle et technique     
  • Travail en équipe     
  • Former, communiquer et faire preuve de pédagogie      
  • Maîtrise d'outils d'administration système     
  • Text mining     
  • Réalisation d'API
  • Web sémantique

Les ++

Un goût pour les domaines en chimie ou en biologie et pour les statistiques

Compétences comportementales

  • Sens de l'organisation   
  • Rigueur / Fiabilité   
  • Capacité de conceptualisation

Qualité au travail

Votre qualité de vie à INRAE

En rejoignant INRAE, vous bénéficiez (selon le type de contrat et sa durée) :

- jusqu'à 30 jours de congés + 15 RTT par an (pour un temps plein)
- d'un soutien à la parentalité : CESU garde d'enfants, prestations pour les loisirs ;
- de dispositifs de développement des compétences : formation, conseil en orientation professionnelle ;
- d'un accompagnement social : conseil et écoute, aides et prêts sociaux ;
- de prestations vacances et loisirs : chèque-vacances, hébergements à tarif préférentiel ;
- d'activités sportives et culturelles ;
- d'une restauration collective.

Votre qualité de vie au LBE :

 - salle de sport dans les locaux

Conditions du CDD

  • Durée : 12 mois
  • Prise de fonction : janvier 2023
  • Statut : Agent contractuel d’Etat ; Rémunération selon qualification
  • Temps de travail : 38 heures 40 par semaine
  • Localisation : Unite LBE, INRAE de Narbonne
  • Rémunération : selon le niveau du diplôme et les grilles de contractuels de la fonction publique (AI NIVEAU 1, expérience moins de 2 ans salaire brut 1 940 €). A cela peut s’ajouter la participation de 15 euros par mois à la mutuelle, transport, etc.
  • Encadrement : Eric Latrille, Virginie Rossard, Remi Servien
  • Pour postuler : envoyer CV et lettre de motivation par courriel
  • Contacts : eric.latrille_at_inrae.fr ; virginie.rossard_at_inrae.fr ; remi.servien_at_inrae.fr

Date de modification : 18 juillet 2023 | Date de création : 06 octobre 2022 | Rédaction : LBE