Post-doctorat en TAL dans le projet ERA-NET CHIST-ERA FAIRClinical (H/F)
Activités
- Identifier les sources de données nécessaires à l'extraction et à la normalisation des entités.
- Développer des pipelines d’extraction d’information à partir des textes complets et des documents complémentaires.
- Évaluer les méthodes d’extraction d’information.
- Participer aux activités de publication et de communication de l'équipe.
Compétences
- Doctorat en informatique, en traitement automatique des langues ou similaire.
- Compétences en apprentissage automatique supervisé et semi-supervisé, y compris l'apprentissage profond.
- Expérience en traitement automatique des langues
- Bonne maîtrise de l'anglais, à l'oral comme à l'écrit
- Capacité à travailler de manière indépendante et en équipe
- Capacité à hiérarchiser les tâches et à prendre des initiatives.
Contexte de travail
Ce poste fait partie du projet FAIRClinical financé par CHIST-ERA, dont l'objectif est de renforcer le caractère FAIR de tous les fichiers de données complémentaires et d'améliorer de manière significative la réutilisation des formulaires de rapport de cas cliniques non structurés (CRF). Les données complémentaires sont généralement jointes à une publication scientifique, soit directement dans les bibliothèques biomédicales en ligne telles que PubMed Central, soit par l'intermédiaire de plateformes de dépôt généralistes telles que Zenodo.
Les CRF recueillent les données des patients dans le cadre d'études et d'essais de recherche clinique, et représentent un sous-ensemble riche en informations de la littérature de recherche clinique et des données complémentaires non structurées des études cliniques. Ce projet propose d'enrichir spécifiquement le contenu de toutes les données supplémentaires — et donc leur interopérabilité, leur trouvabilité et leur réutilisation — en fournissant un contenu plus normalisé.
Le poste se situe dans un secteur relevant de la protection du potentiel scientifique et technique (PPST), et nécessite donc, conformément à la réglementation, que votre arrivée soit autorisée par l'autorité compétente du MESR.
Ce poste fait partie du projet FAIRClinical financé par CHIST-ERA, dont l'objectif est de renforcer le caractère FAIR de tous les fichiers de données complémentaires et d'améliorer de manière significative la réutilisation des formulaires de rapport de cas cliniques non structurés (CRF). Les données complémentaires sont généralement jointes à une publication scientifique, soit directement dans les bibliothèques biomédicales en ligne telles que PubMed Central, soit par l'intermédiaire de plateformes de dépôt généralistes telles que Zenodo.
Les CRF recueillent les données des patients dans le cadre d'études et d'essais de recherche clinique, et représentent un sous-ensemble riche en informations de la littérature de recherche clinique et des données complémentaires non structurées des études cliniques. Ce projet propose d'enrichir spécifiquement le contenu de toutes les données supplémentaires — et donc leur interopérabilité, leur trouvabilité et leur réutilisation — en fournissant un contenu plus normalisé.
Le poste se situe dans un secteur relevant de la protection du potentiel scientifique et technique (PPST), et nécessite donc, conformément à la réglementation, que votre arrivée soit autorisée par l'autorité compétente du MESR.
Contraintes et risques
Risques liés au travail sur écran.
Risques liés au travail sur écran.