Ingénieur Génération Multilingue, LLMs H/F
Activités
Cette mission comprendra les activités suivantes :
- Collecter/créer des données d'apprentissage et d'évaluation
- Mettre en œuvre des modèles neuronaux pour la génération de texte multilingue
- Evaluer ces modèles et interpréter les résultats
- Rediger et soumettre des articles décrivant les expériences réalisés et les résultats obtenus
- Participer à la vie scientifique de l’équipe, en animant des ateliers et des séminaires sur les technologies TAL
- Gérer les aspects techniques du projet, incluant l'installation et l'adaptation de modèles neuronaux, le versionnage et la mise à disposition des résultats dans une optique de science ouverte
Compétences
Nous recherchons une personne de formation supérieure en traitement automatique des langues (Doctorat), avec les compétences suivantes :
- Expérience solide en TAL et en utilisation de bibliothèques et frameworks spécialisés (NLTK, spaCy, PyTorch, Transformers…).
- Compétences en machine learning et deep learning, avec une capacité à appliquer ces techniques à des problématiques de génération de texte
- Maîtrise de la programmation en Python et familiarité avec les outils de gestion de versionnage, des bases de données et des outils et technologies du Web (API, JS…).
- Bonne connaissance des principes de l'analyse de données, y compris la statistique, la visualisation de données et l'interprétation des résultats.
- Capacité à travailler en équipe interdisciplinaire et à communiquer efficacement
Contexte de travail
La personne recrutée travaillera au sein de l'équipe SYNALP du LORIA, en collaboration étroite avec Claire Gardent (Directrice de recherche CNRS) et avec les doctorants et chercheurs du LORIA travaillant dans le domaine du Traitement Automatique des Langues.
La personne recrutée travaillera au sein de l'équipe SYNALP du LORIA, en collaboration étroite avec Claire Gardent (Directrice de recherche CNRS) et avec les doctorants et chercheurs du LORIA travaillant dans le domaine du Traitement Automatique des Langues.