Remote
Описание на позицията
Rejoignez Tether, une start‑up technologique en pleine expansion, et intégrez l’équipe dédiée aux modèles d’intelligence artificielle. En tant qu’AI Research Engineer spécialisé dans le pré‑entraînement, vous jouerez un rôle clé dans la conception, l’optimisation et le déploiement de modèles de grande taille, incluant des architectures multimodales capables de traiter texte, image et audio. Vous serez responsable de l’ensemble du pipeline de pré‑entraînement : de la collecte et la curation de jeux de données massifs, à la mise en place de stratégies d’augmentation de données, en passant par le réglage fin des hyper‑paramètres et la résolution des goulets d’étranglement liés à la scalabilité. Vous travaillerez sur des clusters distribués composés de milliers de GPU NVIDIA, en exploitant les dernières avancées en matière de parallélisme de données et de modèles, ainsi que les techniques de compression et de quantisation pour réduire les coûts d’inférence.
Vos missions principales :
- Concevoir et implémenter des architectures de modèles innovantes (LLM, vision‑langage, audio‑textuel) en respectant les contraintes de performance et d’efficacité énergétique.
- Optimiser le processus de pré‑entraînement à grande échelle : gestion de la mémoire, parallélisme pipeline, stratégies de checkpointing et de récupération.
- Curater, nettoyer et annoter des jeux de données de plusieurs téraoctets, en garantissant la diversité, la représentativité et la conformité éthique.
- Analyser les métriques de formation, identifier les goulots d’étranglement et proposer des améliorations (optimisation du code CUDA, utilisation de bibliothèques de bas niveau, tuning du réseau de communication).
- Collaborer étroitement avec les équipes de recherche, d’ingénierie produit et d’infrastructure pour transformer les prototypes en solutions déployables.
- Rédiger des rapports techniques, publier des articles scientifiques et présenter les résultats lors de conférences internes et externes.
Profil recherché :
Vous êtes passionné·e par les modèles de fondation et avez déjà mené des projets de pré‑entraînement de modèles de plusieurs milliards de paramètres. Vous maîtrisez les frameworks de deep learning (PyTorch, TensorFlow) ainsi que les outils de calcul distribué (Horovod, DeepSpeed, Megatron‑LM). Vous avez une solide expérience en programmation Python et C/C++, ainsi qu’une bonne connaissance de CUDA et des architectures GPU NVIDIA. Vous êtes à l’aise avec les systèmes Linux, les environnements de conteneurisation (Docker, Kubernetes) et les pipelines CI/CD. Vous avez un esprit analytique, êtes capable de travailler de façon autonome en remote et de communiquer clairement vos idées à des interlocuteurs techniques et non‑techniques.
Ce que nous offrons :
- Un contrat CDI en télétravail complet, avec la possibilité de se rendre ponctuellement à Helsinki pour des workshops ou des réunions d’équipe.
- Un environnement de travail stimulant, entouré d’experts de renommée internationale dans le domaine de l’IA.
- Un accès à des ressources de calcul de pointe (clusters GPU, stockage haute performance).
- Un package de rémunération compétitif, incluant des bonus liés aux performances et des actions de la société.
- Des opportunités de formation continue, de participation à des conférences et de publication scientifique.
- Une culture d’entreprise axée sur l’innovation, la transparence et le bien‑être des collaborateurs.
Si vous êtes prêt·e à relever le défi de repousser les limites du pré‑entraînement des modèles d’IA et à contribuer à la prochaine génération de systèmes intelligents, postulez dès maintenant et rejoignez l’aventure Tether !