L’entreprise
Entreprise franco-américaine proposant une solution SaaS & IA dans le cadre stratégique des entreprises.
L’équipe en France à taille humaine a un fonctionnement startup et en autonomie sur sa partie technique.
Équipe d’un peu plus de 10 personnes où tout le monde travaille main dans la main vers le même objectif concret et une vision produit.
Leurs clients sont aujourd’hui à l’échelle internationale et le corporate language est l’anglais.
Mindset : humilité & état d’esprit collectif & ouverture d’esprit
Leur vision : Product-driven – construction de systèmes complexes, ce qui implique de prendre parfois des raccourcis pragmatiques
Leur stack :
AI: PyTorch, Bert, LLMs (OpenAI, Mistral)
Data: Pub/Sub, GCS, CloudRun/Kubernetes, Firestore, BigQuery, MongoDB, Elasticsearch, Redis, Pinecone
Backend: Python, Typescript // Ops: Docker, Ansible, Terraform
Frontend : Angular
La mission
Pour accompagner leur contexte de croissance, l’équipe est aujourd’hui à la recherche de leur Senior Data Engineer, qui soit avant tout un ingénieur logiciel, avec une forte concentration (au moins initialement) sur la programmation Python et la scalabilité.
Responsabilités principales :
- Écrire des pipelines Python pour le traitement sémantique (NLP) et l’augmentation des données en général :
- Vectorisation (embeddings) vers/depuis MongoDB/Pinecone
- Reconnaissance d’entités nommées (NER) vers/depuis MongoDB
- Indexation Elasticsearch
- Écrire des pipelines de transformation Python pour les données dérivées concernant les entreprises :
- Calculer des points de données pertinents à partir des données brutes des entreprises
- Maintenir le cadre Python pour le calcul des points de données
- Améliorer les capacités techniques de votre équipe, en particulier des membres juniors
- Contribuer à la décomposition des tâches et à la planification avec le Tech Lead
Le profil recherché
5+ ans de développement d’applications logicielles évolutives prêtes pour l’industrie en Python
3+ ans de mise en œuvre de pipelines de traitement de données/ETLs
2+ ans de travail avec MongoDB et SQL avancés + idéalement Elasticsearch
Compréhension solide de l’évolutivité informatique (multiprocessing/threading, calcul distribué)
Une certaine expérience pratique avec des frameworks de données courants/modernes (en particulier GCP, DBT, Snowflake)
Excellentes compétences en résolution de problèmes pour l’optimisation des performances
Les modalités
Contrat : CDI
Localisation : Bureaux Paris Centre
Télétravail : organisation flexible tendance de 2 jours par semaine actuellement
Rémunération selon profil : 75-90K€ de Package + RTT + TR + BSPCE
Processus de recrutement interne : Échange téléphonique avec CTO (30min) + Entretien Technique à la maison (2h max) + Debrief technique et rencontre équipe dans les locaux