Date limite pour postuler : 28 novembre 2025 à 23h 59 min
Employeur : Agence nationale d’identification des personnes (ANIP)
Superviseur Hiérarchique : Service de Contrôle Qualité des Données (SCQ)
Direction : Service de Contrôle Qualité des Données (SCQ)
Relation fonctionnelle : Autres Directeurs des directions, Collaborateurs de l’Agence
Lieu d’affectation : Cotonou – BENIN
Type de contrat : Contrat de stage
Nombre de Poste à Pourvoir : 1
INFORMATIONS GENERALES
L’Agence Nationale d’Identification des Personnes (ANIP) est une agence gouvernementale sous la tutelle de la Présidence de la république, elle a pour mission la définition, le suivi-évaluation de la mise en œuvre et l’évaluation de la politique de l’État en matière d’identification et de modernisation de l’état civil. L’Agence Nationale d’Identification des Personnes (ANIP), pilier central de la transformation numérique de l’État, porte une responsabilité majeure dans la sécurisation des identités et la fiabilisation des données citoyennes. À cet effet, elle ambitionne de valoriser ses vastes ensembles de données (biographiques, biométriques, etc.) afin d’en extraire des informations pertinentes et des connaissances exploitables à la prise de décision.
CONTEXTE ET PORTEE DE LA MISSION DU POSTE
Au sein de la Direction de la Donnée, de la Qualité et de la Sécurité, le Data Scientist occupe une fonction d’appui technique et scientifique stratégique. Sa responsabilité principale consiste à concevoir, développer et industrialiser les modèles d’Intelligence Artificielle de l’ANIP. En exploitant les capacités de l’infrastructure de calcul de haute performance (serveur GPU)de l’Agence, il/elle s’attèle à la résolution des problématiques les plus complexes, telles que la détection de fraudes sophistiquées, l’automatisation des contrôles de qualité, et le développement d’outils d’analyse innovants. Ce rôle est fondamental pour l’innovation en matière de données et d’IA au service de la sécurité identitaire.
PRINCIPALES RESPONSABILITÉS
Conception et Développement de Modèles
d’IA
- Concevoir, entraîner, tester et valider des modèles de Machine Learning et de Deep Learning pour répondre aux cas d’usage de l’ANIP.
- Mettre en place ou ajuster des modèles de Vision par Ordinateur (Computer Vision) pour la détection de fraude biométrique (détection de « photo de photo », analyse de la qualité des images, recherche de doublons).
- Mettre en place ou ajuster modèles de Traitement du Langage Naturel (NLP) pour l’analyse de documents, la classification, et la mise en place d’outils d’interrogation en langage naturel (RAG).
- Créer des modèles de détection d’anomalies pour identifier les comportements frauduleux dans les logs d’activité.
Data Engineering et Préparation des Données
- Explorer et analyser les vastes jeux de données de l’ANIP pour identifier des opportunités de modélisation.
- Collaborer avec les Data Engineers pour construire des pipelines de données robustes, assurant la collecte, le nettoyage, et la transformation des données nécessaires à l’entraînement des modèles.
- Mettre en œuvre des techniques d’échantillonnage, d’augmentation de données et de sélection de caractéristiques (feature engineering) pour optimiser la performance des modèles.
Industrialisation et MLOps (Machine Learning Operations)
- Utiliser la plateforme MLOps pour assurer la traçabilité et la reproductibilité des expérimentations (suivi des versions de code, de données, et des paramètres).
- Gérer le cycle de vie des modèles via le registre de modèles, de la phase de développement jusqu’à la mise en production.
- Déployer les modèles validés sous forme d’API sécurisées et performantes, pour qu’ils puissent être consommés par les autres applications de l’ANIP.
- Mettre en place le monitoring des modèles en production pour surveiller leur performance et détecter toute dérive (model drift).
Veille Technologique et R&D
- Assurer une veille scientifique et technologique constante sur les nouvelles techniques d’IA, les algorithmes et les outils pertinents pour l’ANIP.
- Mener des projets de recherche et de prototypage (Proof of Concept) pour évaluer de nouvelles approches.
Restitution et Vulgarisation
- Communiquer les résultats des analyses et les performances des modèles de manière claire et concise aux parties prenantes non techniques (analystes, managers).
- Rédiger la documentation technique associée aux modèles développés.
FORMATION, CONNAISSANCES, EXPÉRIENCES ET LANGUES
FORMATION
Formation supérieure (Bac+3 minimum, Master ou diplôme d’ingénieur) en Data Science, Intelligence Artificielle, Informatique, Statistiques, ou Mathématiques Appliquées ou tout autres domaines connexe, avec une bonne maitrise de l’analyse de données.
EXPERIENCES
- Disposer d’au moins 3 à 5 ans d’expériences pertinentes en tant que Data Scientist ou poste similaire, avec la réalisation de plusieurs projets d’IA concrets.
- Expérience avérée sur des projets de détection de fraude, de détection d’anomalies, de computer vision ou de NLP est fortement souhaitée.
- Une expérience de travail avec des GPU haute performance pour l’entraînement de modèles est un atout.
CONNAISSANCES & COMPETENCES
- Excellente maîtrise du langage de programmation Python et de son écosystème Data Science (Pandas, NumPy, Scikit-learn).
- Maîtrise d’au moins un framework de Deep Learning : TensorFlow ou PyTorch.
- Solides compétences en SQL pour la manipulation de données.
- Expérience pratique en Computer Vision (OpenCV, détection d’objets, classification d’images) et/ou en NLP (Transformers, Hugging Face, RAG, embedding).
- Connaissance des principes et outils de MLOps ( MLflow, DVC, Docker, etc).
LANGUES
- Une excellente maîtrise de la langue française aussi bien à l’oral qu’à l’écrit est exigée.
- Une bonne maîtrise de l’anglais technique (lecture de documentations et publications scientifiques) est requise.
ETHIQUE, ORGANISATION ET QUALITÉS PERSONNELLES
- Rigueur scientifique et intellectuelle, sens du détail.
- Curiosité, créativité et passion pour la résolution de problèmes complexes.
- Excellente capacité d’analyse et de synthèse.
- Aptitude à travailler en équipe et à collaborer avec des profils variés.
- Discrétion absolue, intégrité et conscience de la sensibilité des données manipulées.
- Autonomie, proactivité et capacité à mener des projets de recherche de manière indépendante.
- Bonnes capacités de communication et de pédagogie pour expliquer des concepts complexes