Maîtrisez le machine learning pour des modèles de scoring performants
Notre programme vous accompagne dans la construction de modèles prédictifs adaptés aux contraintes réglementaires du secteur financier. Vous apprendrez à traiter des données déséquilibrées, optimiser vos algorithmes et interpréter vos résultats pour des décisions éclairées.
Demander une information
Durée du parcours complet
Compétences Techniques
Un programme structuré autour de cas concrets
Chaque module aborde une dimension essentielle du scoring financier. On commence par la préparation des données, souvent 60% du travail en réalité. Ensuite vient la modélisation avec des techniques adaptées aux exigences du secteur.
Préparation des données
Vous travaillerez sur des jeux de données réels issus du secteur bancaire. L'objectif est de comprendre comment gérer les valeurs manquantes et détecter les anomalies qui peuvent fausser vos modèles.
- Techniques d'imputation avancées
- Détection d'outliers contextuels
- Feature engineering métier
- Gestion du déséquilibre de classes
Modélisation prédictive
Construction de modèles supervisés avec focus sur la régression logistique, les arbres de décision et le gradient boosting. Vous apprendrez à choisir l'algorithme adapté selon le contexte métier.
- Régression logistique pénalisée
- Random Forest et XGBoost
- Validation croisée stratifiée
- Optimisation des hyperparamètres
Interprétabilité et conformité
Les modèles de scoring doivent être explicables. Vous découvrirez SHAP values, LIME et d'autres approches pour rendre vos prédictions transparentes face aux audits réglementaires.
- Analyse des coefficients
- SHAP pour modèles complexes
- Documentation réglementaire
- Rapport de performance
Compétences développées par module
Votre progression étape par étape
Le programme s'étale sur douze mois avec démarrage prévu en octobre 2026. Vous avancerez à votre rythme sur des projets concrets inspirés de situations réelles rencontrées dans le secteur bancaire et assurantiel.
Volume horaire total
Projets pratiques
Fondamentaux statistiques
3 mois • Oct-Déc 2026On reprend les bases statistiques nécessaires pour comprendre ce qui se passe sous le capot des algorithmes. Tests d'hypothèses, régression simple et analyse exploratoire des données.
- Statistiques descriptives et inférentielles
- Distributions et tests paramétriques
- Visualisation de données avec Python
Apprentissage supervisé
4 mois • Jan-Avr 2027Phase centrale du programme où vous construisez vos premiers modèles de scoring. Régression logistique d'abord, puis algorithmes ensemblistes. Tout est mis en pratique sur des données bancaires anonymisées.
- Construction de pipelines ML reproductibles
- Sélection de features et réduction dimensionnelle
- Évaluation avec métriques métier (AUC-ROC, Gini)
- Gestion du sur-apprentissage
Techniques avancées et déploiement
3 mois • Mai-Juil 2027Dernière phase axée sur l'interprétabilité des modèles et leur mise en production. Vous apprendrez à documenter vos choix techniques pour répondre aux exigences d'audit.
- Analyse SHAP pour modèles ensemblistes
- Documentation conformité réglementaire
- Création d'API de scoring avec Flask
- Monitoring et maintenance de modèles
Projet final intégrateur
2 mois • Août-Sep 2027Vous réalisez un projet complet de A à Z : préparation des données, modélisation, validation, documentation et présentation devant un jury composé de professionnels du secteur.
- Cahier des charges d'un modèle de scoring
- Développement et validation complète
- Rapport technique et business
- Soutenance orale du projet