Architecture ELT industrielle traitant plus de 150 millions de trajets NYC TLC. Ingestion automatisée de fichiers Parquet volumineux dans le cloud pour l'analyse prédictive et le pilotage stratégique.
Pipeline ETL traitant les prévisions à 7 jours de 8 métropoles mondiales (Paris, Berlin, Brasilia, etc.) via l'API Open-Météo en utilisant leurs coordonnées géographiques précises.
Analyse multidimensionnelle des performances commerciales pour identifier les segments à forte rentabilité et optimiser les stratégies de pricing.
Développement d'un modèle prédictif pour estimer les coûts de santé individuels. Projet complet incluant l'EDA, le Feature Engineering, et la mise en production via API.
| Variable | Type | Description |
|---|---|---|
| age | Quantitative | Âge de l'assuré |
| sex | Qualitative binaire | Sexe (Male/Female) |
| bmi | Quantitative | Indice de Masse Corporelle |
| children | Quantitative | Nombre d'enfants à charge |
| smoker | Qualitative binaire | Statut fumeur (Yes/No) |
| region | Qualitative | Région de résidence (4 modalités) |
| charges | Quantitative | Frais médicaux (variable cible) |
Application de méthodes statistiques rigoureuses pour valider des hypothèses sur des données de production et de recherche.
Vous avez une problématique de données ou un besoin en Business Intelligence ? Je suis prêt à vous accompagner pour transformer vos données en valeur stratégique.