Data Scientist · Machine Learning · Analytics

Transformer les données
en décisions stratégiques.

Modèles de machine learning, analyses statistiques robustes et visualisations claires pour répondre à de vrais enjeux métier.

Domaines Churn · Recommandation · NLP · Time Series
Outils Python · SQL · Cloud · BI

Score de churn client

+18% de rétention

Modèle de classification pour anticiper le départ des clients et cibler les actions marketing.

Forecasting ventes

RMSE -22%

Modélisation de séries temporelles pour optimiser les stocks et la logistique.

Projets data & IA

Une sélection de projets qui illustrent la chaîne complète : data engineering, modélisation, évaluation et communication des résultats.

Classification

Prédiction de churn client

Construction d’un modèle supervisé pour prédire le départ de clients à partir de données CRM (transactions, interactions, support).

  • Feature engineering avancé (RFM, fréquence, récence, intensité).
  • Comparaison Gradient Boosting / Random Forest / XGBoost.
  • Explicabilité avec SHAP et visualisations interactives.
NLP

Analyse de sentiments & avis clients

Modèle de classification de sentiments sur des avis produits pour aider les équipes marketing et produit à prioriser les améliorations.

  • Nettoyage texte, tokenisation, embeddings.
  • Fine-tuning d’un modèle de type transformer.
  • Dashboard de visualisation des thèmes dominants.
Time Series

Prévision de la demande

Modélisation de séries temporelles pour prévoir la demande hebdomadaire et optimiser les stocks d’un réseau de points de vente.

  • Modèles classiques (ARIMA, Prophet) vs modèles ML.
  • Gestion des saisons, jours fériés, promotions.
  • Visualisations interactives pour les équipes opérationnelles.
Recommandation

Moteur de recommandation de contenus

Système de recommandation hybride (collaboratif + contenu) pour personnaliser l’expérience utilisateur sur une plateforme.

  • Matrice utilisateur-objet, factorisation, similarité.
  • Évaluations offline (Precision@k, MAP) et A/B testing.
  • API de scoring temps réel.

Stack & compétences

Un socle complet pour couvrir la chaîne de valeur data, de l’exploration à la mise en production.

Data & Analytics

  • Python (pandas, NumPy, SciPy)
  • Statistiques, tests d’hypothèses, A/B testing
  • Data viz (Matplotlib, Seaborn, Plotly)
  • SQL (modélisation de données, jointures, CTE)

Machine Learning & IA

  • scikit-learn, XGBoost, LightGBM
  • Deep Learning (PyTorch / TensorFlow)
  • NLP, séries temporelles, systèmes de recommandation
  • Explicabilité (SHAP, LIME)

Production & Produit

  • APIs (FastAPI, Flask)
  • CI/CD basique, conteneurisation (Docker)
  • Dashboards (Streamlit, Power BI)
  • Méthodologies projet, communication des résultats

À propos

Data scientist passionné(e) par la mise en production de solutions concrètes et la collaboration avec les équipes métier.

Je combine une solide base statistique avec une expérience pratique sur des projets de machine learning appliqués : scoring, prévision, NLP et recommandation.

Mon objectif : construire des modèles robustes, interprétables et réellement utiles, tout en gardant une forte attention à la qualité des données et à la compréhension métier.

Je suis particulièrement intéressé(e) par les problématiques de churn, d’optimisation de revenus et de personnalisation de l’expérience utilisateur.

En bref

  • ✔ Solide expérience Python & SQL
  • ✔ Connaissance des bonnes pratiques ML
  • ✔ Capacité à vulgariser les résultats
  • ✔ Esprit orienté produit & impact

Contact

Un projet, une opportunité ou une question sur un de mes travaux ? Je serai ravi(e) d’en discuter.

Discutons de votre besoin data

Envoyez-moi un message avec quelques lignes sur votre contexte (secteur, type de données, objectif principal).

Coordonnées

Email : votre.email@exemple.com

LinkedIn : linkedin.com/in/votre-profil

GitHub : github.com/votre-compte

Disponibilités

✔ Missions freelance

✔ CDI / CDD data

✔ Remote ou hybride