Mohamed Lamine OULD BOUYA

Logo

Portfolio Data scientist - IA - Data Engineering

View the Project on GitHub Momo3972/Portfolio-Data-IA

Mohamed Lamine OULD BOUYA

Data Scientist - Data Engineer - Data Analyst - IA

Je conçois des solutions data robustes, explicables et utiles : de l’ingestion à la mise en production, en passant par la modélisation ML/IA et la data visualisation.

Rueil-Malmaison
ouldbouya.mohamedlamine@gmail.com
+33 7 60 15 54 08
Objectif : stage de fin d’études (6 mois) dès que possible pour un début au plus tard le 10 mars 2026
Intérêts : Machine Learning - Data visulisation - IA générative - Qualité des données - Deep learning - Cloud - ETL


À propos de moi

Actuellement en Mastère Spécialisé Expert Big Data Engineer à l’Université de Technologie de Troyes (UTT), je combine un parcours ingénieur (analyse de risques, reporting automatisé, data qualité) et une solide formation en science des données.
Je m’intéresse particulièrement à la création de pipelines de données robustes, à l’analyse et la visualisation via API, à l’IA générative, à la modélisation et la mise en production de modèles IA.


Projets phares


1. Classification d’Images CIFAR-10 (MLP, CNN et Transfer Learning EfficientNetB0)

Développement d’un système complet de classification d’images CIFAR-10 incluant un CNN construit from scratch et un modèle EfficientNetB0 utilisant le Transfer Learning, la Data Augmentation et un Fine-Tuning avancé. Création d’un pipeline reproductible + application Streamlit de démonstration.

Stack

Python, TensorFlow/Keras, NumPy, Scikit-learn, Matplotlib, Google Colab, Streamlit

Objectif

Comparer deux approches d’apprentissage profond pour mesurer l’impact du Transfer Learning :

Objectif : démontrer les gains en performance et en généralisation.

Méthodes utilisées

Principaux résultats

Livrables


2. Credit Default MLOps Pipeline

Développement d’un pipeline MLOps end-to-end production-ready pour la prédiction du défaut de paiement, intégrant l’entraînement du modèle, le versioning MLflow, le déploiement API et le monitoring temps réel.


3. Everflow API Analytics

Développement d’un mini-système analytique pour visualiser la performance marketing via l’API Everflow, incluant l’extraction de données, le calcul de métriques clés (profit), et la génération automatique de graphiques et d’un rapport Markdown.


4. NOAA Weather - Industrial End-to-End MLOps Pipeline

Conception et déploiement d’un pipeline MLOps industriel end-to-end pour la prévision de températures à partir de données NOAA, couvrant l’ingestion automatisée, l’entraînement supervisé, la gouvernance des modèles, le déploiement API et le monitoring de la dérive des données.


5. Chatbot RAG IA Générative

Développement d’un chatbot IA utilisant une architecture RAG et une interface Web, permettant d’interroger dynamiquement une base documentaire PDF et d’obtenir des réponses contextualisées


6. Détection de fraude bancaire

Analyse et modélisation de transactions bancaires pour identifier des signaux faibles de fraude dans un contexte de données fortement déséquilibrées


7. Dashboard Power BI - Analyse de la performance commerciale

Création d’un tableau de bord interactif pour analyser les ventes, profits et performances commerciales du dataset Global Superstore


8. Prédiction de la présence d’un réservoir pétrolier

Prédiction de la présence d’un réservoir pétrolier à partir de données géologiques et sismiques simulées - avec analyse d’interprétabilité SHAP pour valider la cohérence géologique


9. Analyse de l’Espérance de Vie (2000–2015)

Analyse statistique complète des déterminants de l’espérance de vie mondiale (OMS), incluant une pipeline reproductible (Makefile), plusieurs modèles prédictifs et un rapport automatisé


Compétences techniques

Domaine Compétences
Langages Python, SQL, R, Excel
Machine Learning Scikit-learn, XGBoost, PCA, SMOTE
Deep Learning / Computer vision MLP, CNN, Transfer Learning, EfficientNet, Python, TensorFlow/Keras, NumPy, Matplotlib, Scikit-learn, Google Colab
Visualisation Power BI, Tableau, Plotly, Matplotlib, Seaborn
Base de données MySQL, MongoDB
Cloud / Big Data Google Cloud Platform (GCP), Snowflake, Databricks
Data Engineering ETL, Pipelines, FastAPI, MLflow (Tracking et Model Registry), Apache Airflow, EvidentlyAI, GitHub Actions, Docker, Docker Compose, MinIO (S3), PostgreSQL, Prometheus, Grafana, Linux, WSL2 (Ubuntu), Machine virtuelle, ingestion multi-source, EDA, data quality
Outils / Méthodo Git, VS Code, Jupyter, tests unitaires, documentation

Formation & Certifications


Expériences professionnelles

🔹 AERGON - Ingénieur d’études (2019 - aujourd’hui)

🔹 IRD - Ingénieur stagiaire (modélisation numérique) (2013)


Soft Skills


Centres d’intérêt

Lecture technique & IA | Football | Cuisine | Poésie


Me retrouver


Je cherche à rejoindre une équipe data ambitieuse pour transformer les données en valeur métier réelle, en combinant rigueur analytique, esprit d’ingénierie et créativité IA.