Rachid EL MAAZOUZ

Senior Data Engineer

Paris, France
relmaazouz[at]proton.me
+33 (0) x xx xx xx xx
Professional Summary

A passionate and results-driven professional with over a decade of experience in Software and Data Engineering. Proven track record of delivering high-quality solutions and driving innovation. Skilled in cost effective data platforms implementations with a strong focus on pipleline design and optimization, velocity. Committed to continuous learning and professional growth.

Professional Experience

Senior Data Engineer

August 2024 - Present

CandriamParis

  • Developing data ingestion framework: loading any file using data contracts.
  • Data quality framework: data controls and formatting between different layers of the medallion architecture.
  • Data Pipeline design and implementations: Notebooks, PySpark library and Azure Synapse pipelines.
  • Testing and Monitoring framework: data control and validation, monitoring data loads.
  • APIs design and implementation: serving referential and reporting data to clients and business teams.
  • Environnement: Azure Synapse, Pyspark, Delta format, Azure Data Lake, Azure Table Storage, Azure DevOps, FastAPI, GraphQL, SQL Server.

Senior Data Engineer

09/2023 - 09/2024

Informatique CDCParis

  • Developing user stories for different data risk applications and data usages on PySpark: data transformation, dataopy, data aggregation and controls.
  • Data Vault design: requirement gathering and architecture design.
  • Design and implementation of CI/CD: Jenkins, Git, GitFlow, BitBucket, CloudBees,
  • Setup and tuning new environments: UAT, pre-production, clone.
  • Unit test automation with Pytest and Pydantic: data and schemas validations.
  • Develop Kafka consumers and producers for data exchange with external data providers and consumers.
  • Environnement: Cloudera , Spark, PySpark, Scala, Hive, Python, Kafka, AirFlow, PyTest, Pydantic, Jenkins, CloudBees, Parquet, AVRO.

Senior Data Engineer

11/2021 - 08/2023

Crédit AgricoleMontrouge

  • MCO datalake sous MapR: Hive, Hadoop, Sqoop, Tez, Hue, Oozie, PySpark.
  • Développement des jobs d’ingestion, transformation, et d’exposition des données.
  • Migration: conception et implémentation d’un nouveau datalake: zones de données, traitements d’ingestion.
  • Translation des scripts SQL sous Hive vers Oracle SQL
  • Génération des objets ODI (Interfaces, Traitements, Scénarios) via des scripts Python.
  • Automatisation de la recette: validation des tables (schémas, colonnes, types), vues.
  • Conteneurisation de l’application Cash In Time sous Kubernetes et ArgoCD.
  • Mise en place des chaînes CI/CD du deploiement du code source.
  • Environnement: PySpark, Hive, Sqoop, Pandera, Pydantic, Tez, Hue, Oozie, Jenkins, Docker, ArgoCD, Kubernetes, GitLab, Oracle ODI, Oracle Database 19c.

Consultant Data

11/2020 - 10/2021

Informatique CDCMontrouge

  • Participation aux ateliers de recueil de besoins : écrans, workflows d’approbation, champs additionnels
  • Rédaction des spécifications techniques: mapping des transactions vers la nouvelle codification
  • Extraction des données depuis FIC via des scripts Front Script: fonds, investisseurs, sociétés, instruments, liens d’investissement, benchmarks, contacts) et les transactions sur sociétés : mapping transactions, instruments et champs additionnels.
  • Mise en place d’un datahub basé sur PostgreSQL: échange des données transactions, fonds, instruments et liens d’investissement via Kenesis vers AWS S3.
  • Développement d’une application web pour le processus de valorisation spécifique sur Apache Spring.
  • Environnement: eFront FIA, SQL Server, PostgreSQL, Apache Kafka, AWS S3, Spring Boot.

Data Engineer

07/2018 - 09/2020

Consolis GroupParis

  • Conception et développement d’un datalake basé sur BigQuery: Zone d’ingestion des données brutes et zone de transformation des données.
  • Développement du pipeline d’ingestion et transformation des données : ingestion des fichiers de données des filiales du groupe par Pub Sub, enrichissement des données dans la zone de transformation.
  • Développement des rapports analytiques et de synthèses sous Data Studio
  • Environnement: GCP: BigQuery, DataProc, Composer, Data Studio, Google Data Storage.

Data Engineer

08/2016 - 05/2018

InwiCasablanca, Maroc

  • Installation et configuration d’un cluster sur Apache Ambari, RHEL, Apache Hadoop, Apache Kafka, Apache HBase, Apache Hive
  • Ingestion des données des systèmes CRM, CDRs, HLR, VLR et PPS via Apache Flink en temps réel vers un data lake Hive.
  • Nettoyage, homogénéisation et normalisation des données et élaboration des datamarts métiers: réseau, équipement, données (voix, SMS, MMS, mobiles), clients
  • Préparation des données clients pour prévoir le taux de désabonnement: les données des réseaux sociaux, localisation du mobile, historique des appels et SMS du client
  • Développement des rapports et visualisations interactives des données: graphes temporels, graphes de bulles et nuages de données: Évolution des métriques temporelles, concentration des valeurs géographiques
  • Environnement technique: Apache Spark(PySpark), Flink, Sqoop, Hive, Hue, Oozie, Tez, Ambari, ORC, Oracle OBIEE.

Oracle Consultant

05/2014 - 08/2016

OCP GroupCasablanca, Maroc

  • Développement des rapports sous SQL, PL/SQL et XML Publisher.
  • Personnalisation et développement des pages de saisie et restitution de données sous Oracle OAF et Oracle Forms
  • Développement des programmes de copies de données, calculs d’amortissements sous ProC/C++.
  • API C++ de vérification et de chargement des fichiers de données volumineux.
  • Développement des APIs data basées sur des tables et web services pour échange de données avec les systèmes externes.

Web Developer

08/2013 - 04/2014

S2MCasablanca, Maroc

  • Conception des schémas de données et d’interface d’échange avec le système core banking SELECT SYSTEM V6.
  • Conception de l’architecture de l’application: module web et module web service.
  • Développement des web services : authentification, virement, relevé du compte et fichier de salaires.
  • Environnement: Hibernate, Spring web, Apache CXF web services, Oracle Database, PostgreSQL, Jenkins, Git, HTML5
Education

Masters in Financial Markets

September 2023 - September 2025

CNAMParis, France

Fixed Income Assets; Portfolio Management, Arbitrage & Makovitz theories; Probability & Statistics for finance; Interest rate products; Futures, Options pricing; Thesis: Spoofing detection and order book dynamics

Engineer degree in Software Engineering

August 2010 - July 2013

Mohammadia School of EngineersRabat, Morocco

Undergraduate classes in maths and physics for preparing the nationwide exam

September 2008 - June 2010

CPGE AL QALAMAgadir, Morocco

Baccalaureat in mathematics

September 2007 - June 2008

Salah Eddine AL AYOUBI high schoolTinghir, Morocco

Skills & Technologies

Technical Skills

SparkPysparkDatabricksFlinkPinot

Clouds

AzureGCPAWS

Programming Skills

PythonCC++JavaSQLRust

Soft Skills

CommunicationProblem SolvingTeam CollaborationProject Management