Zakaria M.

Data Engineer

Zakaria er en dygtig datatekniker med seks års erfaring inden for it, jernbaner og sundhedssektoren.

Han har ekspertise med udførelse af ETL/ELT-operationer ved hjælp af Azure Databricks. Derudover er han meget dygtig til at designe og implementere QlikSense-løsninger, hvilket muliggør effektiv datavisualisering og analyse.

Zakarias passion for kunstig intelligens og maskinlæring driver hans fortsatte udforskning af innovative løsninger. Han holder sig aktivt opdateret med de seneste fremskridt inden for disse områder og søger muligheder for at anvende avancerede teknikker inden for dataanalyse og forudsigende modeller.

Hovedekspertise

  • Apache Spark
    Apache Spark 5 år
  • CSV 6 år
  • Data Engineering 6 år

Andre færdigheder

  • Apache Airflow
    Apache Airflow 3 år
  • Qlik Sense
    Qlik Sense 1 år
  • Git
    Git 1 år
Zakaria

Zakaria M.

Portugal

Match med udvikler her

Udvalgt oplevelse

Beskæftigelse

  • Sr. Data Engineer

    KWAN - 1 år 4 måneder

    -Design and deliver scalable ELT pipelines on Databricks using PySpark, Spark SQL, and medallion architecture (Bronze/Silver/Gold). -Implement data governance practices including Unity Catalog for centralized metadata management and data lineage tracking. -Apply partitioning and caching strategies to optimize query performance and reduce processing times. -Manage CI/CD orchestration with Azure DevOps for automated testing and deployment of data assets. -Integrate Databricks jobs with Airflow DAGs for end-to-end workflow orchestration and dependency management.

    Teknologier:

    • Teknologier:
    • Databricks Databricks
    • Apache Spark Apache Spark
    • Azure Blob storage Azure Blob storage
    • Apache Airflow Apache Airflow
    • Azure Synapse Azure Synapse
    • PySpark PySpark
    • Azure DevOps Azure DevOps
  • Sr. Data Engineer

    loomtech - 6 måneder

    -Built scalable ELT pipelines with Databricks using PySpark/Spark SQL for high-volume energy data processing. -Leveraged Delta Lake with time travel and CDC logic to ensure data consistency, auditability, and rollback capabilities. -Applied partitioning and caching strategies for performance optimization across large-scale transformations. -Managed CI/CD pipelines using GitLab for version-controlled deployments across environments. -Conducted code reviews and cross-team collaboration to maintain engineering standards and code quality.

    Teknologier:

    • Teknologier:
    • Databricks Databricks
    • Apache Spark Apache Spark
    • SQL SQL
    • PySpark PySpark
    • GitLab GitLab
    • Azure DevOps Azure DevOps
  • Data Engineer

    SDG Group (Client : Johnson & Johnson) - 4 flere år 4 måneder

    • Ansvarlig for at udføre ETL/ELT-operationer med Azure Databricks ved hjælp af PySpark og Spark SQL. Dette indebærer at udtrække data fra forskellige kilder, omdanne dem til et brugbart format og indlæse dem i en måldatabase eller et datalager;
    • Designede, udviklede, testede, fejlsøgte og implementerede QlikSense-løsninger baseret på specificerede krav fra virksomhedsbrugere i forbindelse med målsætninger for kontrolpaneler. Dette omfattede oprettelse af interaktive datavisualiseringer og rapporter for at hjælpe interessenterne med at træffe informerede beslutninger. De værktøjer, der blev anvendt i denne rolle, omfattede Azure Databricks, Apache Spark (PySpark, Spark SQL), Qlik Sense og Qlik NPrinting.

    Teknologier:

    • Teknologier:
    • Databricks Databricks
    • Apache Spark Apache Spark
    • Qlik Sense Qlik Sense
    • Azure Data Factory Azure Data Factory
    • PySpark PySpark
  • Data Engineer

    ONCF Rabat - 3 flere år 3 måneder

    • Ansvarlig for at analysere, designe og implementere ETL'er/ELT-workflows til forskellige projekter. Dette omfattede CRM-projektet, der blev brugt til forvaltning af kundeemner, aktuelle kunder og markedsføringskampagner, samt BI-projektet til salg af togbilletter til passagerer;
    • Designede og implementerede automatiserede ETL/ELT-jobs med tidsplanlægning, der blev overført til den centraliserede leverandør- og indkøbsstyringsdatabase fra forskellige datakilder. De værktøjer, der blev brugt i denne rolle, omfattede Talend (DI, Big Data, ESB) (Java), Azure Databricks, Hadoop Ecosystem, Apache Spark (Spark SQL, PySpark), Databricks, PostgreSQL og Power BI.

    Teknologier:

    • Teknologier:
    • PostgreSQL PostgreSQL
    • Databricks Databricks
    • Apache Spark Apache Spark
    • T-SQL T-SQL
    • SQL SQL
    • Azure Azure
    • Talend Talend
    • PySpark PySpark
  • ETL ingeniør

    Akka Technologies - 1 år 8 måneder

    • Tilpasning af ydeevnen: Optimering af ETL-processen, så den kører effektivt, herunder tilpasning af databaseforespørgsler og optimering af datastrømme;
    • Ansvarlig for analyse af detaljerede funktionelle specifikationer og udarbejdelse af tekniske specifikationer for ETL-projekter. – Dette omfattede design og udførelse af ETL-projekter med henblik på at generere rapporter og destinationsfiler i henhold til kundens behov;
    • Sørgede for strenge validerings- og leveringsfaser i disse projekter. Værktøjerne Talend ETL og PostgreSQL blev brugt i denne rolle.

    Teknologier:

    • Teknologier:
    • MSSQL MSSQL
    • T-SQL T-SQL
    • SQL SQL
    • Talend Talend

Uddannelse

  • MSc.Statsingeniør i Datalogi

    National School of Computer Science and Systems Analysis - ENSIAS Rabat · 2012 - 2016

  • MSc.State Engineer in Computer Science Engineering

    Ecole Nationale Supérieure d'Informatique et d'Analyse des Systèmes - ENSIAS Rabat · 2012 - 2016

Find din næste udvikler inden for få dage, ikke måneder

Book en 25-minutters samtale, hvor vi:

  • udfører behovsafdækning med fokus på udviklingsopgaver
  • Forklar vores proces, hvor vi matcher dig med kvalificerede, godkendte udviklere fra vores netværk
  • beskriver de næste trin for at finde det perfekte match på få dage

Lad os snakke om det