Zakaria M.

Data Engineer

Zakaria er en dyktig dataingeniør med seks års erfaring innen IT, jernbane og helsevesen.

Han har ekspertise innen å utføre ETL/ELT-operasjoner ved å bruke Azure Databricks. I tillegg er han svært dyktig i å designe og implementere QlikSense-løsninger, noe som muliggjør effektiv datavisualisering og analyse.

Zakarias lidenskap for kunstig intelligens og maskinlæring driver hans kontinuerlige utforskning av nyskapende løsninger. Han holder seg aktivt oppdatert med de siste fremskrittene på disse feltene, og søker muligheter til å bruke banebrytende teknikker i dataanalyse og prediktiv modellering.

Hovedekspertise

  • Apache Spark
    Apache Spark 5 år
  • CSV 6 år
  • Data Engineering 6 år

Andre kunnskaper

  • Apache Airflow
    Apache Airflow 3 år
  • Qlik Sense
    Qlik Sense 1 år
  • Git
    Git 1 år
Zakaria

Zakaria M.

Portugal

Kom i gang

Utvalgt opplevelse

Arbeidserfaring

  • Sr. Data Engineer

    KWAN - 1 year 4 months

    -Design and deliver scalable ELT pipelines on Databricks using PySpark, Spark SQL, and medallion architecture (Bronze/Silver/Gold). -Implement data governance practices including Unity Catalog for centralized metadata management and data lineage tracking. -Apply partitioning and caching strategies to optimize query performance and reduce processing times. -Manage CI/CD orchestration with Azure DevOps for automated testing and deployment of data assets. -Integrate Databricks jobs with Airflow DAGs for end-to-end workflow orchestration and dependency management.

    Teknologier:

    • Teknologier:
    • Databricks Databricks
    • Apache Spark Apache Spark
    • Azure Blob storage Azure Blob storage
    • Apache Airflow Apache Airflow
    • Azure Synapse Azure Synapse
    • PySpark PySpark
    • Azure DevOps Azure DevOps
  • Sr. Data Engineer

    loomtech - 6 months

    -Built scalable ELT pipelines with Databricks using PySpark/Spark SQL for high-volume energy data processing. -Leveraged Delta Lake with time travel and CDC logic to ensure data consistency, auditability, and rollback capabilities. -Applied partitioning and caching strategies for performance optimization across large-scale transformations. -Managed CI/CD pipelines using GitLab for version-controlled deployments across environments. -Conducted code reviews and cross-team collaboration to maintain engineering standards and code quality.

    Teknologier:

    • Teknologier:
    • Databricks Databricks
    • Apache Spark Apache Spark
    • SQL SQL
    • PySpark PySpark
    • GitLab GitLab
    • Azure DevOps Azure DevOps
  • Data Engineer

    SDG Group (Client : Johnson & Johnson) - 4 years 4 months

    • Ansvarlig for å utføre ETL/ELT-operasjoner med Azure Databricks ved bruk av PySpark og Spark SQL. Dette innebar å trekke ut data fra ulike kilder, transformere det til et brukbart format og laste det inn i en måldatabase eller datavarehus;
    • Designet, utviklet, testet, feilsøkte og implementerte QlikSense-løsninger basert på spesifiserte krav fra forretningsbrukere knyttet til dashbordmål. Dette omfattet å lage interaktive datavisualiseringer og rapporter for å hjelpe interessenter med å ta informerte beslutninger. Verktøyene som ble brukt i denne rollen inkluderer Azure Databricks, Apache Spark (PySpark, Spark SQL), Qlik Sense og Qlik NPrinting.

    Teknologier:

    • Teknologier:
    • Databricks Databricks
    • Apache Spark Apache Spark
    • Qlik Sense Qlik Sense
    • Azure Data Factory Azure Data Factory
    • PySpark PySpark
  • Data Engineer

    ONCF Rabat - 3 years 3 months

    • Ansvarlig for å analysere, designe og implementere ETL/ELT arbeidsflyter for ulike prosjekter. Dette inkluderte CRM-prosjektet brukt til styring av prospekter, kunder og markedsføringskampanjer, samt BI-prosjektet for salg av persontogbilletter;
    • Designet og implementerte automatiserte ETL/ELT-jobber med planlegging for mating av den sentraliserte leverandør- og innkjøpsadministrasjonsdatabasen fra forskjellige datakilder. Verktøyene som ble brukt i denne rollen inkluderer Talend (DI, Big Data, ESB) (Java), Azure Databricks, Hadoop Ecosystem, Apache Spark (Spark SQL, PySpark), Databricks, PostgreSQL og Power BI.

    Teknologier:

    • Teknologier:
    • PostgreSQL PostgreSQL
    • Databricks Databricks
    • Apache Spark Apache Spark
    • T-SQL T-SQL
    • SQL SQL
    • Azure Azure
    • Talend Talend
    • PySpark PySpark
  • ETL ingeniør

    Akka Technologies - 1 year 8 months

    • Ytelsesjustering: Optimalisering av ETL-prosessen for å sikre at den kjører effektivt, inkludert justering av databasespørringer og optimalisering av dataflyter;
    • Ansvarlig for å analysere detaljerte funksjonsspesifikasjoner og utarbeide tekniske spesifikasjoner for ETL-prosjekter. Dette inkluderte design og utførelse av ETL-prosjekter for å generere rapporter og destinasjonsfiler i henhold til kundens behov;
    • Sørget for at validerings- og leveringsfasene til disse prosjektene var strenge. Verktøyet som ble brukt i denne rollen var Talend ETL, sammen med PostgreSQL.

    Teknologier:

    • Teknologier:
    • MSSQL MSSQL
    • T-SQL T-SQL
    • SQL SQL
    • Talend Talend

Utdannelse

  • MSc.Statsingeniør i informatikk

    National School of Computer Science and Systems Analysis - ENSIAS Rabat · 2012 - 2016

  • MSc.State Engineer in Computer Science Engineering

    Ecole Nationale Supérieure d'Informatique et d'Analyse des Systèmes - ENSIAS Rabat · 2012 - 2016

Finn din neste utvikler innen dager, ikke måneder

I løpet av en kort 25-minutters samtale ønsker vi å:

  • Forstå dine utviklingsbehov
  • Forklare prosessen vår der vi matcher deg med kvalifiserte, evaluerte utviklere fra vårt nettverk
  • Dele de neste stegene for å finne riktig match, ofte på mindre enn en uke

La oss ta en prat