Rihab B.

Rihab B.

Data Engineer

Tunisia
Luotettava jäsen vuodesta 2024
7 vuoden kokemus

Teknisten taitojensa lisäksi Rihabilla on laaja kokemus johtamisesta ja projektinhallinnasta. Yksi hänen tärkeimmistä saavutuksistaan on datan kuratointipalvelun rakentaminen samalla kun hän toimi Scrum Masterina, jossa hän johti menestyksekkäästi tiimiä ja toteutti uuden datapalvelun Scalan avulla.

Rihabin vahvat tekniset taidot ja johtamiskokemus yhdistyvät, joten hän sopii erinomaisesti säännellyillä toimialoilla toteutettaviin hankkeisiin.

Tärkein asiantuntemus

AWS S3AWS S35 vuotta
ETLETL5 vuotta
MLOps2 vuotta
JenkinsJenkins4 vuotta
14+

Kokemus10

Data4Geeks

Senior Data Engineer

Data4Geeks
Data Analytics
Jan 2023 · 3y 2m
  • Suunnitellut ja toteuttanut dataputkistoja sekä erä- että virtakäsittelyä varten optimoiden tietovirtaa ja tehokkuutta;
  • Tutkit ja toteutit dataputkistoja AWS Gluen ja PySparkin avulla varmistaen skaalautuvuuden ja kestävyyden;
  • Integroitu Delta Lake putkistoihin deltaprosessoinnin mahdollistamiseksi, mikä parantaa tiedonhallintavalmiuksia;
  • Kehitimme Jinjaa käyttäen työn templatointia tietojenkäsittelytöiden luomisen ja hallinnan tehostamiseksi;
  • Rakennetaan ja automatisoidaan tietojen validointiputkia, joilla varmistetaan käsiteltyjen tietojen tarkkuus ja luotettavuus;
  • Otti käyttöön ja konfiguroi Trinon helpottamaan tehokasta tietojen käyttöä ja kyselyjä eri lähteistä;
  • Laaditaan kattava dokumentaatio jokaisesta tutkitusta komponentista ja työkalusta, mikä varmistaa tiedonsiirron ja helpon ylläpidon;
  • Hyödynsi työkaluja, kuten Python, PySpark, Glue (Jobs, Crawlers, Catalogs), Athena, AWS, MWAA (Airflow), Kubernetes, Trino ja Jinja, projektin tavoitteiden saavuttamiseksi.
AWSAWS
DatabricksDatabricks
Apache SparkApache Spark
PythonPython
AWS S3AWS S3
11+
Data4Geeks

Senior Data Engineer

Data4Geeks
Jan 2023 · 3y 2m

Ennustealustan suunnittelu ja toteutus - Engie (ranskalainen maailmanlaajuinen energiayhtiö)

  • Suunnitteli ja toteutti kattavan, maailmanlaajuiselle energiasektorille räätälöidyn ennustealustan.
  • Kehitit dataputkistoja Pythonilla ja PySparkilla varmistaen tehokkaan ja skaalautuvan tietojenkäsittelyn.
  • Orkestroi työnkulkuja Airflow'n ja Databricksin avulla optimoiden tehtävien hallintaa ja suorittamista.
  • Toteutti datatekniikan prosesseja, joissa hyödynnettiin Databricksin Delta Live Tables (DLT) -järjestelmää vankkaa tiedonhallintaa varten.
  • Rakensit ja otit käyttöön datavirtojen käsittelyputkistoja DLT:tä käyttäen, mikä mahdollistaa reaaliaikaiset tietojenkäsittelyominaisuudet.
  • Kehitit Feature Store API:t vuorovaikutusta varten komponenttien kanssa ja loit uudelleenkäytettäviä malleja prosessien standardoimiseksi.
  • Hyödynsi MLflow'ta kokeilujen ja koneoppimismallien rakentamiseen, hallintaan ja seurantaan varmistaen tiukan kokeilun.
  • Hallitsi ML-mallien elinkaarta MLOps-tekniikoita käyttäen ja otti käyttöön uudelleenkäytettäviä malleja johdonmukaisuuden ja tehokkuuden varmistamiseksi.
  • Luonut kojelautoja tietojen analysointia ja visualisointia varten, mikä helpottaa tietoon perustuvaa päätöksentekoa.
  • Kehitit .NET/C#:n avulla API-rajapintoja tietojen paljastamiseksi ja varmistit saumattoman integroinnin ja saavutettavuuden eri järjestelmissä.
  • Käyttänyt työkaluja, kuten Databricks, PySpark, Python, R, SQL, Glue, Athena, Kubernetes ja Airflow vankan ja skaalautuvan ratkaisun tuottamiseksi.
Data4Geeks

AI/Data Engineer

Data4Geeks
Data Analytics
Jan 2022 - Dec 2023 · 1y 11m
  • Johti hankkeita, joissa keskityttiin suurten kielimallien (LLM) ja tekoälyteknologioiden integrointiin ja edisti innovointia organisaatiossa;
  • Avustanut tiedonsiirtoratkaisujen suunnittelussa ja toteuttamisessa varmistaen saumattomat siirtymät eri asiakkaille;
  • Kehitit integraatioita ja asiakkaita vektoritietokantoja varten hyödyntäen erilaisia avoimen lähdekoodin tekoälytyökaluja valmiuksien parantamiseksi;
  • Viestittivät aktiivisesti asiakkaiden kanssa kerätäkseen vaatimuksia ja varmistaakseen, että ne vastaavat heidän erityistarpeitaan;
  • Hyödynsi Pythonin, Google Cloud Platformin (GCP) ja Datastaxin kaltaisia työkaluja vankkojen ratkaisujen toimittamiseksi.
CassandraCassandra
PythonPython
Google CloudGoogle Cloud
TensorFlowTensorFlow
GitGit
LangChainLangChain
Cognira

Software Engineering Manager/Senior Data ENGINEER

Cognira
Information Technology (IT) and Services
Jan 2022 - Jul 2022 · 6m

Building and supporting promotion planning demo solution

  • Developed generic data pipelines to transform raw client data into a format compatible with the data model of the promotion planning demo system;

  • Wrote scripts to generate meaningful business data, ensuring alignment with the needs of the application;

  • Collaborated with the science team to understand business requirements and determine the necessary data transformations to enhance data utility;

  • Designed and implemented a generic PySpark codebase that efficiently transforms data to fit the required data model;

  • Utilized tools such as PySpark, JupyterHub, Kubernetes, and Azure Data Lake to execute and support the project.

DockerDocker
DatabricksDatabricks
Apache SparkApache Spark
MavenMaven
KubernetesKubernetes
6+
Data4Geeks

Senior Data Engineer

Data4Geeks
Financial Technology (FinTech)
Oct 2021 - Jul 2024 · 2y 9m

Implementing and Migrating Data Pipelines, and Supporting Legacy Systems - SumUp (Fintech German Company)

  • Designed and implemented data pipelines for both batch and stream processing, optimizing data flow and efficiency;

  • Explored and implemented data pipelines using AWS Glue and PySpark, ensuring scalability and robustness;

  • Integrated Delta Lake into the pipelines to enable delta processing, enhancing data management capabilities;

  • Developed job templating using Jinja to streamline the creation and management of data processing jobs;

  • Built and automated data validation pipelines, ensuring the accuracy and reliability of processed data;

  • Deployed and configured Trino to facilitate efficient data access and querying across various sources;

  • Prepared comprehensive documentation for each component and tool explored, ensuring knowledge transfer and easy maintenance;

  • Utilized tools such as Python, PySpark, Glue (Jobs, Crawlers, Catalogs), Athena, AWS, MWAA (Airflow), Kubernetes, Trino, and Jinja to achieve project goals.

PostgreSQLPostgreSQL
AWSAWS
PythonPython
TerraformTerraform
AWS AthenaAWS Athena
4+
Cognira

Software Engineering Manager/Senior Data ENGINEER

Cognira
Retail
Jan 2019 - Jan 2022 · 3y

Building a Data Curation Platform

  • Implemented a platform designed to make building data pipelines generic, easy, scalable, and quick to assemble for any new client;

  • Prepared detailed design documents, architectural blueprints, and specifications for the platform;

  • Gathered and documented requirements, creating specific epics and tasks, and efficiently distributed work among team members;

  • Developed command-line and pipeline functionalities that enable chaining transformations, facilitating the creation of generic data pipelines;

  • Supported the management of metadata for various entities defined within the platform;

  • Conducted runtime analysis and optimized the performance of different platform functionalities;

  • Studied scalability requirements and designed performance improvement strategies to enhance the platform's robustness;

  • Built a PySpark interface to facilitate seamless integration with data science workflows.

ScalaScala
Azure Blob storageAzure Blob storage
Cognira

Software Engineering Manager/Senior Data ENGINEER

Cognira
Retail
Sep 2017 - Aug 2022 · 4y 11m
  • Kehitettiin yleisiä dataputkistoja, joiden avulla muunnettiin raa'at asiakastiedot muotoon, joka on yhteensopiva myynninedistämissuunnittelun esittelyjärjestelmän tietomallin kanssa;
  • Kirjoitti skriptejä merkityksellisten liiketoimintatietojen tuottamiseksi varmistaen, että ne vastaavat sovelluksen tarpeita;
  • Yhteistyössä tiedetiimin kanssa liiketoiminnan vaatimusten ymmärtämiseksi ja tarvittavien tietomuunnosten määrittämiseksi tietojen hyödyllisyyden parantamiseksi;
  • Suunnittelit ja toteutit yleisen PySpark-koodipohjan, joka muuntaa tehokkaasti tietoja vaadittuun tietomalliin sopiviksi;
  • Hyödynsi työkaluja, kuten PySpark, JupyterHub, Kubernetes ja Azure Data Lake, projektin toteuttamiseen ja tukemiseen.
ScalaScala
Azure Blob storageAzure Blob storage
Cognira

Software Engineering Manager/Senior Data ENGINEER

Cognira
Sep 2017 - Aug 2022 · 4y 11m
  • Johti tiimiä, joka rakensi dataputkia tukemaan vähittäiskauppiaan myynninedistämisen suunnitteluratkaisua;
  • Osallistui kokouksiin liiketoiminta- ja datatieteiden tiimien kanssa projektin tarpeiden ymmärtämiseksi ja tunnistamiseksi;
  • Yhteistyössä tiimin kanssa liiketoimintavaatimusten kääntäminen toimiviksi eepoksiksi ja tarinoiksi;
  • Suunnitteli ja toteutti yksilöidyt liiketoimintavaatimukset varmistaen niiden yhdenmukaisuuden hankkeen tavoitteiden kanssa;
  • Kehitit ja suoritit yksikkötestejä toteutusten toiminnallisen oikeellisuuden varmistamiseksi;
  • Luotu Scala Sparkia käyttävä datanlataussovellus tietojen lataamiseksi Parquet-tiedostoista Cosmos DB/Cassandra API:han;
  • Toteutti Scalaa, Akkaa ja Dockeria käyttäen online-ennustajan API:n, joka mahdollistaa reaaliaikaisen myynninedistämisennusteen;
  • Hallitsi projektin käyttöönottoa asiakkaan Kubernetes-klusterissa varmistaen sujuvan toiminnan ja integroinnin;
  • Hyödynsi työkaluja, kuten Scala, Spark, Azure Databricks, Azure Data Lake ja Kubernetes, projektin tavoitteiden saavuttamiseksi.
Cognira

R&D Engineer

Cognira
Information Technology (IT) and Services
Sep 2017 - May 2019 · 1y 8m

Project 1: Building a Speech Recognition Solution

  • Developed a speech recognition solution aimed at transforming retailers' questions and commands into actionable tasks executed against a user interface (UI);

  • Utilized TensorFlow, Python, AWS, and Node.js to design and implement the solution, ensuring seamless interaction between the speech recognition engine and the UI.

Project 2: Design and Implementation of a Short Life Cycle Forecasting System

  • Prepared comprehensive design documents and conducted studies on existing AI solutions, with a focus on voice and speech recognition capabilities;

  • Collaborated with the team to prepare and collect relevant data for the project;

  • Executed the processes of data augmentation, validation, and transformation to extract essential information for forecasting purposes;

  • Contributed to building a user interface and integrated backend functionalities using tools such as TensorFlow, Python, AWS, JavaScript, Node.js, Scala, and Spark.

PythonPython
ScalaScala
Azure Blob storageAzure Blob storage
TensorFlowTensorFlow
Machine LearningMachine Learning
Infor

Fullstack Data Scientist

Infor
Information Technology (IT) and Services
Aug 2014 - Sep 2017 · 3y 1m
  • Designed and structured the architecture for various components of a retail forecasting project;

  • Implemented and deployed key components, ensuring seamless functionality within the overall system;

  • Integrated all components, automating the processes and establishing an end-to-end batch process for streamlined operations;

  • Optimized the runtime and performance of each component, enhancing the system's overall efficiency;

  • Developed forecast comparison templates to facilitate the evaluation of forecast quality, aiding in accurate performance assessments;

  • Utilized Logicblox, Python, and Tableau Software to achieve project goals, ensuring high-quality results.

PythonPython
Data Science
Data Engineering
Machine LearningMachine Learning
Integration Testing
TableauTableau

Arviointi

Tekniikan huippuosaaminen

Rihab yleinen suorituskyky 90 minuutin suorassa teknisessä arvioinnissa on top 25 % Proxifyn tarkastetuista Data Engineer.

Sertifikaatit 1

Databricks Certified Data Engineer AssociateDatabricks, Inc.

Issued Feb 2025 - Expires Feb 2027
Credential ID 133741658

DatabricksDatabricks
Data Engineering
Databricks Certified Data Engineer AssociateDatabricks, Inc.

Issued Feb 2025 - Expires Feb 2027
Credential ID 133741658

DatabricksDatabricks
Data Engineering
Haluatko tietää enemmän Rihab sertifikaateista?Varaa puhelu

Koulutus

NSO
National School Of Computer Science
Computer Science2011 - 2014

Lopeta selaaminen.
Sovitetaan nopeammin.