Himanshu S.

Data Engineer

Himanshu Surana ist ein erfahrener Data Engineer mit umfassender Erfahrung und professionellen Kenntnissen in SQL, Snowflake und AWS. Er war in verschiedenen Branchen tätig, unter anderem im Gesundheitswesen, im Einzelhandel, in der Automobilindustrie und im Finanzwesen.

In den letzten fünf Jahren hat Surana seine Fähigkeiten weiterentwickelt und sich dank seiner Expertise in den Bereichen maschinelles Lernen und Data Science als Full-Stack Data Consultant etabliert.

Während seiner Zeit bei KnowledgeFoundry und ZS Associates leistete Himanshu einen bedeutenden Beitrag zu den technischen Teams. Mit seinen vielfältigen Fähigkeiten und seinem Engagement gilt er als zuverlässiger Entwickler auf dem Gebiet des Data Engineering.

Hauptkompetenz
  • OpenCV
    OpenCV 4 Jahre
  • Linux
    Linux 5 Jahre
  • LangChain
    LangChain 2 Jahre
Andere Fähigkeiten
  • Docker
    Docker 3 Jahre
  • FastAPI
    FastAPI 2 Jahre
  • ChatGPT API
    ChatGPT API 2 Jahre
Himanshu
Himanshu S.

Germany

Erste Schritte

Ausgewählte Erfahrung

Beschäftigung

  • Data Engineer

    InfoGain - 10 monate

    • Created a Data Warehouse solution utilizing AWS Redshift and AWS Glue, migrating an OLAP database from MS SQL Server.
    • Established a DBT pipeline for ETL processes, transferring data between a MySQL warehouse and an activity database to a Neo4j graph database using native Python programming. The setup was implemented on an AWS Linux box with Neo4j running as a Docker container.
    • Developed an ETL pipeline for conducting market basket analysis and other marketing statistics on millions of rows of transactional data. Utilized Redshift as a transactional database and populated it in a serverless fashion using Amazon Lambda functions in real time.

    Technologien:

    • Technologien:
    • Python Python
    • ETL ETL
    • Data Engineering
    • AWS AWS
  • Data Engineer

    ZS Associates - 6 monate

    • Developed a pipeline to convert data into a structured format, enabling serving to Prodigy for ML-related tagging. The entire pipeline was constructed in a modular fashion using pure Python and shell scripting.
    • Implemented data transformations in Python and stored the processed data in an Amazon S3 bucket for storage and accessibility.

    Technologien:

    • Technologien:
    • Python Python
  • Data Engineer

    KnowledgeFoundry - 5 jahre 6 monate

    • Automated the process of writing Hive queries for ETL of multiple tables (both one-time and incremental) by generating automated scripts.
    • Read CSV files from folder locations and created tables, then performed incremental loads sequentially.
    • Set up Snowflake as the primary storage solution for structured data and utilized DBT for ETL processes. Crafted SQL-based models to define transformation logic, ensuring flexibility with incremental loading and version control using DBT.
    • Prepared transformed data for analysis using business intelligence tools, facilitating effortless insights discovery. Conducted regular checks in Snowflake and DBT to maintain data integrity and pipeline functionality.
    • Designed and developed data pipelines to extract, transform, and load data from diverse sources into a centralized data warehouse.

    Technologien:

    • Technologien:
    • ETL ETL
    • SQL SQL
    • Data Engineering

Ausbildung

  • BSc.Information Technology

    Dharmsinh Desai University · 2015 - 2019

Finden Sie Ihren nächsten Entwickler innerhalb von Tagen, nicht Monaten

In einem kurzen 25-minütigen Gespräch würden wir gerne:

  • Auf Ihren Bedarf bezüglich des Recruitments von Software-Entwicklern eingehen
  • Unseren Prozess vorstellen und somit wie wir Sie mit talentierten und geprüften Kandidaten aus unserem Netzwerk zusammenbringen können
  • Die nächsten Schritte besprechen, um den richtigen Kandidaten zu finden - oft in weniger als einer Woche

Unterhalten wir uns