Himanshu S.

Himanshu S.

Data Engineer

Germany
Betroet medlem siden 2024
5 års erfaring

I løbet af de sidste fem år har Himanshu positioneret sig som Full-stack-datakonsulent i kraft af sin ekspertise inden for maskinlæring og datavidenskab.

Hos KnowledgeFoundry og ZS Associates var Himanshu et væsentligt aktiv i deres tekniske teams. Han er en pålidelig og dedikeret udvikler inden for datateknik med alsidige færdigheder.

Hovedekspertise

OpenCVOpenCV4 år
LinuxLinux5 år
LangChainLangChain2 år
Scikit-learnScikit-learn5 år
33+

Erfaring5

InfoGain

Data Engineer

InfoGain
Jun 2021 - Apr 2022 · 10m
  • Skabte en Data Warehouse-løsning ved hjælp af AWS Redshift og AWS Glue og migrerede en OLAP-database fra MS SQL Server.
  • Etableret en DBT-pipeline til ETL-processer, der overfører data mellem et MySQL-lager og en aktivitetsdatabase til en Neo4j-grafdatabase ved hjælp af indbygget Python-programmering. Opsætningen blev implementeret på en AWS Linux-boks med Neo4j kørende som en Docker-container.
  • Udviklet en ETL-pipeline til udførelse af markedskurvanalyser og andre marketingstatistikker på millioner af rækker af transaktionsdata. Brugte Redshift som en transaktionsdatabase og udfyldte den på en serverløs måde ved hjælp af Amazon Lambda-funktioner i realtid.
InfoGain

Data Engineer Consultant

InfoGain
Information Technology (IT) and Services
Jun 2021 - Apr 2022 · 10m
  • Created a Data Warehouse solution utilizing AWS Redshift and AWS Glue, migrating an OLAP database from MSSQL Server.

  • Established a DBT pipeline for ETL processes, transferring data between MySQL warehouse and activity database to Neo4j graph database using native Python programming. Setup was implemented on an AWS Linux box with Neo4j running as a Docker container.

  • Developed an ETL pipeline for conducting market basket analysis and other marketing statistics on millions of rows of transactional data. Utilized Redshift as a transactional database and populated it in a serverless fashion using Amazon Lambda function in real-time.

Microsoft Power BIMicrosoft Power BI
Knowledge Foundry Business Solutions

Data Scientist

Knowledge Foundry Business Solutions
Information Technology (IT) and Services
May 2021 - Mar 2022 · 10m

Contributed in building Market Intelligence dashboard pipeline. Using unstructured review text, did a NER and relationship extraction to get Sentiment at entity level.

Trend forecasting and sentiment calculation to help businesses make better decisions and improve marketing strategy. Used AWS for cloud computing.

ZS Associates

Data Engineer

ZS Associates
Information Technology (IT) and Services
Oct 2020 - Apr 2021 · 6m
  • Udviklet en pipeline til at konvertere data til et struktureret format, der gør det muligt at servere til Prodigy til ML-relateret tagging. Hele pipelinen blev konstrueret på en modulær måde ved hjælp af ren Python og shell-scripting.
  • Implementerede datatransformationer i Python og lagrede de behandlede data i en Amazon S3-bucket til opbevaring og tilgængelighed.
KnowledgeFoundry

Data Engineer

KnowledgeFoundry
Data Analytics
Jun 2019 · 6y 9m
  • Automatiseret processen med at skrive Hive-forespørgsler til ETL af flere tabeller (både engangs og inkrementelle) ved at generere automatiserede scripts.
  • Læs CSV-filer fra mappeplaceringer, oprettede tabeller og udførte inkrementelle belastninger sekventielt.
  • Opsætning af Snowflake som den primære lagringsløsning for strukturerede data og brug af DBT til ETL-processer. Udarbejdede SQL-baserede modeller til at definere transformationslogik og sikre fleksibilitet med inkrementel indlæsning og versionskontrol ved hjælp af DBT.
  • Forberedte transformerede data til analyse ved hjælp af business intelligence-værktøjer, hvilket gjorde det lettere at finde frem til indsigter. Udførte regelmæssige kontroller i Snowflake og DBT for at opretholde dataintegritet og pipelinefunktionalitet.
  • Designede og udviklede datapipelines til at udtrække, transformere og indlæse data fra forskellige kilder til et centraliseret datalager.
Microsoft Power BIMicrosoft Power BI

Certifikater 1

Databricks Certified Machine Learning ProfessionalDatabricks, Inc.

Issued Jan 2025 - Expires Jan 2027
Credential ID 131562332

DatabricksDatabricks
Machine LearningMachine Learning
Databricks Certified Machine Learning ProfessionalDatabricks, Inc.

Issued Jan 2025 - Expires Jan 2027
Credential ID 131562332

DatabricksDatabricks
Machine LearningMachine Learning
Vil du vide mere om Himanshu certificeringer?Book et opkald

Uddannelse

Dharmsinh Desai University
Dharmsinh Desai University
Information Technology2015 - 2019

Stop med at søge.
Bliv matchet hurtigere.