NEW
Proxify is bringing transparency to tech team performance based on research conducted at Stanford. An industry first, built for engineering leaders.
Learn more
Himanshu S.
Data Engineer
Himanshu er en erfaren dataingeniør med bred erfaring og færdigheder inden for SQL, Snowflake og AWS. Han har arbejdet i forskellige brancher, herunder sundhed, detailhandel, bilindustri og finans.
I løbet af de sidste fem år har Himanshu positioneret sig som Full-stack-datakonsulent i kraft af sin ekspertise inden for maskinlæring og datavidenskab.
Hos KnowledgeFoundry og ZS Associates var Himanshu et væsentligt aktiv i deres tekniske teams. Han er en pålidelig og dedikeret udvikler inden for datateknik med alsidige færdigheder.
Hovedekspertise
- OpenCV 4 år
- Linux 5 år

- LangChain 2 år
Andre færdigheder
- Docker 3 år
- FastAPI 2 år
- OpenAI API 2 år
Udvalgt oplevelse
Beskæftigelse
Data Engineer
InfoGain - 10 måneder
- Skabte en Data Warehouse-løsning ved hjælp af AWS Redshift og AWS Glue og migrerede en OLAP-database fra MS SQL Server.
- Etableret en DBT-pipeline til ETL-processer, der overfører data mellem et MySQL-lager og en aktivitetsdatabase til en Neo4j-grafdatabase ved hjælp af indbygget Python-programmering. Opsætningen blev implementeret på en AWS Linux-boks med Neo4j kørende som en Docker-container.
- Udviklet en ETL-pipeline til udførelse af markedskurvanalyser og andre marketingstatistikker på millioner af rækker af transaktionsdata. Brugte Redshift som en transaktionsdatabase og udfyldte den på en serverløs måde ved hjælp af Amazon Lambda-funktioner i realtid.
Data Engineer Consultant
InfoGain - 10 måneder
-
Created a Data Warehouse solution utilizing AWS Redshift and AWS Glue, migrating an OLAP database from MSSQL Server.
-
Established a DBT pipeline for ETL processes, transferring data between MySQL warehouse and activity database to Neo4j graph database using native Python programming. Setup was implemented on an AWS Linux box with Neo4j running as a Docker container.
-
Developed an ETL pipeline for conducting market basket analysis and other marketing statistics on millions of rows of transactional data. Utilized Redshift as a transactional database and populated it in a serverless fashion using Amazon Lambda function in real-time.
Teknologier:
- Teknologier:
Microsoft Power BI
-
Data Scientist
Knowledge Foundry Business Solutions - 10 måneder
Contributed in building Market Intelligence dashboard pipeline. Using unstructured review text, did a NER and relationship extraction to get Sentiment at entity level.
Trend forecasting and sentiment calculation to help businesses make better decisions and improve marketing strategy. Used AWS for cloud computing.
Data Engineer
ZS Associates - 6 måneder
- Udviklet en pipeline til at konvertere data til et struktureret format, der gør det muligt at servere til Prodigy til ML-relateret tagging. Hele pipelinen blev konstrueret på en modulær måde ved hjælp af ren Python og shell-scripting.
- Implementerede datatransformationer i Python og lagrede de behandlede data i en Amazon S3-bucket til opbevaring og tilgængelighed.
Data Engineer
KnowledgeFoundry - 6 flere år 5 måneder
- Automatiseret processen med at skrive Hive-forespørgsler til ETL af flere tabeller (både engangs og inkrementelle) ved at generere automatiserede scripts.
- Læs CSV-filer fra mappeplaceringer, oprettede tabeller og udførte inkrementelle belastninger sekventielt.
- Opsætning af Snowflake som den primære lagringsløsning for strukturerede data og brug af DBT til ETL-processer. Udarbejdede SQL-baserede modeller til at definere transformationslogik og sikre fleksibilitet med inkrementel indlæsning og versionskontrol ved hjælp af DBT.
- Forberedte transformerede data til analyse ved hjælp af business intelligence-værktøjer, hvilket gjorde det lettere at finde frem til indsigter. Udførte regelmæssige kontroller i Snowflake og DBT for at opretholde dataintegritet og pipelinefunktionalitet.
- Designede og udviklede datapipelines til at udtrække, transformere og indlæse data fra forskellige kilder til et centraliseret datalager.
Teknologier:
- Teknologier:
Microsoft Power BI
Uddannelse
BSc.Information Technology
Dharmsinh Desai University · 2015 - 2019
Find din næste udvikler inden for få dage, ikke måneder
Book en 25-minutters samtale, hvor vi:
- udfører behovsafdækning med fokus på udviklingsopgaver
- Forklar vores proces, hvor vi matcher dig med kvalificerede, godkendte udviklere fra vores netværk
- beskriver de næste trin for at finde det perfekte match på få dage
