NYHET
Proxify ger dig full insyn i utvecklarnas prestationer – ett branschunikt erbjudande som är varje CTO:s dröm.
Läs mer
Himanshu S.
Data Engineer
Himanshu är en Data Engineer med gedigen erfarenhet och hög kompetens inom SQL, Snowflake och AWS. Han har arbetat inom flera olika branscher, däribland hälsovård, detaljhandel, fordonsindustrin och finans.
Under de senaste fem åren har Himanshu finslipat sina färdigheter och etablerat sig som en Full-stack Data Consultant med djupgående expertis inom både maskininlärning och data science.
Under sin tid på KnowledgeFoundry och ZS Associates gjorde Himanshu betydande bidrag till de tekniska teamen på båda företagen. Hans omfattande kompetens och starka engagemang har etablerat honom som en pålitlig och respekterad utvecklare inom data engineering.
Huvudsaklig expertis
- OpenCV 4 år
- Linux 5 år

- LangChain 2 år
Andra kompetenser
- Docker 3 år
- FastAPI 2 år
- OpenAI API 2 år
Utvald erfarenhet
Anställningar
Data Engineer
InfoGain - 10 månader
- Skapade en Data Warehouse-lösning med hjälp av AWS Redshift och AWS Glue och migrerade en OLAP-databas från MS SQL Server.
- Etablerade en DBT-pipeline för ETL-processer, överförde data mellan ett MySQL-lager och en aktivitetsdatabas till en Neo4j-grafdatabas med hjälp av inbyggd Python-programmering. Installationen genomfördes på en AWS Linux-box med Neo4j som kördes som en Docker-container.
- Utvecklade en ETL-pipeline för att genomföra marknadskorgsanalys och annan marknadsföringsstatistik på miljontals rader med transaktionsdata. Använde Redshift som en transaktionsdatabas och fyllde den på ett serverlöst sätt med hjälp av Amazon Lambda-funktioner i realtid.
Data Engineer Consultant
InfoGain - 10 månader
-
Created a Data Warehouse solution utilizing AWS Redshift and AWS Glue, migrating an OLAP database from MSSQL Server.
-
Established a DBT pipeline for ETL processes, transferring data between MySQL warehouse and activity database to Neo4j graph database using native Python programming. Setup was implemented on an AWS Linux box with Neo4j running as a Docker container.
-
Developed an ETL pipeline for conducting market basket analysis and other marketing statistics on millions of rows of transactional data. Utilized Redshift as a transactional database and populated it in a serverless fashion using Amazon Lambda function in real-time.
Teknologier:
- Teknologier:
Microsoft Power BI
-
Data Scientist
Knowledge Foundry Business Solutions - 10 månader
Contributed in building Market Intelligence dashboard pipeline. Using unstructured review text, did a NER and relationship extraction to get Sentiment at entity level.
Trend forecasting and sentiment calculation to help businesses make better decisions and improve marketing strategy. Used AWS for cloud computing.
Data Engineer
ZS Associates - 6 månader
- Utvecklat en pipeline för att konvertera data till ett strukturerat format, vilket möjliggör servering till Prodigy för ML-relaterad taggning. Hela pipelinen konstruerades på ett modulärt sätt med hjälp av ren Python och shell-skript.
- Implementerade datatransformationer i Python och lagrade den bearbetade datan i en Amazon S3-bucket för lagring och tillgänglighet.
Data Engineer
KnowledgeFoundry - 6 år 5 månader
- Automatiserad process för att skriva Hive-frågor för ETL av flera tabeller (både engångs- och inkrementella) genom att generera automatiserade skript.
- Läste CSV-filer från mappplatser, skapade tabeller och utförde inkrementella belastningar sekventiellt.
- Ställde in Snowflake som den primära lagringslösningen för strukturerad data och använde DBT för ETL-processer. Skapade SQL-baserade modeller för att definiera transformationslogik, vilket säkerställde flexibilitet med inkrementell laddning och versionskontroll med DBT.
- Förberedde transformerade data för analys med hjälp av business intelligence-verktyg, vilket underlättade upptäckt av insikter utan ansträngning. Genomförde regelbundna kontroller i Snowflake och DBT för att upprätthålla dataintegritet och pipelinefunktionalitet.
- Utformade och utvecklade datapipelines för att extrahera, transformera och ladda data från olika källor till ett centraliserat datalager.
Teknologier:
- Teknologier:
Microsoft Power BI
Utbildning
BSc.Information Technology
Dharmsinh Desai University · 2015 - 2019
Hitta din nästa utvecklare inom ett par dagar
Ge oss 25 minuter av din tid, så kommer vi att:
- Sätta oss in i dina utmaningar och behov
- Berätta om våra seniora och beprövade utvecklare
- Förklara hur vi kan matcha dig med precis rätt utvecklare
