Himanshu S.
Data Engineer
Himanshu er en erfaren dataingeniør med lang erfaring og faglig kompetanse innen SQL, Snowflake og AWS. Han har jobbet i ulike bransjer, inkludert helse, detaljhandel, bil og finans.
I løpet av de siste fem årene har Himanshu finpusset ferdighetene sine, og posisjonert seg som en fullstack-datakonsulent med utgangspunkt i sin ekspertise innen både maskinlæring og datavitenskap.
I løpet av sitt tjenesteforhold hos KnowledgeFoundry og ZS Associates ga Himanshu betydelige bidrag til deres tekniske team. Hans mangfoldige ferdigheter og engasjement har etablert ham som en pålitelig utvikler innen datateknikk.
Hovedekspertise
- OpenCV 4 år
- Linux 5 år
- LangChain 2 år
Andre kunnskaper
- Docker 3 år
- FastAPI 2 år
- ChatGPT API 2 år
Utvalgt opplevelse
Arbeidserfaring
Data Engineer
InfoGain - 10 months
- Created a Data Warehouse solution utilizing AWS Redshift and AWS Glue, migrating an OLAP database from MS SQL Server.
- Established a DBT pipeline for ETL processes, transferring data between a MySQL warehouse and an activity database to a Neo4j graph database using native Python programming. The setup was implemented on an AWS Linux box with Neo4j running as a Docker container.
- Developed an ETL pipeline for conducting market basket analysis and other marketing statistics on millions of rows of transactional data. Utilized Redshift as a transactional database and populated it in a serverless fashion using Amazon Lambda functions in real time.
Teknologier:
- Teknologier:
- Python
- ETL
- Data Engineering
- AWS
Data Engineer
ZS Associates - 6 months
- Developed a pipeline to convert data into a structured format, enabling serving to Prodigy for ML-related tagging. The entire pipeline was constructed in a modular fashion using pure Python and shell scripting.
- Implemented data transformations in Python and stored the processed data in an Amazon S3 bucket for storage and accessibility.
Teknologier:
- Teknologier:
- Python
Data Engineer
KnowledgeFoundry - 5 years 5 months
- Automated the process of writing Hive queries for ETL of multiple tables (both one-time and incremental) by generating automated scripts.
- Read CSV files from folder locations and created tables, then performed incremental loads sequentially.
- Set up Snowflake as the primary storage solution for structured data and utilized DBT for ETL processes. Crafted SQL-based models to define transformation logic, ensuring flexibility with incremental loading and version control using DBT.
- Prepared transformed data for analysis using business intelligence tools, facilitating effortless insights discovery. Conducted regular checks in Snowflake and DBT to maintain data integrity and pipeline functionality.
- Designed and developed data pipelines to extract, transform, and load data from diverse sources into a centralized data warehouse.
Teknologier:
- Teknologier:
- ETL
- SQL
- Data Engineering
Utdannelse
BSc.Information Technology
Dharmsinh Desai University · 2015 - 2019
Finn din neste utvikler innen dager, ikke måneder
I løpet av en kort 25-minutters samtale ønsker vi å:
- Forstå dine utviklingsbehov
- Forklare prosessen vår der vi matcher deg med kvalifiserte, evaluerte utviklere fra vårt nettverk
- Dele de neste stegene for å finne riktig match, ofte på mindre enn en uke