Himanshu S.
Data Engineer
Himanshu est un ingénieur données chevronné qui bénéficie d’une longue expérience et d’une excellente maîtrise de SQL, Snowflake et AWS. Il a travaillé dans différents secteurs, parmi lesquels la santé, le retail, l’industrie automobile et la finance.
Depuis cinq ans, Himanshu développe ses compétences et se positionne en tant que consultant en données full-stack, compte tenu de son expertise dans le machine learning et la data science.
Pendant son parcours chez Knowledge Foundry et ZS Associates, Himanshu a apporté des contributions notables aux équipes techniques. Ses compétences très variées et son implication font de lui un développeur fiable dans le domaine du data engineering.
Principale expertise
- OpenCV 4 ans
- Linux 5 ans
- LangChain 2 ans
Autres compétences
- Docker 3 ans
- FastAPI 2 ans
- ChatGPT API 2 ans
Expérience sélectionnée
Emploi
Data Engineer
InfoGain - 10 mois
- Created a Data Warehouse solution utilizing AWS Redshift and AWS Glue, migrating an OLAP database from MS SQL Server.
- Established a DBT pipeline for ETL processes, transferring data between a MySQL warehouse and an activity database to a Neo4j graph database using native Python programming. The setup was implemented on an AWS Linux box with Neo4j running as a Docker container.
- Developed an ETL pipeline for conducting market basket analysis and other marketing statistics on millions of rows of transactional data. Utilized Redshift as a transactional database and populated it in a serverless fashion using Amazon Lambda functions in real time.
Les technologies:
- Les technologies:
- Python
- ETL
- Data Engineering
- AWS
Data Engineer
ZS Associates - 6 mois
- Developed a pipeline to convert data into a structured format, enabling serving to Prodigy for ML-related tagging. The entire pipeline was constructed in a modular fashion using pure Python and shell scripting.
- Implemented data transformations in Python and stored the processed data in an Amazon S3 bucket for storage and accessibility.
Les technologies:
- Les technologies:
- Python
Data Engineer
KnowledgeFoundry - 5 années 5 mois
- Automated the process of writing Hive queries for ETL of multiple tables (both one-time and incremental) by generating automated scripts.
- Read CSV files from folder locations and created tables, then performed incremental loads sequentially.
- Set up Snowflake as the primary storage solution for structured data and utilized DBT for ETL processes. Crafted SQL-based models to define transformation logic, ensuring flexibility with incremental loading and version control using DBT.
- Prepared transformed data for analysis using business intelligence tools, facilitating effortless insights discovery. Conducted regular checks in Snowflake and DBT to maintain data integrity and pipeline functionality.
- Designed and developed data pipelines to extract, transform, and load data from diverse sources into a centralized data warehouse.
Les technologies:
- Les technologies:
- ETL
- SQL
- Data Engineering
Éducation
License ès sciencesInformation Technology
Dharmsinh Desai University · 2015 - 2019
Trouvez votre prochain développeur en quelques jours et non sur plusieurs mois
Dans un court appel de 25 minutes, nous voulons:
- Comprendre vos besoins en développement
- Vous expliquez comment nous allons vous mettre en relation avec le développeur le mieux qualifié pour votre projet, sélectionné avec soin
- Vous indiquez nos prochaines démarches afin de vous trouver le meilleur développeur, souvent en moins d'une semaine