Himanshu S.

Himanshu S.

Data Engineer

Germany
Vertrouwd lid sinds 2024
5 jaar ervaring

De afgelopen vijf jaar heeft Himanshu zijn vaardigheden aangescherpt en zich gepositioneerd als full-stack data consultant, dankzij zijn expertise in zowel machine learning als data science.

Tijdens zijn periode bij KnowledgeFoundry en ZS Associates heeft Himanshu belangrijke bijdragen geleverd aan hun technische teams. Dankzij zijn diverse skills en toewijding is hij een betrouwbare developer op het gebied van data-engineering.

Hoofd expertise

OpenCVOpenCV4 jaar
LinuxLinux5 jaar
LangChainLangChain2 jaar
Scikit-learnScikit-learn5 jaar
33+

Ervaring5

InfoGain

Data Engineer

InfoGain
Jun 2021 - Apr 2022 · 10m
  • Het creëren van een Data Warehouse oplossing met behulp van AWS Redshift en AWS Glue, waarbij een OLAP-database is gemigreerd vanuit MS SQL Server.
  • Het opzetten van een DBT pijplijn voor ETL processen, het overbrengen van gegevens tussen een MySQL magazijn en een activiteitendatabase naar een Neo4j grafiekdatabase met behulp van native Python programmering. De setup is geïmplementeerd op een AWS Linux box met Neo4j draaiend als een Docker container.
  • Ontwikkelde een ETL-pijplijn voor het uitvoeren van marktmandanalyses en andere marketingstatistieken op miljoenen rijen transactiegegevens. Redshift gebruiken als transactionele database en deze op een serverloze manier vullen met behulp van Amazon Lambda-functies in realtime.
InfoGain

Data Engineer Consultant

InfoGain
Information Technology (IT) and Services
Jun 2021 - Apr 2022 · 10m
  • Created a Data Warehouse solution utilizing AWS Redshift and AWS Glue, migrating an OLAP database from MSSQL Server.

  • Established a DBT pipeline for ETL processes, transferring data between MySQL warehouse and activity database to Neo4j graph database using native Python programming. Setup was implemented on an AWS Linux box with Neo4j running as a Docker container.

  • Developed an ETL pipeline for conducting market basket analysis and other marketing statistics on millions of rows of transactional data. Utilized Redshift as a transactional database and populated it in a serverless fashion using Amazon Lambda function in real-time.

Microsoft Power BIMicrosoft Power BI
Knowledge Foundry Business Solutions

Data Scientist

Knowledge Foundry Business Solutions
Information Technology (IT) and Services
May 2021 - Mar 2022 · 10m

Contributed in building Market Intelligence dashboard pipeline. Using unstructured review text, did a NER and relationship extraction to get Sentiment at entity level.

Trend forecasting and sentiment calculation to help businesses make better decisions and improve marketing strategy. Used AWS for cloud computing.

ZS Associates

Data Engineer

ZS Associates
Information Technology (IT) and Services
Oct 2020 - Apr 2021 · 6m
  • Ontwikkelde een pijplijn om gegevens om te zetten in een gestructureerd formaat, zodat ze kunnen worden aangeboden aan Prodigy voor ML-gerelateerde tagging. De hele pijplijn is modulair opgebouwd met puur Python en shell scripting.
  • Implementeerde gegevenstransformaties in Python en sloeg de verwerkte gegevens op in een Amazon S3 bucket voor opslag en toegankelijkheid.
KnowledgeFoundry

Data Engineer

KnowledgeFoundry
Data Analytics
Jun 2019 · 6y 9m
  • Geautomatiseerd schrijven van Hive queries voor ETL van meerdere tabellen (zowel eenmalig als incrementeel) door het genereren van geautomatiseerde scripts.
  • CSV-bestanden van maplocaties gelezen, tabellen gemaakt en incrementele ladingen sequentieel uitgevoerd.
  • Snowflake opgezet als de primaire opslagoplossing voor gestructureerde gegevens en DBT gebruikt voor ETL-processen. Maakte SQL-gebaseerde modellen om transformatielogica te definiëren en zorgde voor flexibiliteit met incrementeel laden en versiebeheer met behulp van DBT.
  • Voorbereiden van getransformeerde gegevens voor analyse met behulp van business intelligence tools, waardoor inzichten moeiteloos kunnen worden ontdekt. Voerde regelmatig controles uit in Snowflake en DBT om de gegevensintegriteit en pipeline-functionaliteit te behouden.
  • Ontwierp en ontwikkelde datapijplijnen voor het extraheren, transformeren en laden van gegevens uit verschillende bronnen in een gecentraliseerd datawarehouse.
Microsoft Power BIMicrosoft Power BI

Certificaten 1

Databricks Certified Machine Learning ProfessionalDatabricks, Inc.

Issued Jan 2025 - Expires Jan 2027
Credential ID 131562332

DatabricksDatabricks
Machine LearningMachine Learning
Databricks Certified Machine Learning ProfessionalDatabricks, Inc.

Issued Jan 2025 - Expires Jan 2027
Credential ID 131562332

DatabricksDatabricks
Machine LearningMachine Learning
Wil je meer weten over de certificeringen van Himanshu?Boek een gesprek

Educatie

Dharmsinh Desai University
Dharmsinh Desai University
Information Technology2015 - 2019

Stop met browsen.
Word sneller gekoppeld.