Himanshu S.

Data Engineer

Himanshu Surana ist ein erfahrener Data Engineer mit umfassender Erfahrung und professionellen Kenntnissen in SQL, Snowflake und AWS. Er war in verschiedenen Branchen tätig, unter anderem im Gesundheitswesen, im Einzelhandel, in der Automobilindustrie und im Finanzwesen.

In den letzten fünf Jahren hat Surana seine Fähigkeiten weiterentwickelt und sich dank seiner Expertise in den Bereichen maschinelles Lernen und Data Science als Full-Stack Data Consultant etabliert.

Während seiner Zeit bei KnowledgeFoundry und ZS Associates leistete Himanshu einen bedeutenden Beitrag zu den technischen Teams. Mit seinen vielfältigen Fähigkeiten und seinem Engagement gilt er als zuverlässiger Entwickler auf dem Gebiet des Data Engineering.

Hauptkompetenz

OpenCV 4 Jahre
Linux 5 Jahre
LangChain 2 Jahre

Andere Fähigkeiten

Docker 3 Jahre
FastAPI 2 Jahre
OpenAI API 2 Jahre

Himanshu S.

Germany

Erste Schritte

Ausgewählte Erfahrung

Beschäftigung

Data Engineer

InfoGain - 10 monate
- Erstellung einer Data Warehouse-Lösung unter Verwendung von AWS Redshift und AWS Glue, Migration einer OLAP-Datenbank von MS SQL Server.
- Einrichtung einer DBT-Pipeline für ETL-Prozesse, die Daten zwischen einem MySQL-Warehouse und einer Aktivitätsdatenbank in eine Neo4j-Graphdatenbank unter Verwendung nativer Python-Programmierung überträgt. Das Setup wurde auf einer AWS-Linux-Box implementiert, auf der Neo4j als Docker-Container läuft.
- Entwicklung einer ETL-Pipeline zur Durchführung von Warenkorb-Analysen und anderen Marketing-Statistiken auf Millionen von Zeilen mit Transaktionsdaten. Nutzt Redshift als transaktionale Datenbank und befüllt sie auf serverlose Weise mit Amazon Lambda-Funktionen in Echtzeit.
Data Engineer Consultant

InfoGain - 10 monate
- Created a Data Warehouse solution utilizing AWS Redshift and AWS Glue, migrating an OLAP database from MSSQL Server.
- Established a DBT pipeline for ETL processes, transferring data between MySQL warehouse and activity database to Neo4j graph database using native Python programming. Setup was implemented on an AWS Linux box with Neo4j running as a Docker container.
- Developed an ETL pipeline for conducting market basket analysis and other marketing statistics on millions of rows of transactional data. Utilized Redshift as a transactional database and populated it in a serverless fashion using Amazon Lambda function in real-time.
Technologien:
- Technologien:
- Microsoft Power BI
Data Scientist

Knowledge Foundry Business Solutions - 10 monate

Contributed in building Market Intelligence dashboard pipeline. Using unstructured review text, did a NER and relationship extraction to get Sentiment at entity level.

Trend forecasting and sentiment calculation to help businesses make better decisions and improve marketing strategy. Used AWS for cloud computing.
Data Engineer

ZS Associates - 6 monate
- Entwicklung einer Pipeline zur Konvertierung von Daten in ein strukturiertes Format, das die Weitergabe an Prodigy für ML-bezogenes Tagging ermöglicht. Die gesamte Pipeline wurde auf modulare Weise unter Verwendung von Python und Shell-Skripting aufgebaut.
- Implementierung von Datentransformationen in Python und Speicherung der verarbeiteten Daten in einem Amazon S3 Bucket zur Speicherung und Zugänglichkeit.
Data Engineer

KnowledgeFoundry - 6 jahre 10 monate
- Automatisierter Prozess des Schreibens von Hive-Abfragen für die ETL mehrerer Tabellen (sowohl einmalig als auch inkrementell) durch die Erstellung automatisierter Skripte.
- Lesen von CSV-Dateien aus Ordnerspeicherorten, Erstellen von Tabellen und sequentielles Laden.
- Einrichtung von Snowflake als primäre Speicherlösung für strukturierte Daten und Nutzung von DBT für ETL-Prozesse. Erstellung von SQL-basierten Modellen zur Definition der Transformationslogik, Gewährleistung von Flexibilität durch inkrementelles Laden und Versionskontrolle mit DBT.
- Bereitet transformierte Daten für die Analyse mit Business-Intelligence-Tools vor und erleichtert die mühelose Entdeckung von Erkenntnissen. Durchführung regelmäßiger Überprüfungen in Snowflake und DBT zur Aufrechterhaltung der Datenintegrität und Pipeline-Funktionalität.
- Entwurf und Entwicklung von Datenpipelines zum Extrahieren, Transformieren und Laden von Daten aus verschiedenen Quellen in ein zentralisiertes Data Warehouse.
Technologien:
- Technologien:
- Microsoft Power BI

Ausbildung

BSc.Information Technology

Dharmsinh Desai University · 2015 - 2019

Finden Sie Ihren nächsten Entwickler innerhalb von Tagen, nicht Monaten

In einem kurzen 25-minütigen Gespräch würden wir gerne:

Auf Ihren Bedarf bezüglich des Recruitments von Software-Entwicklern eingehen
Unseren Prozess vorstellen und somit wie wir Sie mit talentierten und geprüften Kandidaten aus unserem Netzwerk zusammenbringen können
Die nächsten Schritte besprechen, um den richtigen Kandidaten zu finden - oft in weniger als einer Woche

Data Engineer

Himanshu S.

Ausgewählte Erfahrung

Beschäftigung

Data Engineer

Data Engineer Consultant

Data Scientist

Data Engineer

Data Engineer

Ausbildung

BSc.Information Technology

Finden Sie Ihren nächsten Entwickler innerhalb von Tagen, nicht Monaten