Himanshu S.

Data Engineer

Germany

Verifiziertes Mitglied seit 2024

5 Jahre Erfahrung

In den letzten fünf Jahren hat Surana seine Fähigkeiten weiterentwickelt und sich dank seiner Expertise in den Bereichen maschinelles Lernen und Data Science als Full-Stack Data Consultant etabliert.

Während seiner Zeit bei KnowledgeFoundry und ZS Associates leistete Himanshu einen bedeutenden Beitrag zu den technischen Teams. Mit seinen vielfältigen Fähigkeiten und seinem Engagement gilt er als zuverlässiger Entwickler auf dem Gebiet des Data Engineering.

Hauptkompetenz

OpenCV4 Jahre

Linux5 Jahre

LangChain2 Jahre

Scikit-learn5 Jahre

33+

Erfahrung5

Data Engineer

InfoGain

Jun 2021 - Apr 2022 · 10M

Erstellung einer Data Warehouse-Lösung unter Verwendung von AWS Redshift und AWS Glue, Migration einer OLAP-Datenbank von MS SQL Server.
Einrichtung einer DBT-Pipeline für ETL-Prozesse, die Daten zwischen einem MySQL-Warehouse und einer Aktivitätsdatenbank in eine Neo4j-Graphdatenbank unter Verwendung nativer Python-Programmierung überträgt. Das Setup wurde auf einer AWS-Linux-Box implementiert, auf der Neo4j als Docker-Container läuft.
Entwicklung einer ETL-Pipeline zur Durchführung von Warenkorb-Analysen und anderen Marketing-Statistiken auf Millionen von Zeilen mit Transaktionsdaten. Nutzt Redshift als transaktionale Datenbank und befüllt sie auf serverlose Weise mit Amazon Lambda-Funktionen in Echtzeit.

Data Engineer Consultant

InfoGain•

Information Technology (IT) and Services

Jun 2021 - Apr 2022 · 10M

Created a Data Warehouse solution utilizing AWS Redshift and AWS Glue, migrating an OLAP database from MSSQL Server.
Established a DBT pipeline for ETL processes, transferring data between MySQL warehouse and activity database to Neo4j graph database using native Python programming. Setup was implemented on an AWS Linux box with Neo4j running as a Docker container.
Developed an ETL pipeline for conducting market basket analysis and other marketing statistics on millions of rows of transactional data. Utilized Redshift as a transactional database and populated it in a serverless fashion using Amazon Lambda function in real-time.

Microsoft Power BI

Data Scientist

Knowledge Foundry Business Solutions•

Information Technology (IT) and Services

May 2021 - Mar 2022 · 10M

Contributed in building Market Intelligence dashboard pipeline. Using unstructured review text, did a NER and relationship extraction to get Sentiment at entity level.

Trend forecasting and sentiment calculation to help businesses make better decisions and improve marketing strategy. Used AWS for cloud computing.

Data Engineer

ZS Associates•

Information Technology (IT) and Services

Oct 2020 - Apr 2021 · 6M

Entwicklung einer Pipeline zur Konvertierung von Daten in ein strukturiertes Format, das die Weitergabe an Prodigy für ML-bezogenes Tagging ermöglicht. Die gesamte Pipeline wurde auf modulare Weise unter Verwendung von Python und Shell-Skripting aufgebaut.
Implementierung von Datentransformationen in Python und Speicherung der verarbeiteten Daten in einem Amazon S3 Bucket zur Speicherung und Zugänglichkeit.

Data Engineer

KnowledgeFoundry•

Data Analytics

Jun 2019 · 7J 2M

Automatisierter Prozess des Schreibens von Hive-Abfragen für die ETL mehrerer Tabellen (sowohl einmalig als auch inkrementell) durch die Erstellung automatisierter Skripte.
Lesen von CSV-Dateien aus Ordnerspeicherorten, Erstellen von Tabellen und sequentielles Laden.
Einrichtung von Snowflake als primäre Speicherlösung für strukturierte Daten und Nutzung von DBT für ETL-Prozesse. Erstellung von SQL-basierten Modellen zur Definition der Transformationslogik, Gewährleistung von Flexibilität durch inkrementelles Laden und Versionskontrolle mit DBT.
Bereitet transformierte Daten für die Analyse mit Business-Intelligence-Tools vor und erleichtert die mühelose Entdeckung von Erkenntnissen. Durchführung regelmäßiger Überprüfungen in Snowflake und DBT zur Aufrechterhaltung der Datenintegrität und Pipeline-Funktionalität.
Entwurf und Entwicklung von Datenpipelines zum Extrahieren, Transformieren und Laden von Daten aus verschiedenen Quellen in ein zentralisiertes Data Warehouse.

Microsoft Power BI

Zertifikate 1

Databricks Certified Machine Learning ProfessionalDatabricks, Inc.

Issued Jan 2025 - Expires Jan 2027
Credential ID 131562332

Databricks

Machine Learning

Databricks Certified Machine Learning ProfessionalDatabricks, Inc.

Issued Jan 2025 - Expires Jan 2027
Credential ID 131562332

Databricks

Machine Learning

Möchten Sie mehr über die Zertifizierungen von Himanshu erfahren?Gespräch buchen

Ausbildung

Dharmsinh Desai University

Information Technology2015 - 2019

Hör auf zu stöbern.
Lass dich schneller matchen.

Sprechen Sie mit einem Experten und erhalten Sie innerhalb von nur 2 Tagen maßgeschneiderte Matches aus unserem Netzwerk.

Zugriff auf über 6.000+ Experten
Werden Sie im Durchschnitt in 2 Tagen mit einem Entwickler zusammengebracht
Schnell und einfach einstellen mit 94% Übereinstimmungserfolg

Gespräch buchen

Himanshu S.

Hauptkompetenz

Erfahrung5

Data Engineer

Data Engineer Consultant

Data Scientist

Data Engineer

Data Engineer

Zertifikate 1

Ausbildung

Hör auf zu stöbern. Lass dich schneller matchen.

Hör auf zu stöbern.
Lass dich schneller matchen.