Arthur J.
Data Engineer
Dataingeniør med over 6 års erfaring inden for Python, Apache Spark, Data Engineering, Apache Hive og ETL.
Arthur er en passioneret og resultatfokuseret dataingeniør med ti års erfaring med udvikling af robuste og pålidelige datapipelines og BI-dashboards samt databaseret problemløsning for internationale virksomheder. Han har primært arbejdet med big data og maskinlæring.
Han tænker strategisk og fokuserer på at forstå sammenhænge, teste hypoteser, drage faktabaserede konklusioner og etablere en datadrevet kultur med teammedlemmerne. Arthur er analytisk og velorganiseret og lærer hurtigt nye teknologier med en stærk teoretisk baggrund inden for teknologi og matematik.
Han kan spille en afgørende rolle med at sikre kvalitetsløsninger gennem hele engagementets livscyklus fra udvikling til support.
Hovedekspertise
- Python 8 år
- Data Engineering 6 år
- Apache Spark 6 år
Andre færdigheder
- Git 6 år
- Scrum 5 år
- Java 5 år
Udvalgt oplevelse
Beskæftigelse
Dataingeniør
Thoughtworks - 1 år 9 måneder
- Dataoverførsel med brug af Azure Data Factory. Databehandling med brug af Apache Spark hos Databricks. Procesautomatisering ved hjælp af Python.
Teknologier:
- Teknologier:
- Python
- Apache Spark
- ETL
- Databricks
- Scrum
- Azure Data Factory
DET. Analytiker/dataingeniør
Grupo Pão de Açúcar - 1 år 5 måneder
- Data-ETL fra Teradata-DW med brug af Sqoop på Hive, Impala og Apache Kudu. Databehandling med Apache Spark 2 i et Hadoop-miljø. Vedligeholdelse af ældre systemer med brug af Python, Shell Script (Bash) og Java.
Teknologier:
- Teknologier:
- Apache Spark
- ETL
- Bash
- Apache Hive
- Java
DET. Analytiker/dataingeniør
Nextel (Stefanini IT Solutions contractor) - 3 måneder
- Indlæsning af data fra PostgreSQL med Sqoop, Apache Spark 2 og Python 3. Versionsstyring af data i en "snapshot"-tabel med Apache Spark 2.
Teknologier:
- Teknologier:
- Python
- Apache Spark
- ETL
- PostgreSQL
DET. Analytiker/dataingeniør
Semantix - 1 år 1 måned
- Dataanalyse med brug af Hive og Impala (Cloudera-distribution). Databehandling i Hadoop-miljøet. Udvikling af automatiseringsscript med brug af Python og Shell script. Resultater fra IoT-engagementer. Batchbehandling i realtid med brug af Apache Spark, Kafka og Elasticsearch.
Teknologier:
- Teknologier:
- Python
- Apache Spark
- ETL
- Shell
- Apache Hive
- Apache Kafka
- ElasticSearch
Uddannelse
BSc.Computer- og informationsvidenskab (frafald)
Universidade Federal do ABC · 2015 - 2019
Find din næste udvikler inden for få dage, ikke måneder
Book en 25-minutters samtale, hvor vi:
- udfører behovsafdækning med fokus på udviklingsopgaver
- Forklar vores proces, hvor vi matcher dig med kvalificerede, godkendte udviklere fra vores netværk
- beskriver de næste trin for at finde det perfekte match på få dage