Arthur J.
Data Engineer
Dataingeniør med mer enn seks års erfaring innen Python, Apache Spark, Data Engineering, Apache Hive og ETL.
Arthur er en lidenskapelig og resultatfokusert dataingeniør med ti års erfaring med å utvikle solide og pålitelige datapipelines og BI-dashboards, og løser problemer gjennom data for internasjonale selskaper. Han har hovedsakelig jobbet med stamdata og maskinlæring.
Han har et strategisk tankesett fokusert på å forstå kontekst, teste hypoteser, trekke konklusjoner basert på fakta og etablere en datadrevet kultur med teammedlemmer. Arthur er analytisk og velorganisert med sterk teoretisk ingeniørfag og matematisk bakgrunn, og lærer raskt nye teknologier.
Han kan spille en viktig rolle gjennom engasjementets utviklings-/støttelivssyklus for å sikre kvalitetsløsninger.
Hovedekspertise
- Python 8 år
- Data Engineering 6 år
- Apache Spark 6 år
Andre kunnskaper
- Git 6 år
- Scrum 5 år
- Java 5 år
Utvalgt opplevelse
Arbeidserfaring
Dataingeniør
Thoughtworks - 1 year 9 months
- Datamigrering ved hjelp av Azure Data Factory - Databehandling ved hjelp av Apache Spark hos Databricks - Prosessautomatisering ved hjelp av Python.
Teknologier:
- Teknologier:
- Python
- Apache Spark
- ETL
- Databricks
- Scrum
- Azure Data Factory
DEN. Analytiker/dataingeniør
Grupo Pão de Açúcar - 1 year 5 months
- Data ETL fra Teradata DW ved å bruke Sqoop på Hive, Impala og Apache Kudu - Databehandling med Apache Spark 2 i et Hadoop-miljø - Vedlikehold av eldre systemer med Python, Shell Script (Bash) og Java.
Teknologier:
- Teknologier:
- Apache Spark
- ETL
- Bash
- Apache Hive
- Java
DEN. Analytiker/dataingeniør
Nextel (Stefanini IT Solutions contractor) - 3 months
- Last inn data fra PostgreSQL ved hjelp av Sqoop, Apache Spark 2 og Python 3 - Versjonsdata på en "øyeblikkblikkstabell" med Apache Spark 2.
Teknologier:
- Teknologier:
- Python
- Apache Spark
- ETL
- PostgreSQL
DEN. Analytiker/dataingeniør
Semantix - 1 year 1 month
- Dataanalyse ved hjelp av Hive og Impala (Cloudera-distribusjon) - Databehandling i Hadoop-miljøet - Utvikling av automatiseringsskript ved bruk av Python- og Shell-skript Resultat av IoT-engasjementer: - Sanntids batchbehandling ved hjelp av Apache Spark, Kafka og Elasticsearch.
Teknologier:
- Teknologier:
- Python
- Apache Spark
- ETL
- Shell
- Apache Hive
- Apache Kafka
- ElasticSearch
Utdannelse
BSc.Data- og informasjonsvitenskap (frafall)
Universidade Federal do ABC · 2015 - 2019
Finn din neste utvikler innen dager, ikke måneder
I løpet av en kort 25-minutters samtale ønsker vi å:
- Forstå dine utviklingsbehov
- Forklare prosessen vår der vi matcher deg med kvalifiserte, evaluerte utviklere fra vårt nettverk
- Dele de neste stegene for å finne riktig match, ofte på mindre enn en uke