Arthur J.

Arthur J.

Data Engineer

Brazil
Membre de confiance depuis 2022
8 années d'expérience

Arthur est un ingénieur data passionné et attaché aux résultats. Il possède dix ans d'expérience dans la mise au point de pipelines de données et de tableaux de bord BI solides et fiables, ainsi que dans la résolution de problèmes par les données pour des entreprises internationales. Il a principalement travaillé sur le Big data et l'apprentissage automatique.

Il a un état d'esprit stratégique axé sur la compréhension du contexte, la vérification des hypothèses, la formulation de conclusions fondées sur des faits et l'établissement d'une culture axée sur les données avec les membres de l'équipe. Analytique et bien organisé, avec une solide formation théorique en ingénierie et en mathématiques, Arthur apprend rapidement les nouvelles technologies.

Il peut jouer un rôle essentiel tout au long du cycle de vie de développement/support de la mission pour garantir des solutions de qualité.

Expertise principale

PythonPython8 ans
Data Engineering6 ans
Apache SparkApache Spark6 ans
ETLETL4 ans
5+

Expérience12

Python developer/Data Engineer

US-based clinical research company
Healthcare
Nov 2022 - Nov 2023 · 1y

Arthur's team was developing a POC to gather medical data from multiple partners and transform it into a research standard to make it available to their clients. In this project, Arthur built some tools to transform and ingest data using Python and Rust. They used an SQL Server as the database and started to develop scripts to run in Azure.

Thoughtworks

Ingénieur de données

Thoughtworks
Information Technology (IT) and Services
Nov 2020 - Aug 2022 · 1y 9m
  • Migration des données à l'aide d'Azure Data Factory. Traitement des données à l'aide d'Apache Spark chez Databricks. Automatisation des traitements à l'aide de Python .
Azure Data FactoryAzure Data Factory

IL. Analyste/Ingénieur de données

Grupo Pão de Açúcar
Jun 2019 - Nov 2020 · 1y 5m
  • ETL de données à partir de Teradata DW en utilisant Sqoop sur Hive, Impala, et Apache Kudu. Traitement de données avec Apache Spark 2 dans un environnement Hadoop. Maintenance des systèmes existants à l'aide de Python, Shell Script (Bash) et Java .

Data Engineer

Grupo Pão de Açúcar
Retail
Jun 2019 - Nov 2020 · 1y 5m
  • Data ETL from Teradata DW using Sqoop on Hive, Impala, and Apache Kudu. Data processing with Apache Spark 2 in a Hadoop environment. Maintenance of legacy systems using Python, Shell Script (Bash), and Java.

IL. Analyste/Ingénieur de données

Nextel (Stefanini IT Solutions contractor)
Mar 2019 - Jun 2019 · 3m
  • Charger des données depuis PostgreSQL en utilisant Sqoop, Apache Spark 2 et Python 3. Versionner des données sur une table « snapshot » avec Apache Spark 2.

Data Engineer

Nextel (Stefanini IT Solutions contractor)
Telecommunications
Mar 2019 - Jun 2019 · 3m
  • Load data from PostgreSQL using Sqoop, Apache Spark 2, and Python 3. Versioning data on a “snapshot” table with Apache Spark 2.

Data Engineer

Banco Santander (everis & BRQ contractor)
Banking and Finance
Jan 2018 - Oct 2018 · 9m
  • ETL and data processing in the Hadoop environment using Apache Spark to fill business reports
Semantix

IL. Analyste/Ingénieur de données

Semantix
Dec 2016 - Jan 2018 · 1y 1m
  • Analyse de données avec Hive et Impala (distribution Cloudera). Traitement des données dans l'environnement Hadoop. Développement de scripts d'automatisation à l'aide de Python et de script Shell. Résultat des engagements IdO. Traitement par lots en temps réel à l'aide d'Apache Spark, Kafka et Elasticsearch .
Semantix

Data Engineer

Semantix
Digital Marketing
Dec 2016 - Jan 2018 · 1y 1m
  • Data analysis using Hive and Impala (Cloudera distribution). Data processing in the Hadoop environment. automation scripts development using Python and Shell script. Result of IoT engagements. Real-time batch processing using Apache Spark, Kafka, and Elasticsearch.

Java Developer

Stefanini IT Solutions
Information Technology (IT) and Services
Dec 2015 - Jun 2016 · 6m
  • Maintenance and development using Hibernate, Git, Maven, Tomcat 7, Oracle 10g, and JSP.
MavenMaven
HibernateHibernate
OracleOracle
TomcatTomcat

IT Analyst

CVC Viagens
Travel and Tourism
Jan 2015 - Sep 2015 · 8m
  • Project migration from SVN to Git. Processes Standardization to engagement versioning with automatization using Python and Jenkins. Creation and maintenance of automated tests with Selenium, Python, and Testlink. Automatic monitoring with Python, Selenium, and Zabbix

Java Developer

MAPS Soluções e Serviços
Information Technology (IT) and Services
Feb 2012 - Dec 2014 · 2y 10m
  • Development of mission-critical Java web systems to financial institutions, e.g. Caixa Econômica Federal, with JBoss, Wicket, Hibernate, JUnit, Selenium, continuous integration with Jenkins and Scrum as agile philosophy.
HibernateHibernate

Certificats 3

Semantix
Cloudera Data Analyst Training: Using Pig, Hive, and Impala with HadoopSemantix
Semantix
Cloudera Developer Training for Spark & HadoopSemantix
Semantix
Cloudera Data Analyst Training: Using Pig, Hive, and Impala with HadoopSemantix
Souhaitez-vous en savoir plus sur les certifications de Arthur ?Planifier un appel

Éducation

FDT
Faculdade de Tecnologia de São Paulo
Analysis & Systems Development2022 - 2022
UFD
Universidade Federal do ABC
Informatique et sciences de l'information (abandon)2015 - 2019

Arrêtez de naviguer.
Soyez jumelé plus rapidement.