NEU
Proxify is bringing transparency to tech team performance based on research conducted at Stanford. An industry first, built for engineering leaders.
Learn more
Caio M.
Data Engineer
Caio Moreira ist ein vielseitiger Datenprofi mit mehr als fünf Jahren Erfahrung in den Bereichen Software und Data Engineering, Data Science und Analytics.
Darüber hinaus hatte Moreira bei Nubank eine zentrale Position inne, in der er ein Team von 200 Fachleuten leitete und die Initiative zu Data-Governance und Cost Accountability leitete. Diese Initiative verbesserte die Transparenz der Projekt- und Aufgabenkosten erheblich, wovon alle beteiligten Teammitglieder profitierten.
Während seiner Zeit bei Accenture legte Moreira ein außergewöhnliches Engagement an den Tag, da er unermüdlich an der Implementierung von GCP-Datenlösungen innerhalb der Kundschaftsinfrastruktur arbeitete. Seine Bemühungen wirkten sich stark auf die Optimierung der Datenerhebung aus verschiedenen Quellen aus und verkürzte die Zeit, die zuvor für die manuelle Datensammlung aufgewandt wurde.
Hauptkompetenz
- Python 6 Jahre

- SQL 6 Jahre

- ETL 5 Jahre

Andere Fähigkeiten
- OAuth2 4 Jahre

- GraphQL 4 Jahre

- PowerShell 3 Jahre

Ausgewählte Erfahrung
Beschäftigung
Data Engineer
Proxify AB - 5 monate
-
Working In Multiple Clients, providing Data Engineering & Analytics consultancy and development
-
Automating Web Page Navigation and Scraping using Playwright and BeautifulSoup
-
Providing Data Analytics and Data Modelling solutions with multiple frameworks
-
Implementing ETL jobs to integrate data from different sources into Data Warehouses or Data Lakes
Technologien:
- Technologien:
HTML
Azure Blob storage
TensorFlow
NumPy
OpenCV
XGBoost
Keras
Pandas
Open source
LaTeX
PyCharm
BigQuery
- CSV
OAuth2
- Command-line interface
Unix
VSCode
SciPy
Scikit-learn
- ELT
Matplotlib
- Data Analytics
Azure Synapse
- Recurrent neural network
PL/SQL
XML
- NLP
Machine Learning
BeautifulSoup
SQLAlchemy
Tableau
Plotly
- Dimensional modeling
- Fact Data Modeling
Redshift
dbt
- Prompt Engineering
LangChain
Looker
-
Data Engineer
Nubank - 3 jahre 5 monate
- Neugestaltung der Architektur für die Datenerfassung aus sozialen Medien, was zu einer Senkung der Rechenzeit und der Kosten um über 90 % führte
- Leitung einer Initiative für Data Governance und Cost Accountability in einem Team von 200 Mitarbeitenden mit dem Ziel, die Kostentransparenz bei Projekten und Aufgaben zu verbessern
Analytics Engineer
Nubank - 3 jahre 5 monate
-
Spearheaded the reformulation of social media data collection architecture, achieving a remarkable reduction of computing time and costs by over 90%;
-
Integrated a new pipeline with the company’s data lake, enabling universal access to Social Media datasets and fostering collaboration;
-
Led a Data Governance and Cost Accountability initiative within a team of 200 members, enhancing transparency and providing visibility into costs associated with projects and tasks;
-
Delivering meaningful data and insights empowered the team to concentrate on content analytics and performance, facilitating informed decision-making and optimizing workflow efficiency.
Technologien:
- Technologien:
HTML
Scala
Azure Blob storage
- Data Science
Azure Data Factory
TensorFlow
NumPy
OpenCV
XGBoost
Keras
Pandas
ClojureScript
R (programming language)
Open source
LaTeX
PyTorch
PyCharm
BigQuery
- CSV
OAuth2
- Command-line interface
Unix
VSCode
SciPy
Scikit-learn
- ELT
Matplotlib
- Data Analytics
Azure Synapse
Random Forest
- PCA
Convolutional neural network
- Recurrent neural network
PL/SQL
XML
- NLP
Machine Learning
Cuda
BeautifulSoup
SQLAlchemy
Tableau
Clojure
Plotly
- Dimensional modeling
- Fact Data Modeling
Redshift
dbt
- Prompt Engineering
LangChain
Looker
Dataflow
-
Data Engineer
ClearSale - 1 jahr 2 monate
- Unterstützung bei der Skalierung eines neuen Biometrieprodukts durch Festlegung von Leistungskennzahlen und Überwachung des Anwendungsverhaltens
- Identifizierung von Lücken in der Datenerfassung, um das Team für Probleme in Echtzeit zu sensibilisieren
- Verzehnfachung der Akzeptanz durch die Kundschaft, wobei die monatlich eingehenden Anfragen von einigen tausend auf Millionen anstiegen
Product Intelligence
ClearSale - 1 jahr 2 monate
-
Played a key role in scaling up a new Biometry product by defining metrics for performance evaluation and monitoring the application’s behavior;
-
Identified gaps in data collection processes, enabling the team to address issues in near real-time and enhance overall data quality;
-
Collaborated with Product and Sales teams to reformulate the sales pitch, emphasizing improvements driven by data insights;
-
Successfully contributed to a tenfold increase in client adoption and a significant surge in monthly incoming requests, from a few thousands to millions, showcasing the product's enhanced value proposition.
Technologien:
- Technologien:
HTML
Oracle
Scala
Azure Blob storage
- Data Science
Azure Data Factory
TensorFlow
NumPy
OpenCV
XGBoost
Keras
Pandas
R (programming language)
Open source
LaTeX
PyCharm
BigQuery
- CSV
OAuth2
- Command-line interface
Unix
VSCode
SciPy
Scikit-learn
- ELT
Matplotlib
- Data Analytics
Azure Synapse
Random Forest
- PCA
Convolutional neural network
- Recurrent neural network
PL/SQL
XML
- NLP
Machine Learning
- Computer Vision
Cuda
BeautifulSoup
SQLAlchemy
Tableau
Plotly
- Dimensional modeling
- Fact Data Modeling
Redshift
Looker
Dataflow
-
Data Engineer
Accenture Brazil - 5 monate
- Einsatz für die Implementierung von GCP-Datenlösungen in der Infrastruktur der Kundschaft
- Entwicklung einer Lösung zur Datenerfassung aus über zehn Datenquellen zur Erstellung eines Data Warehouses, um Zeit bei der manuellen Datenerfassung zu sparen
- Mitwirkung an der Verringerung der Kosten für externe Quellen um 50 % durch Verwendung der Rohdaten zur Entwicklung unseres eigenen Data Viz und Kündigung überflüssiger Analyseverträge
Data & AI
Accenture Brazil - 5 monate
-
Contributed to the implementation of GCP Data solutions on clients’ infrastructure, enhancing data management capabilities and optimizing workflow efficiency;
-
Designed and implemented a solution to aggregate data from over 10 sources to establish a centralized Data Warehouse, significantly reducing manual data collection efforts and streamlining data processing workflows;
-
Played a key role in cost reduction initiatives by leveraging raw data to develop in-house Data Visualization tools, resulting in a 50% reduction in costs associated with third-party sources and the cancellation of redundant Analytics contracts.
Technologien:
- Technologien:
Oracle
Azure Blob storage
- Data Science
Azure Data Factory
TensorFlow
NumPy
OpenCV
Keras
Pandas
Open source
LaTeX
PyTorch
PyCharm
BigQuery
- CSV
OAuth2
- Command-line interface
Unix
VSCode
SciPy
Scikit-learn
- ELT
Matplotlib
- Data Analytics
Azure Synapse
Random Forest
- PCA
Convolutional neural network
PL/SQL
- NLP
Machine Learning
- Computer Vision
Cuda
BeautifulSoup
SQLAlchemy
Tableau
Plotly
- Dimensional modeling
- Fact Data Modeling
Redshift
Talend
Looker
Dataflow
-
Data Scientist
Netshoes Brazil - 11 monate
-
Collaborated closely with the Marketing department to optimize the targeting of advertisements and mail campaigns to customers, enhancing their effectiveness;
-
Conceptualized and implemented a source of truth dataset for Customers’ data, leading to an increase in the frequency of model training and improving overall data quality;
-
Leveraged more up-to-date analysis to drive a daily increase of R$50k in gross income by refining the targeting of mailings and advertisements, thereby maximizing revenue generation efforts.
Technologien:
- Technologien:
Oracle
Azure Blob storage
- Data Science
Azure Data Factory
TensorFlow
NumPy
OpenCV
Keras
Pandas
R (programming language)
Open source
LaTeX
PyTorch
PyCharm
BigQuery
- CSV
OAuth2
- Command-line interface
Unix
SciPy
Scikit-learn
- ELT
Matplotlib
- Data Analytics
Azure Synapse
Random Forest
- PCA
Convolutional neural network
- Recurrent neural network
PL/SQL
Machine Learning
- Computer Vision
SQLAlchemy
Plotly
- Dimensional modeling
- Fact Data Modeling
Talend
-
Presales Architect
T-Systems Brazil - 2 monate
-
Assisted in managing the team by providing insights to understand the team's performance, facilitating informed decision-making and strategic planning;
-
Developed visualizations to analyze and identify clients requiring more attention, enabling proactive engagement and relationship management;
-
Utilized gathered insights to optimize resource allocation and prioritize efforts towards proposals with higher success probabilities, resulting in improved efficiency and effectiveness in client interactions.
Technologien:
- Technologien:
NumPy
Pandas
R (programming language)
Open source
LaTeX
PyCharm
BigQuery
- CSV
Unix
SciPy
Scikit-learn
Matplotlib
- Data Analytics
PL/SQL
-
Ausbildung
BSc.Informationssysteme
USP – Universität von São Paulo · 2017 - 2020
Finden Sie Ihren nächsten Entwickler innerhalb von Tagen, nicht Monaten
In einem kurzen 25-minütigen Gespräch würden wir gerne:
- Auf Ihren Bedarf bezüglich des Recruitments von Software-Entwicklern eingehen
- Unseren Prozess vorstellen und somit wie wir Sie mit talentierten und geprüften Kandidaten aus unserem Netzwerk zusammenbringen können
- Die nächsten Schritte besprechen, um den richtigen Kandidaten zu finden - oft in weniger als einer Woche
