Caio M.

Data Engineer

Caio on monipuolinen data-alan ammattilainen, jolla on yli viiden vuoden kokemus ohjelmisto- ja tietotekniikasta, datatieteestä ja analytiikasta.

Lisäksi Caio oli keskeisessä roolissa Nubankissa, jossa hän johti 200 ammattilaisen tiimiä ja ohjasi tietohallintoa ja kustannusvastaavuutta koskevaa aloitetta. Tämä aloite lisäsi huomattavasti projektiin ja tehtäviin liittyvien kustannusten avoimuutta, mikä hyödytti kaikkia tiimin jäseniä.

Accenturessa työskennellessään Caio osoitti poikkeuksellista omistautumista ja työskenteli ahkerasti GCP Data -ratkaisujen toteuttamiseksi asiakkaiden infrastruktuurissa. Tällä oli suuri vaikutus, sillä se virtaviivaisti merkittävästi tiedonkeruuprosessia eri lähteistä ja vähensi aiemmin manuaaliseen tiedonkeruuseen käytettyä aikaa.

Tärkein asiantuntemus

  • Python
    Python 6 vuotta
  • SQL
    SQL 6 vuotta
  • ETL
    ETL 5 vuotta

Muut taidot

  • OAuth2
    OAuth2 4 vuotta
  • GraphQL
    GraphQL 4 vuotta
  • PowerShell
    PowerShell 3 vuotta
Caio

Caio M.

Brazil

Aloita tästä

Valittu kokemus

Työllisyys

  • Data Engineer

    Proxify AB - 5 months

    • Working In Multiple Clients, providing Data Engineering & Analytics consultancy and development

    • Automating Web Page Navigation and Scraping using Playwright and BeautifulSoup

    • Providing Data Analytics and Data Modelling solutions with multiple frameworks

    • Implementing ETL jobs to integrate data from different sources into Data Warehouses or Data Lakes

    Tekniikat:

    • Tekniikat:
    • HTML HTML
    • Azure Blob storage Azure Blob storage
    • TensorFlow TensorFlow
    • NumPy NumPy
    • OpenCV OpenCV
    • XGBoost XGBoost
    • Keras Keras
    • Pandas Pandas
    • Open source Open source
    • LaTeX LaTeX
    • PyCharm PyCharm
    • BigQuery BigQuery
    • CSV
    • OAuth2 OAuth2
    • Command-line interface
    • Unix Unix
    • VSCode VSCode
    • SciPy SciPy
    • Scikit-learn Scikit-learn
    • ELT
    • Matplotlib Matplotlib
    • Data Analytics
    • Azure Synapse Azure Synapse
    • Recurrent neural network
    • PL/SQL PL/SQL
    • XML XML
    • NLP
    • Machine Learning Machine Learning
    • BeautifulSoup BeautifulSoup
    • SQLAlchemy SQLAlchemy
    • Tableau Tableau
    • Plotly Plotly
    • Dimensional modeling
    • Fact Data Modeling
    • Redshift Redshift
    • dbt dbt
    • Prompt Engineering
    • LangChain LangChain
    • Looker Looker
  • Data Engineer

    Nubank - 3 years 5 months

    • Uudisti sosiaalisen median tiedonkeruuarkkitehtuurin ja lyhensi laskenta-aikaa ja -kustannuksia yli 90 prosenttia.
    • Johti tietohallintoa ja kustannusvastaavuutta koskevaa aloitetta 200-henkisessä tiimissä parantaen hankkeisiin ja tehtäviin liittyvien kustannusten näkyvyyttä.
  • Analytics Engineer

    Nubank - 3 years 5 months

    • Spearheaded the reformulation of social media data collection architecture, achieving a remarkable reduction of computing time and costs by over 90%;

    • Integrated a new pipeline with the company’s data lake, enabling universal access to Social Media datasets and fostering collaboration;

    • Led a Data Governance and Cost Accountability initiative within a team of 200 members, enhancing transparency and providing visibility into costs associated with projects and tasks;

    • Delivering meaningful data and insights empowered the team to concentrate on content analytics and performance, facilitating informed decision-making and optimizing workflow efficiency.

    Tekniikat:

    • Tekniikat:
    • HTML HTML
    • Scala Scala
    • Azure Blob storage Azure Blob storage
    • Data Science
    • Azure Data Factory Azure Data Factory
    • TensorFlow TensorFlow
    • NumPy NumPy
    • OpenCV OpenCV
    • XGBoost XGBoost
    • Keras Keras
    • Pandas Pandas
    • ClojureScript ClojureScript
    • R (programming language) R (programming language)
    • Open source Open source
    • LaTeX LaTeX
    • PyTorch PyTorch
    • PyCharm PyCharm
    • BigQuery BigQuery
    • CSV
    • OAuth2 OAuth2
    • Command-line interface
    • Unix Unix
    • VSCode VSCode
    • SciPy SciPy
    • Scikit-learn Scikit-learn
    • ELT
    • Matplotlib Matplotlib
    • Data Analytics
    • Azure Synapse Azure Synapse
    • Random Forest Random Forest
    • PCA
    • Convolutional neural network Convolutional neural network
    • Recurrent neural network
    • PL/SQL PL/SQL
    • XML XML
    • NLP
    • Machine Learning Machine Learning
    • Cuda Cuda
    • BeautifulSoup BeautifulSoup
    • SQLAlchemy SQLAlchemy
    • Tableau Tableau
    • Clojure Clojure
    • Plotly Plotly
    • Dimensional modeling
    • Fact Data Modeling
    • Redshift Redshift
    • dbt dbt
    • Prompt Engineering
    • LangChain LangChain
    • Looker Looker
    • Dataflow Dataflow
  • Data Engineer

    ClearSale - 1 year 2 months

    • Auttoi uuden biometriatuotteen skaalaamisessa määrittelemällä suorituskykymittareita ja seuraamalla sovelluksen käyttäytymistä.
    • Tunnisti tiedonkeruun puutteet, mikä mahdollisti reaaliaikaisen tietoisuuden ongelmista tiimissä.
    • Asiakkaiden hyväksyntä kymmenkertaistui, ja kuukausittain saapuvien pyyntöjen määrä nousi muutamasta tuhannesta miljooniin.
  • Product Intelligence

    ClearSale - 1 year 2 months

    • Played a key role in scaling up a new Biometry product by defining metrics for performance evaluation and monitoring the application’s behavior;

    • Identified gaps in data collection processes, enabling the team to address issues in near real-time and enhance overall data quality;

    • Collaborated with Product and Sales teams to reformulate the sales pitch, emphasizing improvements driven by data insights;

    • Successfully contributed to a tenfold increase in client adoption and a significant surge in monthly incoming requests, from a few thousands to millions, showcasing the product's enhanced value proposition.

    Tekniikat:

    • Tekniikat:
    • HTML HTML
    • Oracle Oracle
    • Scala Scala
    • Azure Blob storage Azure Blob storage
    • Data Science
    • Azure Data Factory Azure Data Factory
    • TensorFlow TensorFlow
    • NumPy NumPy
    • OpenCV OpenCV
    • XGBoost XGBoost
    • Keras Keras
    • Pandas Pandas
    • R (programming language) R (programming language)
    • Open source Open source
    • LaTeX LaTeX
    • PyCharm PyCharm
    • BigQuery BigQuery
    • CSV
    • OAuth2 OAuth2
    • Command-line interface
    • Unix Unix
    • VSCode VSCode
    • SciPy SciPy
    • Scikit-learn Scikit-learn
    • ELT
    • Matplotlib Matplotlib
    • Data Analytics
    • Azure Synapse Azure Synapse
    • Random Forest Random Forest
    • PCA
    • Convolutional neural network Convolutional neural network
    • Recurrent neural network
    • PL/SQL PL/SQL
    • XML XML
    • NLP
    • Machine Learning Machine Learning
    • Computer Vision
    • Cuda Cuda
    • BeautifulSoup BeautifulSoup
    • SQLAlchemy SQLAlchemy
    • Tableau Tableau
    • Plotly Plotly
    • Dimensional modeling
    • Fact Data Modeling
    • Redshift Redshift
    • Looker Looker
    • Dataflow Dataflow
  • Data Engineer

    Accenture Brazil - 5 months

    • Työskenteli GCP Data -ratkaisujen toteuttamiseksi asiakkaiden infrastruktuurissa.
    • Kehitti ratkaisun tietojen keräämiseksi yli 10 tietolähteestä tietovaraston luomiseksi, mikä säästi tietojen manuaaliseen keräämiseen käytettyä aikaa.
    • Auttoi vähentämään ulkopuolisista lähteistä aiheutuvia kustannuksia 50 prosenttia käyttämällä raakadataa oman Data Vizin kehittämiseen ja irtisanomalla tarpeettomia analytiikkasopimuksia.
  • Data & AI

    Accenture Brazil - 5 months

    • Contributed to the implementation of GCP Data solutions on clients’ infrastructure, enhancing data management capabilities and optimizing workflow efficiency;

    • Designed and implemented a solution to aggregate data from over 10 sources to establish a centralized Data Warehouse, significantly reducing manual data collection efforts and streamlining data processing workflows;

    • Played a key role in cost reduction initiatives by leveraging raw data to develop in-house Data Visualization tools, resulting in a 50% reduction in costs associated with third-party sources and the cancellation of redundant Analytics contracts.

    Tekniikat:

    • Tekniikat:
    • Oracle Oracle
    • Azure Blob storage Azure Blob storage
    • Data Science
    • Azure Data Factory Azure Data Factory
    • TensorFlow TensorFlow
    • NumPy NumPy
    • OpenCV OpenCV
    • Keras Keras
    • Pandas Pandas
    • Open source Open source
    • LaTeX LaTeX
    • PyTorch PyTorch
    • PyCharm PyCharm
    • BigQuery BigQuery
    • CSV
    • OAuth2 OAuth2
    • Command-line interface
    • Unix Unix
    • VSCode VSCode
    • SciPy SciPy
    • Scikit-learn Scikit-learn
    • ELT
    • Matplotlib Matplotlib
    • Data Analytics
    • Azure Synapse Azure Synapse
    • Random Forest Random Forest
    • PCA
    • Convolutional neural network Convolutional neural network
    • PL/SQL PL/SQL
    • NLP
    • Machine Learning Machine Learning
    • Computer Vision
    • Cuda Cuda
    • BeautifulSoup BeautifulSoup
    • SQLAlchemy SQLAlchemy
    • Tableau Tableau
    • Plotly Plotly
    • Dimensional modeling
    • Fact Data Modeling
    • Redshift Redshift
    • Talend Talend
    • Looker Looker
    • Dataflow Dataflow
  • Data Scientist

    Netshoes Brazil - 11 months

    • Collaborated closely with the Marketing department to optimize the targeting of advertisements and mail campaigns to customers, enhancing their effectiveness;

    • Conceptualized and implemented a source of truth dataset for Customers’ data, leading to an increase in the frequency of model training and improving overall data quality;

    • Leveraged more up-to-date analysis to drive a daily increase of R$50k in gross income by refining the targeting of mailings and advertisements, thereby maximizing revenue generation efforts.

    Tekniikat:

    • Tekniikat:
    • Oracle Oracle
    • Azure Blob storage Azure Blob storage
    • Data Science
    • Azure Data Factory Azure Data Factory
    • TensorFlow TensorFlow
    • NumPy NumPy
    • OpenCV OpenCV
    • Keras Keras
    • Pandas Pandas
    • R (programming language) R (programming language)
    • Open source Open source
    • LaTeX LaTeX
    • PyTorch PyTorch
    • PyCharm PyCharm
    • BigQuery BigQuery
    • CSV
    • OAuth2 OAuth2
    • Command-line interface
    • Unix Unix
    • SciPy SciPy
    • Scikit-learn Scikit-learn
    • ELT
    • Matplotlib Matplotlib
    • Data Analytics
    • Azure Synapse Azure Synapse
    • Random Forest Random Forest
    • PCA
    • Convolutional neural network Convolutional neural network
    • Recurrent neural network
    • PL/SQL PL/SQL
    • Machine Learning Machine Learning
    • Computer Vision
    • SQLAlchemy SQLAlchemy
    • Plotly Plotly
    • Dimensional modeling
    • Fact Data Modeling
    • Talend Talend
  • Presales Architect

    T-Systems Brazil - 2 months

    • Assisted in managing the team by providing insights to understand the team's performance, facilitating informed decision-making and strategic planning;

    • Developed visualizations to analyze and identify clients requiring more attention, enabling proactive engagement and relationship management;

    • Utilized gathered insights to optimize resource allocation and prioritize efforts towards proposals with higher success probabilities, resulting in improved efficiency and effectiveness in client interactions.

    Tekniikat:

    • Tekniikat:
    • NumPy NumPy
    • Pandas Pandas
    • R (programming language) R (programming language)
    • Open source Open source
    • LaTeX LaTeX
    • PyCharm PyCharm
    • BigQuery BigQuery
    • CSV
    • Unix Unix
    • SciPy SciPy
    • Scikit-learn Scikit-learn
    • Matplotlib Matplotlib
    • Data Analytics
    • PL/SQL PL/SQL

Koulutus

  • BSc.Tietojärjestelmä

    USP - São Paulon yliopisto · 2017 - 2020

Löydä seuraava kehittäjäsi päivien, ei kuukausien sisällä

Kun otat yhteyttä, järjestämme lyhyen 25 minuuttia kestävän tapaamisen, jonka aikana:

  • Kartoitamme yrityksenne kehitystarvetta
  • Kertoa prosessimme, jolla löydämme teille pätevän, ennakkotarkastetun kehittäjän verkostostamme
  • Käymme läpi askeleet, joilla oikea ehdokas pääsee aloittamaan – useimmiten viikon sisällä

Keskustele kanssamme