Felipe A.

Data Scientist

Felipe est un Data Scientist hautement qualifié avec plus de sept ans d'expérience dans les secteurs fintech, proptech, edtech et en conseil. Il combine une solide expertise technique en apprentissage automatique avec la capacité de communiquer efficacement des concepts complexes aux parties prenantes.

Sa maîtrise technique comprend le travail avec des outils avancés de Data Science et d'apprentissage automatique tels que Snowflake, dbt, Airflow et MLflow. Un moment fort de sa carrière a été son rôle à l'Université de Cambridge, où il a développé et enseigné un cours avancé en ligne sur la science des données, mettant en valeur à la fois son expertise sur le sujet et sa capacité à simplifier des sujets complexes. De plus, chez Outra, il a joué un rôle clé dans l'obtention d'un contrat de plusieurs millions de dollars avec Zoopla.

La combinaison unique de profonde connaissance technique et de fortes compétences en communication de Felipe en fait un professionnel hors pair dans le domaine de la science des données.

Principale expertise

  • Pytest
    Pytest 2 ans
  • AWS
    AWS 3 ans
  • Bash
    Bash 4 ans

Autres compétences

  • Agile
    Agile 4 ans
  • PyTorch
    PyTorch 2 ans
  • Asana
    Asana 1 ans
Felipe

Felipe A.

United Kingdom

Commencer

Expérience sélectionnée

Emploi

  • Data Scientist

    Rylee - 1 an

    • A travaillé chez Rylee, une plateforme de commerce électronique qui fournissait aux clients des informations sur les produits et des analyses de marché pour améliorer les stratégies sur Bol.com et Amazon.
    • A obtenu la certification Databricks en IA Générative, démontrant son expertise avec les modèles RAG et Agent.
    • A développé un modèle de prévision des ventes à grande échelle en utilisant les données internes de Rylee et les données récupérées de Bol.com pour prédire les ventes de produits et identifier les meilleures ventes.
    • A construit une API avec Flask et AWS Lambda pour gérer les requêtes de produits, livrant des insights et des prévisions de ventes.
    • A conçu et mis en œuvre des pipelines ETL utilisant dbt, Airflow et Spark pour automatiser l'ingénierie des fonctionnalités, y compris une solution asynchrone pour la récupération efficace des données de l'API Bol.com tout en respectant les limites de fréquence et en parallélisant à grande échelle ; a également automatisé la réconciliation des données entre plusieurs vendeurs.
    • A appliqué PyTorch et Spark pour optimiser des modèles de machine learning haute performance.

    Les technologies:

    • Les technologies:
    • MySQL MySQL
    • AWS AWS
    • Databricks Databricks
    • Apache Spark Apache Spark
    • Django Django
    • Flask Flask
    • Python Python
    • SQL SQL
    • Data Science
    • Digital Ocean Digital Ocean
    • TensorFlow TensorFlow
    • NumPy NumPy
    • XGBoost XGBoost
    • Pandas Pandas
    • Data Engineering
    • Scrum Scrum
    • Git Git
    • Scikit-learn Scikit-learn
    • ELT
    • Data Analytics
    • Random Forest Random Forest
    • Clustering
    • SVM
    • PCA
    • Convolutional neural network Convolutional neural network
    • Transformer Network
    • Data Modeling
    • ETL ETL
    • NLP
    • Machine Learning Machine Learning
    • FastAPI FastAPI
    • OpenAI API OpenAI API
    • Prompt Engineering
    • Large Language Models (LLM) Large Language Models (LLM)
    • Hugging Face Transformers Hugging Face Transformers
    • MLflow
    • Pipeline optimization
  • Data Scientist

    Homemove - 3 mois

    • A travaillé chez Homemove, une plateforme complète offrant des services liés au déménagement, y compris des enquêtes, des déménagements et des hypothèques, intégrés dans une seule application.
    • A développé un outil de négociation alimenté par LLM qui permettait aux utilisateurs d'obtenir des devis et de négocier des prix via un chatbot IA, ajoutant automatiquement les clients au CRM, et alertant l'équipe de vente dès qu'une négociation réussie avait eu lieu, utilisant OpenAI Assistant et les modèles GPT.
    • A dirigé une initiative de transformation des données évolutives, tirant parti de Snowflake pour le stockage de données cloud et Sigma pour le BI et la visualisation.
    • A conçu et mis en œuvre des pipelines ETL depuis zéro en utilisant Snowflake, Python, SQL, dbt et Airflow pour automatiser l'ingestion et la transformation des données.
    • A construit une solution de modélisation prédictive pour réduire les coûts de marketing et améliorer le ciblage en identifiant les déménageurs à fort potentiel.
    • A appliqué PyTorch et Snowpark pour l'apprentissage automatique avancé afin d'optimiser des modèles haute performance.
    • A livré un modèle prédictif qui était prévu pour être utilisé dans l'attraction d'investissements lors du financement de la Série A de Homemove.

    Les technologies:

    • Les technologies:
    • MySQL MySQL
    • AWS AWS
    • ElasticSearch ElasticSearch
    • Databricks Databricks
    • Apache Spark Apache Spark
    • Django Django
    • Flask Flask
    • Python Python
    • SQL SQL
    • AWS Lambda AWS Lambda
    • AWS S3 AWS S3
    • Data Science
    • Regression testing
    • Digital Ocean Digital Ocean
    • TensorFlow TensorFlow
    • NumPy NumPy
    • XGBoost XGBoost
    • Keras Keras
    • Pandas Pandas
    • Data Engineering
    • PyTorch PyTorch
    • PyCharm PyCharm
    • Scrum Scrum
    • Git Git
    • SciPy SciPy
    • Scikit-learn Scikit-learn
    • ELT
    • Matplotlib Matplotlib
    • Data Analytics
    • Random Forest Random Forest
    • Clustering
    • SVM
    • PCA
    • Convolutional neural network Convolutional neural network
    • Recurrent neural network
    • Transformer Network
    • Snowflake Snowflake
    • Data Modeling
    • ETL ETL
    • NLP
    • Machine Learning Machine Learning
    • FastAPI FastAPI
    • SQLAlchemy SQLAlchemy
    • Streamlit Streamlit
    • Pytest Pytest
    • Plotly Plotly
    • OpenAI API OpenAI API
    • Prompt Engineering
    • Large Language Models (LLM) Large Language Models (LLM)
    • Vertex AI Vertex AI
    • Pinecone Pinecone
    • Hugging Face Transformers Hugging Face Transformers
    • MLflow
    • Pipeline optimization
  • Data Science Instructor and Course Developer

    Cambridge University & FourthRev - 8 mois

    • A travaillé en tant que spécialiste en science des données chez FourthRev, créant et enseignant un cours avancé en ligne sur la science des données pour les étudiants de l'Université de Cambridge.
    • A développé et fourni un programme complet couvrant les réseaux neuronaux, le NLP pour l'IA, l'apprentissage non supervisé et des algorithmes avancés d'arbres de décision, y compris XGBoost.
    • A appliqué une mise en œuvre pratique de l'apprentissage automatique depuis zéro et a employé des méthodes d'enseignement innovantes pour améliorer l'engagement des étudiants et les résultats d'apprentissage.
    • A démontré une expertise technique approfondie en science des données et en apprentissage automatique, earning recognition from academic peers for effective teaching and curriculum design.

    Les technologies:

    • Les technologies:
    • Data Science
    • NumPy NumPy
    • XGBoost XGBoost
    • Pandas Pandas
    • Scikit-learn Scikit-learn
    • Matplotlib Matplotlib
    • Machine Learning Machine Learning
    • Pytest Pytest
    • Plotly Plotly
    • Neural Network
  • Senior Data Scientist

    Outra - 2 années

    • A travaillé chez Outra, une entreprise de visibilité immobilière pilotée par les données, spécialisée dans la fourniture de données au niveau des ménages pour optimiser les services aux clients.
    • A migré la plateforme de Dataiku vers un Intelligence Fabric personnalisé en interne en utilisant MLflow, Airflow, Snowflake, GitHub Actions, AWS et DBT pour l'ingénierie des données.
    • A développé deux principaux modèles prédictifs prévoyant les délais de mise en vente et de location de ménages, permettant un partenariat de plusieurs millions de livres avec Zoopla.
    • A appliqué des LLMs pour la documentation de code, l'assistance au codage, et des chatbots interactifs pour les tableaux de bord et les données orientées client.
    • A construit des pipelines ETL/ELT pour transformer des données brutes et les préparer pour la modélisation.
    • A créé des visualisations et des cartes en utilisant KeplerGI, Seaborn et Dataiku pour aider les utilisateurs non techniques à interpréter des données complexes.

    Les technologies:

    • Les technologies:
    • AWS AWS
    • Apache Spark Apache Spark
    • Django Django
    • Flask Flask
    • Python Python
    • SQL SQL
    • AWS Lambda AWS Lambda
    • AWS S3 AWS S3
    • Data Science
    • TensorFlow TensorFlow
    • NumPy NumPy
    • XGBoost XGBoost
    • Keras Keras
    • Pandas Pandas
    • Data Engineering
    • PyTorch PyTorch
    • Scrum Scrum
    • Git Git
    • Scikit-learn Scikit-learn
    • ELT
    • Apache Airflow Apache Airflow
    • Matplotlib Matplotlib
    • Data Analytics
    • Random Forest Random Forest
    • Clustering
    • SVM
    • PCA
    • Convolutional neural network Convolutional neural network
    • Recurrent neural network
    • Transformer Network
    • Snowflake Snowflake
    • Data Modeling
    • ETL ETL
    • NLP
    • Machine Learning Machine Learning
    • AWS EC2 AWS EC2
    • FastAPI FastAPI
    • SQLAlchemy SQLAlchemy
    • Streamlit Streamlit
    • Pytest Pytest
    • Plotly Plotly
    • dbt dbt
    • OpenAI API OpenAI API
    • Prompt Engineering
    • Neural Network
    • Large Language Models (LLM) Large Language Models (LLM)
    • Vertex AI Vertex AI
    • Dataiku Dataiku
    • Hugging Face Transformers Hugging Face Transformers
    • MLflow
    • Pipeline optimization
  • Data Scientist

    Belmont Green - 2 années 6 mois

    • A travaillé chez Belmont Green, une société spécialisée dans le prêt hypothécaire devenue banque, offrant des solutions financières et hypothécaires aux clients financièrement affectés.
    • A créé un modèle de conversion utilisant des techniques d'analyse de survie et a géré le projet de l'inception à la production.
    • A construit des algorithmes d'apprentissage automatique et des modèles statistiques pour les données de séries temporelles, en mettant l'accent sur la rétention, la valeur à vie et les modèles de pertes attendues.
    • A pris possession des projets de bout en bout, garantissant que les preuves de concept étaient mises en œuvre et déployées avec succès en production.
    • A mis en œuvre des algorithmes d'apprentissage automatique pour les flux de trésorerie, les remboursements anticipés, les défauts, les modèles de pré-paiement et de conversion en utilisant Python et R.
    • A appliqué des techniques de segmentation et de clustering pour analyser l'utilisation des produits et le comportement des clients à des fins de marketing et de stratégie.

    Les technologies:

    • Les technologies:
    • Data Science
    • NumPy NumPy
    • XGBoost XGBoost
    • Keras Keras
    • Pandas Pandas
    • PyTorch PyTorch
    • Scikit-learn Scikit-learn
    • Matplotlib Matplotlib
    • Machine Learning Machine Learning
    • SQLAlchemy SQLAlchemy
    • Plotly Plotly
    • Neural Network
  • Data Scientist

    Boster.AI - 2 années

    • Boster.Ai is a company dedicated to create No-code bots for data retrieval, monitoring and automation. Originally, they started as an IT consultancy company, creating personalized solutions to small and mid-size companies to harvest the power of Machine Learning

    • Felipe worked performing data exploration, analysis, and building Machine Learning algorithms and statistical models for several start-ups/mid-size companies in the UK and USA.

    • He built and diagnostic Neural Networks models for forecasting key performance indicators using Python, TensorFlow, and Keras.

    • Worked in e-commerce businesses solving customer behaviour problems such as lifetime value, clustering of customers, etc.

    • Performed ethical web scraping using Python with scraPy, RoboBrowser, and BeautifulSoup to obtain data for various analyses.

    Les technologies:

    • Les technologies:
    • Data Science
    • TensorFlow TensorFlow
    • NumPy NumPy
    • Keras Keras
    • Pandas Pandas
    • Scikit-learn Scikit-learn
    • Matplotlib Matplotlib
    • Machine Learning Machine Learning
    • Plotly Plotly

Éducation

  • FormationMachine Learning Specialization

    Stanford University · 2023 - 2023

  • FormationMachine Learning

    Massachusetts Institute of Technology · 2021 - 2022

  • License ès sciencesBusiness Management with maths

    Kingston University · 2013 - 2016

  • License ès sciencesCivil Engineering

    Adolfo Ibanez University · 2011 - 2013

Trouvez votre prochain développeur en quelques jours et non sur plusieurs mois

Dans un court appel de 25 minutes, nous voulons:

  • Comprendre vos besoins en développement
  • Vous expliquez comment nous allons vous mettre en relation avec le développeur le mieux qualifié pour votre projet, sélectionné avec soin
  • Vous indiquez nos prochaines démarches afin de vous trouver le meilleur développeur, souvent en moins d'une semaine

Contactez-nous