Isac D.

Data Scientist

Isac is a highly skilled Data Scientist and Software Engineer with over five years of experience in the field. His expertise spans from feature engineering to model deployment, demonstrating a comprehensive understanding of the entire data science pipeline.

He is proficient in building microservices using FastAPI and Python to support AI systems for manufacturer defect detection. Isac has gained experience across a variety of industries, including house flipping, fintech, and manufacturing. One of his notable achievements is developing a system for automating processes at a major US-based Big Tech company using machine learning techniques. This system helps managers grant access to internal applications and optimizes response times.

In addition to his professional accomplishments, Isac won a machine learning hackathon in November 2018, securing first place. His diverse industry experience and technical proficiency make him a valuable asset in developing and implementing advanced AI solutions.

Principale expertise

  • Data Analytics 3 ans
  • Data Science 5 ans
  • NumPy
    NumPy 5 ans

Autres compétences

  • PostgreSQL
    PostgreSQL 3 ans
  • RabbitMQ
    RabbitMQ 3 ans
  • Docker
    Docker 3 ans
Isac

Isac D.

Brazil

Commencer

Expérience sélectionnée

Emploi

  • Data Scientist

    Unimed Hospital - 1 an 11 mois

    • Developed a fraud detection system for client documents at Hospital Unimed using Python and Vertex AI, enabling automated classification of personal records and enhancing accuracy in fraud prevention.

    • Designed and delivered a Proof of Concept (PoC) for an AI-powered assistant to support psychologists during therapy sessions.

    • Built pipelines to process and transcribe audio using Whisper and Pyannote, including speaker diarization for precise session analysis.

    • Applied LLMs with Map-Reduce and RAG techniques to extract insights, detect emotions, and identify Cognitive Behavioral Therapy (CBT) elements from therapy transcripts.

    • Implemented advanced audio denoising and source separation (DSS) techniques to significantly improve transcription quality by removing background noise.

    • Generated structured reports and comprehensive summaries by combining LLM-driven summarization with map-reduce frameworks, effectively addressing context length limitations in large models.

    • Developed interactive dashboards using Python, Plotly, Seaborn, and Dash to visualize insights and statistics from therapy sessions, including the recurrence of emotions, frequent cognitive distortions, and other key behavioral metrics.

    Les technologies:

    • Les technologies:
    • Docker Docker
    • PostgreSQL PostgreSQL
    • Flask Flask
    • Python Python
    • Data Science
    • Google Cloud Google Cloud
    • Firebase Firebase
    • Pandas Pandas
    • BigQuery BigQuery
    • Matplotlib Matplotlib
    • Machine Learning Machine Learning
    • FastAPI FastAPI
    • Plotly Plotly
    • LangChain LangChain
    • Large Language Models (LLM) Large Language Models (LLM)
    • Vertex AI Vertex AI
    • Hugging Face Hugging Face
    • Seaborn Seaborn
    • Dash Dash
  • Data Scientist

    Vitatech Electromagnetics LLC - 8 mois

    • Création de graphiques interactifs représentant l'amplitude en fonction du temps, le temps filtré et l'amplitude en fonction de la fréquence (FFT) à l'aide de Plotly, facilitant l'analyse approfondie des signaux.
    • Filtres numériques AC/DC conçus pour réduire le bruit, optimisant la précision de la détection EMI à l'aide de Scipy.
    • Mise en œuvre d'un processus de décimation pour gérer efficacement les signaux EM de grande taille.
    • Analyse du traitement des signaux à l'aide de Pandas et Numpy.

    Les technologies:

    • Les technologies:
    • Flask Flask
    • NumPy NumPy
    • Pandas Pandas
    • SciPy SciPy
    • Matplotlib Matplotlib
    • Streamlit Streamlit
    • Plotly Plotly
  • Product Engineer

    Mariner-USA - 1 an 9 mois

    • J'ai collaboré avec l'équipe technique en utilisant GitHub pour améliorer un système de détection des défauts conçu pour les clients de l'industrie manufacturière.
    • Implémentation de microservices utilisant FastAPI, Flask, et gRPC pour traiter de grandes images (10k x 8k pixels) et les appliquer dans des modèles d'apprentissage profond.
    • Création d'un package Python qui utilise une API tierce pour rationaliser le processus d'annotation.
    • Mise en œuvre de tests unitaires et d'intégration à l'aide de Docker et de Python afin d'améliorer la qualité du code livré.

    Les technologies:

    • Les technologies:
    • Flask Flask
    • Azure Blob storage Azure Blob storage
    • NumPy NumPy
    • gRPC gRPC
  • Machine Learning Researcher

    Insight Data Science Lab - 10 mois

    • La recherche visait à combiner les techniques de tenseur avec les prévisions de séries temporelles pour la prédiction des itinéraires des véhicules suspects à l'aide de données de capteurs.

    Les technologies:

    • Les technologies:
    • TensorFlow TensorFlow
    • NumPy NumPy
    • SciPy SciPy
  • Data Scientist

    On-site vendor in a FAANG company - 2 années 3 mois

    • Création d'un moteur de recommandation utilisant des modèles d'apprentissage automatique avec une option de rejet sur des ensembles de données fortement déséquilibrés. Les tâches comprenaient la visualisation des données, la programmation Python, le nettoyage/traitement des données, l'ingénierie et la sélection des caractéristiques, l'entraînement et l'évaluation des modèles, l'analyse des données et l'ETL des données à l'aide de Python ;
    • Vous avez effectué de l'ingénierie de fonctionnalité sur des ensembles de données hautement déséquilibrés provenant de diverses sources de données telles que AWS S3, PostgreSQL, MySQL, et Cassandra ;
    • Vous avez géré l'ensemble du cycle de la science des données, de l'ingénierie des fonctionnalités au déploiement des modèles ;
    • Nous avons construit un système de recommandation pour aider les cadres supérieurs à prendre des décisions en matière de contrôle d'accès aux biens virtuels ;
    • Création, évaluation, déploiement et maintenance de modèles d'apprentissage automatique sous forme de services web ;
    • Mise en œuvre de techniques visant à optimiser les modèles, y compris l'ingénierie et la sélection des caractéristiques, la détection de la redondance, la détection des valeurs aberrantes, le suréchantillonnage et le sous-échantillonnage, l'étalonnage du modèle et la détection de la dérive des ensembles de données ;
    • J'ai conçu des pipelines de données en utilisant Python pour traiter les données financières et migrer les données entre les systèmes.

    Les technologies:

    • Les technologies:
    • Cassandra Cassandra
    • Flask Flask
    • TensorFlow TensorFlow
    • NumPy NumPy
    • Pandas Pandas
    • Scikit-learn Scikit-learn
    • Matplotlib Matplotlib
    • Machine Learning Machine Learning
    • Plotly Plotly

Éducation

  • Maîtrise ès sciencesTeleinformatic Engineering

    Federal University of Ceará · 2022 - 2024

  • License ès sciencesTelecommunication Engineering

    Federal University of Ceará (UFC) · 2013 - 2018

Trouvez votre prochain développeur en quelques jours et non sur plusieurs mois

Dans un court appel de 25 minutes, nous voulons:

  • Comprendre vos besoins en développement
  • Vous expliquez comment nous allons vous mettre en relation avec le développeur le mieux qualifié pour votre projet, sélectionné avec soin
  • Vous indiquez nos prochaines démarches afin de vous trouver le meilleur développeur, souvent en moins d'une semaine

Contactez-nous