NEW
Proxify is bringing transparency to tech team performance based on research conducted at Stanford. An industry first, built for engineering leaders.
Learn more
Isac D.
Data Scientist
Isac is a highly skilled Data Scientist and Software Engineer with over five years of experience in the field. His expertise spans from feature engineering to model deployment, demonstrating a comprehensive understanding of the entire data science pipeline.
He is proficient in building microservices using FastAPI and Python to support AI systems for manufacturer defect detection. Isac has gained experience across a variety of industries, including house flipping, fintech, and manufacturing. One of his notable achievements is developing a system for automating processes at a major US-based Big Tech company using machine learning techniques. This system helps managers grant access to internal applications and optimizes response times.
In addition to his professional accomplishments, Isac won a machine learning hackathon in November 2018, securing first place. His diverse industry experience and technical proficiency make him a valuable asset in developing and implementing advanced AI solutions.
Principale expertise
- Data Analytics 3 ans
- Data Science 5 ans
- NumPy 5 ans
Autres compétences
- PostgreSQL 3 ans

- RabbitMQ 3 ans

- Docker 3 ans
Expérience sélectionnée
Emploi
Data Scientist
Unimed Hospital - 1 an 11 mois
-
Developed a fraud detection system for client documents at Hospital Unimed using Python and Vertex AI, enabling automated classification of personal records and enhancing accuracy in fraud prevention.
-
Designed and delivered a Proof of Concept (PoC) for an AI-powered assistant to support psychologists during therapy sessions.
-
Built pipelines to process and transcribe audio using Whisper and Pyannote, including speaker diarization for precise session analysis.
-
Applied LLMs with Map-Reduce and RAG techniques to extract insights, detect emotions, and identify Cognitive Behavioral Therapy (CBT) elements from therapy transcripts.
-
Implemented advanced audio denoising and source separation (DSS) techniques to significantly improve transcription quality by removing background noise.
-
Generated structured reports and comprehensive summaries by combining LLM-driven summarization with map-reduce frameworks, effectively addressing context length limitations in large models.
-
Developed interactive dashboards using Python, Plotly, Seaborn, and Dash to visualize insights and statistics from therapy sessions, including the recurrence of emotions, frequent cognitive distortions, and other key behavioral metrics.
Les technologies:
- Les technologies:
Docker
PostgreSQL
Flask
Python
- Data Science
Google Cloud
Firebase
Pandas
BigQuery
Matplotlib
Machine Learning
FastAPI
Plotly
LangChain
Large Language Models (LLM)
Vertex AI
Hugging Face
Seaborn
Dash
-
Data Scientist
Vitatech Electromagnetics LLC - 8 mois
- Création de graphiques interactifs représentant l'amplitude en fonction du temps, le temps filtré et l'amplitude en fonction de la fréquence (FFT) à l'aide de Plotly, facilitant l'analyse approfondie des signaux.
- Filtres numériques AC/DC conçus pour réduire le bruit, optimisant la précision de la détection EMI à l'aide de Scipy.
- Mise en œuvre d'un processus de décimation pour gérer efficacement les signaux EM de grande taille.
- Analyse du traitement des signaux à l'aide de Pandas et Numpy.
Les technologies:
- Les technologies:
Flask
NumPy
Pandas
SciPy
Matplotlib
Streamlit
Plotly
Product Engineer
Mariner-USA - 1 an 9 mois
- J'ai collaboré avec l'équipe technique en utilisant GitHub pour améliorer un système de détection des défauts conçu pour les clients de l'industrie manufacturière.
- Implémentation de microservices utilisant FastAPI, Flask, et gRPC pour traiter de grandes images (10k x 8k pixels) et les appliquer dans des modèles d'apprentissage profond.
- Création d'un package Python qui utilise une API tierce pour rationaliser le processus d'annotation.
- Mise en œuvre de tests unitaires et d'intégration à l'aide de Docker et de Python afin d'améliorer la qualité du code livré.
Les technologies:
- Les technologies:
Flask
Azure Blob storage
NumPy
gRPC
Machine Learning Researcher
Insight Data Science Lab - 10 mois
- La recherche visait à combiner les techniques de tenseur avec les prévisions de séries temporelles pour la prédiction des itinéraires des véhicules suspects à l'aide de données de capteurs.
Les technologies:
- Les technologies:
TensorFlow
NumPy
SciPy
Data Scientist
On-site vendor in a FAANG company - 2 années 3 mois
- Création d'un moteur de recommandation utilisant des modèles d'apprentissage automatique avec une option de rejet sur des ensembles de données fortement déséquilibrés. Les tâches comprenaient la visualisation des données, la programmation Python, le nettoyage/traitement des données, l'ingénierie et la sélection des caractéristiques, l'entraînement et l'évaluation des modèles, l'analyse des données et l'ETL des données à l'aide de Python ;
- Vous avez effectué de l'ingénierie de fonctionnalité sur des ensembles de données hautement déséquilibrés provenant de diverses sources de données telles que AWS S3, PostgreSQL, MySQL, et Cassandra ;
- Vous avez géré l'ensemble du cycle de la science des données, de l'ingénierie des fonctionnalités au déploiement des modèles ;
- Nous avons construit un système de recommandation pour aider les cadres supérieurs à prendre des décisions en matière de contrôle d'accès aux biens virtuels ;
- Création, évaluation, déploiement et maintenance de modèles d'apprentissage automatique sous forme de services web ;
- Mise en œuvre de techniques visant à optimiser les modèles, y compris l'ingénierie et la sélection des caractéristiques, la détection de la redondance, la détection des valeurs aberrantes, le suréchantillonnage et le sous-échantillonnage, l'étalonnage du modèle et la détection de la dérive des ensembles de données ;
- J'ai conçu des pipelines de données en utilisant Python pour traiter les données financières et migrer les données entre les systèmes.
Les technologies:
- Les technologies:
Cassandra
Flask
TensorFlow
NumPy
Pandas
Scikit-learn
Matplotlib
Machine Learning
Plotly
Éducation
Maîtrise ès sciencesTeleinformatic Engineering
Federal University of Ceará · 2022 - 2024
License ès sciencesTelecommunication Engineering
Federal University of Ceará (UFC) · 2013 - 2018
Trouvez votre prochain développeur en quelques jours et non sur plusieurs mois
Dans un court appel de 25 minutes, nous voulons:
- Comprendre vos besoins en développement
- Vous expliquez comment nous allons vous mettre en relation avec le développeur le mieux qualifié pour votre projet, sélectionné avec soin
- Vous indiquez nos prochaines démarches afin de vous trouver le meilleur développeur, souvent en moins d'une semaine
