Isac D.

Data Scientist

Isac is a highly skilled Data Scientist and Software Engineer with over five years of experience in the field. His expertise spans from feature engineering to model deployment, demonstrating a comprehensive understanding of the entire data science pipeline.

He is proficient in building microservices using FastAPI and Python to support AI systems for manufacturer defect detection. Isac has gained experience across a variety of industries, including house flipping, fintech, and manufacturing. One of his notable achievements is developing a system for automating processes at a major US-based Big Tech company using machine learning techniques. This system helps managers grant access to internal applications and optimizes response times.

In addition to his professional accomplishments, Isac won a machine learning hackathon in November 2018, securing first place. His diverse industry experience and technical proficiency make him a valuable asset in developing and implementing advanced AI solutions.

Hoofd expertise

  • Data Analytics 3 jaar
  • Data Science 5 jaar
  • NumPy
    NumPy 5 jaar

Andere vaardigheden

  • PostgreSQL
    PostgreSQL 3 jaar
  • RabbitMQ
    RabbitMQ 3 jaar
  • Docker
    Docker 3 jaar
Isac

Isac D.

Brazil

Aan de slag

Geselecteerde ervaring

Dienstverband

  • Data Scientist

    Unimed Hospital - 1 jaar 11 maanden

    • Developed a fraud detection system for client documents at Hospital Unimed using Python and Vertex AI, enabling automated classification of personal records and enhancing accuracy in fraud prevention.

    • Designed and delivered a Proof of Concept (PoC) for an AI-powered assistant to support psychologists during therapy sessions.

    • Built pipelines to process and transcribe audio using Whisper and Pyannote, including speaker diarization for precise session analysis.

    • Applied LLMs with Map-Reduce and RAG techniques to extract insights, detect emotions, and identify Cognitive Behavioral Therapy (CBT) elements from therapy transcripts.

    • Implemented advanced audio denoising and source separation (DSS) techniques to significantly improve transcription quality by removing background noise.

    • Generated structured reports and comprehensive summaries by combining LLM-driven summarization with map-reduce frameworks, effectively addressing context length limitations in large models.

    • Developed interactive dashboards using Python, Plotly, Seaborn, and Dash to visualize insights and statistics from therapy sessions, including the recurrence of emotions, frequent cognitive distortions, and other key behavioral metrics.

    Technologieën:

    • Technologieën:
    • Docker Docker
    • PostgreSQL PostgreSQL
    • Flask Flask
    • Python Python
    • Data Science
    • Google Cloud Google Cloud
    • Firebase Firebase
    • Pandas Pandas
    • BigQuery BigQuery
    • Matplotlib Matplotlib
    • Machine Learning Machine Learning
    • FastAPI FastAPI
    • Plotly Plotly
    • LangChain LangChain
    • Large Language Models (LLM) Large Language Models (LLM)
    • Vertex AI Vertex AI
    • Hugging Face Hugging Face
    • Seaborn Seaborn
    • Dash Dash
  • Data Scientist

    Vitatech Electromagnetics LLC - 8 maanden

    • Maakte interactieve grafieken met amplitude versus tijd, gefilterde tijd en amplitude versus frequentie (FFT) met behulp van Plotly, om diepgaande signaalanalyse mogelijk te maken.
    • Ontworpen digitale AC/DC-filters om ruis te verminderen en de nauwkeurigheid van EMI-detectie met behulp van Scipy te optimaliseren.
    • Een decimeringsproces geïmplementeerd om grote EM-signalen effectief te beheren.
    • Signaalverwerkingsanalyse uitgevoerd met Pandas en Numpy.

    Technologieën:

    • Technologieën:
    • Flask Flask
    • NumPy NumPy
    • Pandas Pandas
    • SciPy SciPy
    • Matplotlib Matplotlib
    • Streamlit Streamlit
    • Plotly Plotly
  • Product Engineer

    Mariner-USA - 1 jaar 9 maanden

    • Samengewerkt met het technische team met behulp van GitHub om een defectdetectiesysteem te verbeteren dat is ontworpen voor klanten in de productiesector.
    • Implementeerde microservices met behulp van FastAPI, Flask en gRPC om grote (10k x 8k pixel) afbeeldingen te verwerken en toe te passen in deep learning modellen.
    • Python-pakket gemaakt dat gebruikmaakte van een API van derden om het annotatieproces te stroomlijnen.
    • Implementeerde unit- en integratietests met behulp van Docker en Python om de kwaliteit van de geleverde code te verbeteren.

    Technologieën:

    • Technologieën:
    • Flask Flask
    • Azure Blob storage Azure Blob storage
    • NumPy NumPy
    • gRPC gRPC
  • Machine Learning Researcher

    Insight Data Science Lab - 10 maanden

    • Het onderzoek was gericht op het combineren van tensortechnieken met tijdreeksvoorspellingen voor routevoorspelling van verdachte voertuigen met behulp van sensordata.

    Technologieën:

    • Technologieën:
    • TensorFlow TensorFlow
    • NumPy NumPy
    • SciPy SciPy
  • Data Scientist

    On-site vendor in a FAANG company - 2 jaar 3 maanden

    • Een aanbevelingsmachine gemaakt met behulp van machine-learningmodellen met een afwijzingsoptie voor zeer onevenwichtige datasets. De taken omvatten datavisualisatie, Python-programmering, opschonen/verwerken van data, feature engineering en selectie, modeltraining en -evaluatie, data-analyse en data ETL met behulp van Python;
    • Je hebt feature engineering uitgevoerd op zeer onevenwichtige datasets uit verschillende databronnen zoals AWS S3, PostgreSQL, MySQL en Cassandra;
    • Behandelde de volledige data science-cyclus, van feature engineering tot modelimplementatie;
    • Bouwde een aanbevelingssysteem om het hoger management te helpen bij het nemen van beslissingen over toegangscontrole tot virtuele activa;
    • Het maken, evalueren, implementeren en onderhouden van machine learning-modellen als webservices;
    • Technieken geïmplementeerd om modellen te optimaliseren, waaronder feature engineering en selectie, redundantie detectie, outlier detectie, over- en ondersampling, model kalibratie en dataset drift detectie;
    • Ontwierp datapijplijnen met Python om financiële gegevens te verwerken en gegevens te migreren tussen systemen.

    Technologieën:

    • Technologieën:
    • Cassandra Cassandra
    • Flask Flask
    • TensorFlow TensorFlow
    • NumPy NumPy
    • Pandas Pandas
    • Scikit-learn Scikit-learn
    • Matplotlib Matplotlib
    • Machine Learning Machine Learning
    • Plotly Plotly

Educatie

  • MSc.Teleinformatic Engineering

    Federal University of Ceará · 2022 - 2024

  • BSc.Telecommunication Engineering

    Federal University of Ceará (UFC) · 2013 - 2018

Vind jouw volgende ontwikkelaar binnen enkele dagen, niet maanden

In een kort gesprek van 25 minuten:

  • gaan we in op wat je nodig hebt om je product te ontwikkelen;
  • Ons proces uitleggen om u te matchen met gekwalificeerde, doorgelichte ontwikkelaars uit ons netwerk
  • delen we de stappen met je om de juiste match te vinden, vaak al binnen een week.

Maak een afspraak