Isac D.

Data Scientist

Isac is a highly skilled Data Scientist and Software Engineer with over five years of experience in the field. His expertise spans from feature engineering to model deployment, demonstrating a comprehensive understanding of the entire data science pipeline.

He is proficient in building microservices using FastAPI and Python to support AI systems for manufacturer defect detection. Isac has gained experience across a variety of industries, including house flipping, fintech, and manufacturing. One of his notable achievements is developing a system for automating processes at a major US-based Big Tech company using machine learning techniques. This system helps managers grant access to internal applications and optimizes response times.

In addition to his professional accomplishments, Isac won a machine learning hackathon in November 2018, securing first place. His diverse industry experience and technical proficiency make him a valuable asset in developing and implementing advanced AI solutions.

Huvudsaklig expertis

  • Data Analytics 3 år
  • Data Science 5 år
  • NumPy
    NumPy 5 år

Andra kompetenser

  • PostgreSQL
    PostgreSQL 3 år
  • RabbitMQ
    RabbitMQ 3 år
  • Docker
    Docker 3 år
Isac

Isac D.

Brazil

Hitta en utvecklare

Utvald erfarenhet

Anställningar

  • Data Scientist

    Unimed Hospital - 1 år 11 månader

    • Developed a fraud detection system for client documents at Hospital Unimed using Python and Vertex AI, enabling automated classification of personal records and enhancing accuracy in fraud prevention.

    • Designed and delivered a Proof of Concept (PoC) for an AI-powered assistant to support psychologists during therapy sessions.

    • Built pipelines to process and transcribe audio using Whisper and Pyannote, including speaker diarization for precise session analysis.

    • Applied LLMs with Map-Reduce and RAG techniques to extract insights, detect emotions, and identify Cognitive Behavioral Therapy (CBT) elements from therapy transcripts.

    • Implemented advanced audio denoising and source separation (DSS) techniques to significantly improve transcription quality by removing background noise.

    • Generated structured reports and comprehensive summaries by combining LLM-driven summarization with map-reduce frameworks, effectively addressing context length limitations in large models.

    • Developed interactive dashboards using Python, Plotly, Seaborn, and Dash to visualize insights and statistics from therapy sessions, including the recurrence of emotions, frequent cognitive distortions, and other key behavioral metrics.

    Teknologier:

    • Teknologier:
    • Docker Docker
    • PostgreSQL PostgreSQL
    • Flask Flask
    • Python Python
    • Data Science
    • Google Cloud Google Cloud
    • Firebase Firebase
    • Pandas Pandas
    • BigQuery BigQuery
    • Matplotlib Matplotlib
    • Machine Learning Machine Learning
    • FastAPI FastAPI
    • Plotly Plotly
    • LangChain LangChain
    • Large Language Models (LLM) Large Language Models (LLM)
    • Vertex AI Vertex AI
    • Hugging Face Hugging Face
    • Seaborn Seaborn
    • Dash Dash
  • Data Scientist

    Vitatech Electromagnetics LLC - 8 månader

    • Skapade interaktiva grafer som visar amplitud mot tid, filtrerad tid och amplitud mot frekvens (FFT) med Plotly, vilket underlättade djupgående signalanalys.
    • Konstruerade digitala AC/DC-filter för att minska brus och optimera noggrannheten vid EMI-detektering med hjälp av Scipy.
    • Implementerade en decimeringsprocess för att effektivt hantera stora EM-signaler.
    • Utförde signalbehandlingsanalys med hjälp av Pandas och Numpy.

    Teknologier:

    • Teknologier:
    • Flask Flask
    • NumPy NumPy
    • Pandas Pandas
    • SciPy SciPy
    • Matplotlib Matplotlib
    • Streamlit Streamlit
    • Plotly Plotly
  • Product Engineer

    Mariner-USA - 1 år 9 månader

    • Samarbetade med ett tekniskt team med hjälp av GitHub för att förbättra ett system för att upptäcka defekter som utformats för kunder inom tillverkningsindustrin.
    • Implementerade mikrotjänster med hjälp av FastAPI, Flask och gRPC för att bearbeta stora (10k x 8k pixel) bilder och tillämpa dem i djupinlärningsmodeller.
    • Skapade Python-paket som använde ett API från tredje part för att effektivisera annotationsprocessen.
    • Implementerade enhets- och integrationstester med hjälp av Docker och Python för att förbättra kvaliteten på levererad kod.

    Teknologier:

    • Teknologier:
    • Flask Flask
    • Azure Blob storage Azure Blob storage
    • NumPy NumPy
    • gRPC gRPC
  • Machine Learning Researcher

    Insight Data Science Lab - 10 månader

    • Forskningen syftade till att kombinera tensor-tekniker med tidsserieprognoser för ruttförutsägelse av misstänkta fordon med hjälp av sensordata.

    Teknologier:

    • Teknologier:
    • TensorFlow TensorFlow
    • NumPy NumPy
    • SciPy SciPy
  • Data Scientist

    On-site vendor in a FAANG company - 2 år 3 månader

    • Skapade en rekommendationsmotor med hjälp av maskininlärningsmodeller med ett avslagsalternativ över mycket obalanserade dataset. Uppgifterna inkluderade datavisualisering, Python-programmering, datarengöring / bearbetning, funktionsteknik och urval, modellutbildning och utvärdering, dataanalys och data ETL med Python;
    • Utförde funktionsteknik på mycket obalanserade datamängder från olika datakällor som AWS S3, PostgreSQL, MySQL och Cassandra;
    • Hanterade hela datavetenskapliga cykeln, från funktionsteknik till modelldistribution;
    • Byggde ett rekommendationssystem för att hjälpa den högsta ledningen med beslutsfattande om åtkomstkontroll för virtuella tillgångar;
    • Skapat, utvärderat, distribuerat och underhållit maskininlärningsmodeller som webbtjänster;
    • Implementerade tekniker för att optimera modeller, inklusive funktionsteknik och urval, redundansdetektering, outlier-detektering, över- och underprovtagning, modellkalibrering och detektering av datasetdrift;
    • Utformade datapipelines med hjälp av Python för att bearbeta finansiella data och migrera data mellan system.

    Teknologier:

    • Teknologier:
    • Cassandra Cassandra
    • Flask Flask
    • TensorFlow TensorFlow
    • NumPy NumPy
    • Pandas Pandas
    • Scikit-learn Scikit-learn
    • Matplotlib Matplotlib
    • Machine Learning Machine Learning
    • Plotly Plotly

Utbildning

  • MSc.Teleinformatic Engineering

    Federal University of Ceará · 2022 - 2024

  • BSc.Telecommunication Engineering

    Federal University of Ceará (UFC) · 2013 - 2018

Hitta din nästa utvecklare inom ett par dagar

Ge oss 25 minuter av din tid, så kommer vi att:

  • Sätta oss in i dina utmaningar och behov
  • Berätta om våra seniora och beprövade utvecklare
  • Förklara hur vi kan matcha dig med precis rätt utvecklare

Låt oss ta ett kort digitalt möte.