Isac D.

Data Scientist

Isac is a highly skilled Data Scientist and Software Engineer with over five years of experience in the field. His expertise spans from feature engineering to model deployment, demonstrating a comprehensive understanding of the entire data science pipeline.

He is proficient in building microservices using FastAPI and Python to support AI systems for manufacturer defect detection. Isac has gained experience across a variety of industries, including house flipping, fintech, and manufacturing. One of his notable achievements is developing a system for automating processes at a major US-based Big Tech company using machine learning techniques. This system helps managers grant access to internal applications and optimizes response times.

In addition to his professional accomplishments, Isac won a machine learning hackathon in November 2018, securing first place. His diverse industry experience and technical proficiency make him a valuable asset in developing and implementing advanced AI solutions.

Hovedekspertise

  • Data Analytics 3 år
  • Data Science 5 år
  • NumPy
    NumPy 5 år

Andre færdigheder

  • PostgreSQL
    PostgreSQL 3 år
  • RabbitMQ
    RabbitMQ 3 år
  • Docker
    Docker 3 år

Udvalgt oplevelse

Beskæftigelse

  • Data Scientist

    Unimed Hospital - 1 år 11 måneder

    • Developed a fraud detection system for client documents at Hospital Unimed using Python and Vertex AI, enabling automated classification of personal records and enhancing accuracy in fraud prevention.

    • Designed and delivered a Proof of Concept (PoC) for an AI-powered assistant to support psychologists during therapy sessions.

    • Built pipelines to process and transcribe audio using Whisper and Pyannote, including speaker diarization for precise session analysis.

    • Applied LLMs with Map-Reduce and RAG techniques to extract insights, detect emotions, and identify Cognitive Behavioral Therapy (CBT) elements from therapy transcripts.

    • Implemented advanced audio denoising and source separation (DSS) techniques to significantly improve transcription quality by removing background noise.

    • Generated structured reports and comprehensive summaries by combining LLM-driven summarization with map-reduce frameworks, effectively addressing context length limitations in large models.

    • Developed interactive dashboards using Python, Plotly, Seaborn, and Dash to visualize insights and statistics from therapy sessions, including the recurrence of emotions, frequent cognitive distortions, and other key behavioral metrics.

    Teknologier:

    • Teknologier:
    • Docker Docker
    • PostgreSQL PostgreSQL
    • Flask Flask
    • Python Python
    • Data Science
    • Google Cloud Google Cloud
    • Firebase Firebase
    • Pandas Pandas
    • BigQuery BigQuery
    • Matplotlib Matplotlib
    • Machine Learning Machine Learning
    • FastAPI FastAPI
    • Plotly Plotly
    • LangChain LangChain
    • Large Language Models (LLM) Large Language Models (LLM)
    • Vertex AI Vertex AI
    • Hugging Face Hugging Face
    • Seaborn Seaborn
    • Dash Dash
  • Data Scientist

    Vitatech Electromagnetics LLC - 8 måneder

    • Oprettet interaktive grafer, der viser amplitude versus tid, filtreret tid og amplitude versus frekvens (FFT) ved hjælp af Plotly, hvilket letter dybtgående signalanalyse.
    • Udviklede digitale AC/DC-filtre til at reducere støj og optimere nøjagtigheden af EMI-registrering ved hjælp af Scipy.
    • Implementeret en decimeringsproces til effektiv håndtering af store EM-signaler.
    • Udført signalbehandlingsanalyse ved hjælp af Pandas og Numpy.

    Teknologier:

    • Teknologier:
    • Flask Flask
    • NumPy NumPy
    • Pandas Pandas
    • SciPy SciPy
    • Matplotlib Matplotlib
    • Streamlit Streamlit
    • Plotly Plotly
  • Product Engineer

    Mariner-USA - 1 år 9 måneder

    • Samarbejdede med det tekniske team ved hjælp af GitHub for at forbedre et fejlfindingssystem designet til produktionskunder.
    • Implementeret mikrotjenester ved hjælp af FastAPI, Flask og gRPC til at behandle store (10k x 8k pixel) billeder og anvende dem i deep learning-modeller.
    • Oprettede en Python-pakke, der brugte en tredjeparts-API til at strømline annotationsprocessen.
    • Implementeret enheds- og integrationstest ved hjælp af Docker og Python for at forbedre kvaliteten af den leverede kode.

    Teknologier:

    • Teknologier:
    • Flask Flask
    • Azure Blob storage Azure Blob storage
    • NumPy NumPy
    • gRPC gRPC
  • Machine Learning Researcher

    Insight Data Science Lab - 10 måneder

    • Forskningen havde til formål at kombinere tensor-teknikker med tidsserieprognoser til ruteforudsigelse af mistænkelige køretøjer ved hjælp af sensordata.

    Teknologier:

    • Teknologier:
    • TensorFlow TensorFlow
    • NumPy NumPy
    • SciPy SciPy
  • Data Scientist

    On-site vendor in a FAANG company - 2 flere år 3 måneder

    • Skabte en anbefalingsmotor ved hjælp af maskinlæringsmodeller med en afvisningsmulighed over meget ubalancerede datasæt. Opgaverne omfattede datavisualisering, Python-programmering, datarensning/-bearbejdning, feature engineering og udvælgelse, modeltræning og evaluering, dataanalyse og data-ETL ved hjælp af Python;
    • Udført feature engineering på meget ubalancerede datasæt fra forskellige datakilder såsom AWS S3, PostgreSQL, MySQL og Cassandra;
    • Håndteret den fulde datavidenskabscyklus, fra feature engineering til modelimplementering;
    • Byggede et anbefalingssystem til at hjælpe den øverste ledelse med at træffe beslutninger om adgangskontrol til virtuelle aktiver;
    • Oprettet, evalueret, implementeret og vedligeholdt maskinlæringsmodeller som webtjenester;
    • Implementeret teknikker til optimering af modeller, herunder feature engineering og udvælgelse, redundansdetektering, outlier-detektering, over- og under-sampling, modelkalibrering og detektering af datasæt-drift;
    • Designet datapipelines ved hjælp af Python til at behandle finansielle data og migrere data mellem systemer.

    Teknologier:

    • Teknologier:
    • Cassandra Cassandra
    • Flask Flask
    • TensorFlow TensorFlow
    • NumPy NumPy
    • Pandas Pandas
    • Scikit-learn Scikit-learn
    • Matplotlib Matplotlib
    • Machine Learning Machine Learning
    • Plotly Plotly

Uddannelse

  • MSc.Teleinformatic Engineering

    Federal University of Ceará · 2022 - 2024

  • BSc.Telecommunication Engineering

    Federal University of Ceará (UFC) · 2013 - 2018

Find din næste udvikler inden for få dage, ikke måneder

Book en 25-minutters samtale, hvor vi:

  • udfører behovsafdækning med fokus på udviklingsopgaver
  • Forklar vores proces, hvor vi matcher dig med kvalificerede, godkendte udviklere fra vores netværk
  • beskriver de næste trin for at finde det perfekte match på få dage

Lad os snakke om det