Isac D.

Data Scientist

Isac is a highly skilled Data Scientist and Software Engineer with over five years of experience in the field. His expertise spans from feature engineering to model deployment, demonstrating a comprehensive understanding of the entire data science pipeline.

He is proficient in building microservices using FastAPI and Python to support AI systems for manufacturer defect detection. Isac has gained experience across a variety of industries, including house flipping, fintech, and manufacturing. One of his notable achievements is developing a system for automating processes at a major US-based Big Tech company using machine learning techniques. This system helps managers grant access to internal applications and optimizes response times.

In addition to his professional accomplishments, Isac won a machine learning hackathon in November 2018, securing first place. His diverse industry experience and technical proficiency make him a valuable asset in developing and implementing advanced AI solutions.

Tärkein asiantuntemus

  • Data Analytics 3 vuotta
  • Data Science 5 vuotta
  • NumPy
    NumPy 5 vuotta

Muut taidot

  • PostgreSQL
    PostgreSQL 3 vuotta
  • RabbitMQ
    RabbitMQ 3 vuotta
  • Docker
    Docker 3 vuotta
Isac

Isac D.

Brazil

Aloita tästä

Valittu kokemus

Työllisyys

  • Data Scientist

    Unimed Hospital - 1 year 11 months

    • Developed a fraud detection system for client documents at Hospital Unimed using Python and Vertex AI, enabling automated classification of personal records and enhancing accuracy in fraud prevention.

    • Designed and delivered a Proof of Concept (PoC) for an AI-powered assistant to support psychologists during therapy sessions.

    • Built pipelines to process and transcribe audio using Whisper and Pyannote, including speaker diarization for precise session analysis.

    • Applied LLMs with Map-Reduce and RAG techniques to extract insights, detect emotions, and identify Cognitive Behavioral Therapy (CBT) elements from therapy transcripts.

    • Implemented advanced audio denoising and source separation (DSS) techniques to significantly improve transcription quality by removing background noise.

    • Generated structured reports and comprehensive summaries by combining LLM-driven summarization with map-reduce frameworks, effectively addressing context length limitations in large models.

    • Developed interactive dashboards using Python, Plotly, Seaborn, and Dash to visualize insights and statistics from therapy sessions, including the recurrence of emotions, frequent cognitive distortions, and other key behavioral metrics.

    Tekniikat:

    • Tekniikat:
    • Docker Docker
    • PostgreSQL PostgreSQL
    • Flask Flask
    • Python Python
    • Data Science
    • Google Cloud Google Cloud
    • Firebase Firebase
    • Pandas Pandas
    • BigQuery BigQuery
    • Matplotlib Matplotlib
    • Machine Learning Machine Learning
    • FastAPI FastAPI
    • Plotly Plotly
    • LangChain LangChain
    • Large Language Models (LLM) Large Language Models (LLM)
    • Vertex AI Vertex AI
    • Hugging Face Hugging Face
    • Seaborn Seaborn
    • Dash Dash
  • Data Scientist

    Vitatech Electromagnetics LLC - 8 months

    • Luotu interaktiivisia kaavioita, jotka kuvaavat amplitudia suhteessa aikaan, suodatettua aikaa ja amplitudia suhteessa taajuuteen (FFT) käyttäen Plotlya, mikä helpottaa syvällistä signaalianalyysiä.
    • Suunnitellut AC / DC-digitaaliset suodattimet kohinan vähentämiseksi, EMI-tunnistuksen tarkkuuden optimoimiseksi Scipyn avulla.
    • Toteutettu desimointiprosessi suurten EM-signaalien tehokkaaseen hallintaan.
    • Suorittanut signaalinkäsittelyanalyysiä Pandasin ja Numpyn avulla.

    Tekniikat:

    • Tekniikat:
    • Flask Flask
    • NumPy NumPy
    • Pandas Pandas
    • SciPy SciPy
    • Matplotlib Matplotlib
    • Streamlit Streamlit
    • Plotly Plotly
  • Product Engineer

    Mariner-USA - 1 year 9 months

    • Teki yhteistyötä teknisen tiimin kanssa GitHubin avulla parantaakseen valmistusasiakkaille suunniteltua vikojen havaitsemisjärjestelmää.
    • Toteutti mikropalveluja FastAPI:n, Flaskin ja gRPC:n avulla suurten (10k x 8k pikselin) kuvien käsittelemiseksi ja niiden soveltamiseksi syväoppimismalleihin.
    • Luotu Python-paketti, joka hyödynsi kolmannen osapuolen API:ta annotaatioprosessin virtaviivaistamiseksi.
    • Toteutti yksikkö- ja integrointitestejä Dockerin ja Pythonin avulla toimitetun koodin laadun parantamiseksi.

    Tekniikat:

    • Tekniikat:
    • Flask Flask
    • Azure Blob storage Azure Blob storage
    • NumPy NumPy
    • gRPC gRPC
  • Machine Learning Researcher

    Insight Data Science Lab - 10 months

    • Tutkimuksessa pyrittiin yhdistämään tensoritekniikoita ja aikasarjan ennustamista epäilyttävien ajoneuvojen reitin ennustamiseen anturidatan avulla.

    Tekniikat:

    • Tekniikat:
    • TensorFlow TensorFlow
    • NumPy NumPy
    • SciPy SciPy
  • Data Scientist

    On-site vendor in a FAANG company - 2 years 3 months

    • Luotu suositusmoottori, joka käyttää koneoppimismalleja, joissa on hylkäysmahdollisuus erittäin epätasapainoisissa tietokokonaisuuksissa. Tehtäviin kuului tietojen visualisointia, Python-ohjelmointia, tietojen puhdistusta/käsittelyä, ominaisuuksien suunnittelua ja valintaa, mallien koulutusta ja arviointia, tietojen analysointia ja tietojen ETL:ää Pythonilla;
    • Suorittanut ominaisuuksien suunnittelua erittäin epätasapainoisille tietokokonaisuuksille eri tietolähteistä, kuten AWS S3, PostgreSQL, MySQL ja Cassandra;
    • Käsitellyt koko datatieteen syklin ominaisuuksien suunnittelusta mallien käyttöönottoon;
    • Rakensi suositusjärjestelmän, joka auttaa ylempää johtoa virtuaalisen omaisuuden käyttöoikeuksien valvontaa koskevassa päätöksenteossa;
    • Luonut, arvioinut, ottanut käyttöön ja ylläpitänyt koneoppimismalleja verkkopalveluina;
    • Toteutti tekniikoita mallien optimoimiseksi, mukaan lukien ominaisuuksien suunnittelu ja valinta, redundanssin havaitseminen, outlierien havaitseminen, yli- ja alinäytteenotto, mallin kalibrointi ja dataset drift detection;
    • Suunnitellut Pythonilla dataputkia, joiden avulla voidaan käsitellä taloustietoja ja siirtää tietoja järjestelmien välillä.

    Tekniikat:

    • Tekniikat:
    • Cassandra Cassandra
    • Flask Flask
    • TensorFlow TensorFlow
    • NumPy NumPy
    • Pandas Pandas
    • Scikit-learn Scikit-learn
    • Matplotlib Matplotlib
    • Machine Learning Machine Learning
    • Plotly Plotly

Koulutus

  • MSc.Teleinformatic Engineering

    Federal University of Ceará · 2022 - 2024

  • BSc.Telecommunication Engineering

    Federal University of Ceará (UFC) · 2013 - 2018

Löydä seuraava kehittäjäsi päivien, ei kuukausien sisällä

Kun otat yhteyttä, järjestämme lyhyen 25 minuuttia kestävän tapaamisen, jonka aikana:

  • Kartoitamme yrityksenne kehitystarvetta
  • Kertoa prosessimme, jolla löydämme teille pätevän, ennakkotarkastetun kehittäjän verkostostamme
  • Käymme läpi askeleet, joilla oikea ehdokas pääsee aloittamaan – useimmiten viikon sisällä

Keskustele kanssamme