João M.

Deep Learning Research Engineer

João on syvä oppimisinsinööri ASML:ssä, jolla on yli 10 vuoden kokemus tekoälystä.

Hän on erikoistunut rakentamaan kehittyneitä malleja, mukaan lukien suuria kielimalleja (LLM), jotka kykenevät koodinkorjaukseen, vikojen havaitsemiseen ja jatkuvaan oppimiseen. João toimii laajasti PyTorchin kanssa ja hyödyntää malleja pilvialustoilla ja korkean suorituskyvyn laskentajärjestelmissä.

Ennen ASML, hän johti tutkimusryhmien GAIPS Lab, joka on julkaistu johtava tekoälykonferensseja, ja turvattu kilpailukykyisiä avustuksia Yhdysvalloista. Ilmavoimat ja FCT. Hän opetti myös tekoälykursseja, ansaitsemalla opetus Excellence Award -palkinnon hänen panoksestaan koulutukseen.

João keskeisiä projekteja ovat jatkuvan oppimisen tekniikoiden kehittäminen, joka mahdollistaa uuden tiedon hankkimisen unohtamatta aikaisempia tehtäviä. ja tehostamalla oppimista kouluttamaan malleja entistä tehokkaammin vähemmillä tiedoilla. Hän on intohimoinen tehdessään tekoälyn järjestelmistä tehokkaampia, käytännöllisempiä ja jatkuvasti parempia.

Tärkein asiantuntemus

  • Python
    Python 10 vuotta
  • Machine Learning
    Machine Learning 10 vuotta
  • Data Science 10 vuotta

Muut taidot

    João

    João M.

    Netherlands

    Aloita tästä

    Valittu kokemus

    Työllisyys

    • Deep Learning Research Engineer

      ASML - 1 year 4 months

      • Led tutkimusryhmä "LLMs for Software Engineering" -hankkeesta, jossa keskitytään velan tekniseen vähentämiseen, virheentunnistus ja dokumentaatio-analyysi käyttäen suuria kielimalleja.
      • Suunniteltu, toteutettu, koulutettu, testattu, ja otettu käyttöön LLM automaattista koodin refactoring ja vikojen havaitseminen.
      • Käyttöönotetut mallit pilvituotantoympäristöihin ja suurteholaskentaan jaettuihin tietotekniikkaklustereihin.
      • Seurataan käytössä olevien mallien jatkuvaa suorituskykyä käyttäen esimerkiksi MLFlow-, Sacred- ja Painot & Biases-työkaluja.
      • Yhtiön tutkimusosasto yhdistettiin akateemisiin kumppaneihin TU/e.

      Tekniikat:

      • Tekniikat:
      • Docker Docker
      • Java Java
      • Flask Flask
      • Python Python
      • C++ C++
      • AWS S3 AWS S3
      • Azure Azure
      • Data Science
      • Google Cloud Google Cloud
      • TensorFlow TensorFlow
      • NumPy NumPy
      • OpenCV OpenCV
      • XGBoost XGBoost
      • Keras Keras
      • Caffe Caffe
      • Matlab Matlab
      • Pandas Pandas
      • Linux Linux
      • MLOps
      • Open source Open source
      • LaTeX LaTeX
      • PyTorch PyTorch
      • PyCharm PyCharm
      • Unit Testing
      • Git Git
      • Command-line interface
      • Unix Unix
      • SciPy SciPy
      • Scikit-learn Scikit-learn
      • Matplotlib Matplotlib
      • Azure ML Azure ML
      • Random Forest Random Forest
      • Clustering
      • SVM
      • PCA
      • Convolutional neural network Convolutional neural network
      • Recurrent neural network
      • Transformer Network
      • NLP
      • Machine Learning Machine Learning
      • Automation Testing
      • Boost
      • Cuda Cuda
      • Pytest Pytest
      • Apache Flink Apache Flink
      • YAML YAML
      • OpenAI API OpenAI API
      • Prompt Engineering
      • Julia Julia
      • Mojo
      • Stable Diffusion Stable Diffusion
      • Neural Network
      • Large Language Models (LLM) Large Language Models (LLM)
      • JAX
      • MLflow
      • PyTorch Lightning PyTorch Lightning
      • Slurm
      • Hugging Face Hugging Face
    • Deep Learning Research Engineer

      GAIPS Research - 5 years 8 months

      • Suunnitellut, toteutettu, koulutettu, testattu ja otettu käyttöön huippuluokan syvä oppiminen arkkitehtuurit, mukaan lukien Actor-Critics, DQNs, ja LLM:t, jotka käyttävät vallankumouksellisia, toistuvia ja tarkkaavaisia mekanismeja ominaisuustietojen keräämiseksi monenlaisista tehtävistä.
      • Käyttöönotetut mallit pilvipalveluiden tuotantoympäristöihin, kuten Google Cloudiin, Amazon AWS:ään ja Slurm HPC -jakeluklustereihin.
      • Seurataan käytössä olevien mallien jatkuvaa suorituskykyä käyttäen esimerkiksi MLFlow-, Sacred- ja Painot & Biases-työkaluja.
      • Koottiin yhtiön HPC Slurm klusteri.
      • Led viisi tutkijaryhmää kuin ensimmäinen kirjailija, joka julkaisee tutkimuspaperin kunkin huipputason tekoälykohteissa, mukaan lukien AAAI, IJCAI, ECAI, Artificial Intelligence Journal ja PLoS One Journal.
      • Esitetty tekoälytutkimus huipputason kansainvälisissä konferensseissa, kuten AAAI, IJCAI ja ECAI.
      • Varmistettu kaksi kilpailevaa rahoitusapua, yksi Yhdysvalloista. Air Force Office of Scientific Research ja toinen Portugalin tieteen ja teknologian säätiön (FCT).
      • Sai parhaan paperin palkinnon hankkeelle ”Helping People On The FLLy: Ad Hoc Teamwork for Human-Robot Teams.”

      Tekniikat:

      • Tekniikat:
      • Docker Docker
      • Python Python
      • Data Science
      • Joomla Joomla
      • NumPy NumPy
      • OpenCV OpenCV
      • XGBoost XGBoost
      • Keras Keras
      • MLOps
      • Open source Open source
      • PyTorch PyTorch
      • PyCharm PyCharm
      • Git Git
      • Command-line interface
      • SciPy SciPy
      • Scikit-learn Scikit-learn
      • Matplotlib Matplotlib
      • Azure ML Azure ML
      • Convolutional neural network Convolutional neural network
      • Recurrent neural network
      • Transformer Network
      • Machine Learning Machine Learning
      • Computer Vision
      • Boost
      • Cuda Cuda
      • Pytest Pytest
      • YAML YAML
      • OpenAI API OpenAI API
      • Neural Network
      • Hugging Face Transformers Hugging Face Transformers
      • JAX
      • MLflow
      • PyTorch Lightning PyTorch Lightning
      • Slurm
      • Hugging Face Hugging Face
    • Software Engineer

      Thales - 8 months

      • Teknisen velan väheneminen ja Top Sky Tower -ratkaisun entistä kattavampi testaus, joka on lennonjohtajien työkalu elektronisten nauhojen hallintaan.
      • Toteutettu ja testattu kriittisen turvallisuuden havaitsemisjärjestelmät.

      Tekniikat:

      • Tekniikat:
      • Java Java
      • C++ C++
      • C# C#
      • WPF WPF
    • Software Engineer

      IST IT Department - 1 year

      • Koulutettu Convolutional Neural Network luokitella voimassa olevat henkilökorttikuvia.
      • Toteutettu ohjelmisto AWS pilven AWS -tietojen automaattiseen ja ajoittaiseen varmuuskopiointiin.
      • Uudelleentoteutetut perinteiset ohjelmistot, joissa käytetään nykyaikaisia teknologioita, kuten Scala ja Kotlin.

      Tekniikat:

      • Tekniikat:
      • Java Java
      • Python Python
      • AWS S3 AWS S3
      • Scala Scala
      • Kotlin Kotlin
      • TensorFlow TensorFlow
      • Keras Keras
      • PyTorch PyTorch
      • Computer Vision

    Koulutus

    • Doctor Of PhilosophyComputer Science

      Instituto Superior Técnico · 2019 - 2025

    • MSc.Information Systems and Computer Engineering

      Instituto Superior Técnico · 2016 - 2018

    • BSc.Information Systems and Computer Engineering

      Instituto Superior Técnico · 2012 - 2016

    Portfolio

    • Multi-Task Learning & Catastrophic Forgetting in Continual Reinforcement Learning - 1
    • PyTorch Encoder-Decoder Attention Model - 1
    • odel-based Reinforcement Learning for Ad Hoc Teamwork - 1
    • TopSky Tower - 1

    Löydä seuraava kehittäjäsi päivien, ei kuukausien sisällä

    Kun otat yhteyttä, järjestämme lyhyen 25 minuuttia kestävän tapaamisen, jonka aikana:

    • Kartoitamme yrityksenne kehitystarvetta
    • Kertoa prosessimme, jolla löydämme teille pätevän, ennakkotarkastetun kehittäjän verkostostamme
    • Käymme läpi askeleet, joilla oikea ehdokas pääsee aloittamaan – useimmiten viikon sisällä

    Keskustele kanssamme