João M.

Deep Learning Research Engineer

João ist ein Deep Learning Engineer bei ASML mit mehr als 10 Jahren Erfahrung im Bereich künstlicher Intelligenz.

Er ist spezialisiert auf die Entwicklung fortschrittlicher Modelle, einschließlich großer Sprachmodelle (LLMs), die in der Lage sind, Code Refactoring, Fehlererkennung und kontinuierliches Lernen zu erstellen. João arbeitet umfassend mit PyTorch zusammen und stellt Modelle auf Cloud-Plattformen und Hochleistungsrechnersystemen zur Verfügung.

Vor ASML leitete er Forschungsteams bei GAIPS Lab, publizierte auf führenden KI-Konferenzen und sicherte sich Wettbewerbszuwendungen aus den USA. Luftwaffe und FCT. Er unterrichtete auch KI-Kurse und erhielt für seine Beiträge zur Bildung einen "Teaching Excellence Award".

Zu den wichtigsten Projekten von João gehören die Weiterentwicklung kontinuierlicher Lerntechniken, die es der KI ermöglichen, neues Wissen zu erwerben, ohne vorherige Aufgaben zu vergessen, und die Anwendung des Verstärkungslernens, um Modelle effizienter mit weniger Daten zu trainieren. Er ist leidenschaftlich darum bemüht, die KI-Systeme effektiver, praktischer und ständig zu verbessern.

Hauptkompetenz

  • Python
    Python 10 Jahre
  • Machine Learning
    Machine Learning 10 Jahre
  • Data Science 10 Jahre

Andere Fähigkeiten

    João

    João M.

    Netherlands

    Erste Schritte

    Ausgewählte Erfahrung

    Beschäftigung

    • Deep Learning Research Engineer

      ASML - 1 jahr 4 monate

      • Ein Forschungsteam am Projekt "LLMs for Software Engineering" mit Schwerpunkt auf der technischen Schuldenreduzierung, Fehlererkennung und Dokumentationsanalyse mit Hilfe von Large Language Models.
      • Entwickelt, implementiert, geschult, getestet und implementiert LLMs zur automatischen Code-Refactoring und Fehlererkennung.
      • Deployed models to cloud production environments and HPC distributed computing cluster.
      • Überwachung der kontinuierlichen Leistung der eingesetzten Modelle mit Werkzeugen wie MLFlow, Sacred und Weights & Biases.
      • Verbunden der Forschungsabteilung des Unternehmens mit akademischen Partnern bei TU/e.

      Technologien:

      • Technologien:
      • Docker Docker
      • Java Java
      • Flask Flask
      • Python Python
      • C++ C++
      • AWS S3 AWS S3
      • Azure Azure
      • Data Science
      • Google Cloud Google Cloud
      • TensorFlow TensorFlow
      • NumPy NumPy
      • OpenCV OpenCV
      • XGBoost XGBoost
      • Keras Keras
      • Caffe Caffe
      • Matlab Matlab
      • Pandas Pandas
      • Linux Linux
      • MLOps
      • Open source Open source
      • LaTeX LaTeX
      • PyTorch PyTorch
      • PyCharm PyCharm
      • Unit Testing
      • Git Git
      • Command-line interface
      • Unix Unix
      • SciPy SciPy
      • Scikit-learn Scikit-learn
      • Matplotlib Matplotlib
      • Azure ML Azure ML
      • Random Forest Random Forest
      • Clustering
      • SVM
      • PCA
      • Convolutional neural network Convolutional neural network
      • Recurrent neural network
      • Transformer Network
      • NLP
      • Machine Learning Machine Learning
      • Automation Testing
      • Boost
      • Cuda Cuda
      • Pytest Pytest
      • Apache Flink Apache Flink
      • YAML YAML
      • OpenAI API OpenAI API
      • Prompt Engineering
      • Julia Julia
      • Mojo
      • Stable Diffusion Stable Diffusion
      • Neural Network
      • Large Language Models (LLM) Large Language Models (LLM)
      • JAX
      • MLflow
      • PyTorch Lightning PyTorch Lightning
      • Slurm
      • Hugging Face Hugging Face
    • Deep Learning Research Engineer

      GAIPS Research - 5 jahre 8 monate

      • Entwickelt, implementiert, geschult, getestet und implementiert modernste Tieflernarchitekturen, einschließlich Schauspielerkritik, DQNs, und LLMs mit Hilfe von konvolutionären, wiederkehrenden und aufmerksamkeitsbasierten Mechanismen zur Leistungsextraktion über eine Vielzahl von Aufgaben.
      • Verteilte Modelle für Cloud-Produktionsumgebungen auf Plattformen wie Google Cloud, Amazon AWS und Slurm HPC verteilte Computercluster.
      • Überwachung der kontinuierlichen Leistung von eingesetzten Modellen mit Werkzeugen wie MLFlow, Sacred und Weights & Biases.
      • Anordnung des HPC Slurm Clusters.
      • Led fünf Forschungsteams als erster Autor, veröffentlicht ein Forschungsdokument für jeden in Top-AI-Veranstaltungsorte, einschließlich AAAI, IJCAI, ECAI, dem Artificial Intelligence Journal, und PLoS One Journal.
      • Präsentation der AI-Forschung auf internationalen Top-Konferenzen wie AAI, IJCAI und ECAI.
      • Sicherung von zwei wettbewerbsfähigen Fördergeldern, einer aus den USA. Air Force Office of Scientific Research und ein weiteres von der Portugiesischen Stiftung für Wissenschaft und Technologie (FCT).
      • Erhalten des Best Paper Award für das Projekt „Helping People On The Fly: Ad Hoc Teamwork for Human-Robot Teams.“

      Technologien:

      • Technologien:
      • Docker Docker
      • Python Python
      • Data Science
      • Joomla Joomla
      • NumPy NumPy
      • OpenCV OpenCV
      • XGBoost XGBoost
      • Keras Keras
      • MLOps
      • Open source Open source
      • PyTorch PyTorch
      • PyCharm PyCharm
      • Git Git
      • Command-line interface
      • SciPy SciPy
      • Scikit-learn Scikit-learn
      • Matplotlib Matplotlib
      • Azure ML Azure ML
      • Convolutional neural network Convolutional neural network
      • Recurrent neural network
      • Transformer Network
      • Machine Learning Machine Learning
      • Computer Vision
      • Boost
      • Cuda Cuda
      • Pytest Pytest
      • YAML YAML
      • OpenAI API OpenAI API
      • Neural Network
      • Hugging Face Transformers Hugging Face Transformers
      • JAX
      • MLflow
      • PyTorch Lightning PyTorch Lightning
      • Slurm
      • Hugging Face Hugging Face
    • Software Engineer

      Thales - 8 monate

      • Reduzierte technische Schulden und eine erhöhte Gesamtprüfung der Top Sky Tower Lösung, ein Werkzeug für die Fluglotsen zur Verwaltung von elektronischen Streifen.
      • Implementierte und getestete kritische Sicherheitserkennungssysteme.

      Technologien:

      • Technologien:
      • Java Java
      • C++ C++
      • C# C#
      • WPF WPF
    • Software Engineer

      IST IT Department - 1 jahr

      • Ein Neuronales Netzwerk ausgebildet, um gültige Identitätskartenbilder zu klassifizieren.
      • Implementierte Software für automatische und periodische Sicherungen der Universitätsdatensätze in der AWS-Cloud.
      • Reimplementierte Legacy-Software mit modernen Technologien wie Scala und Kotlin.

      Technologien:

      • Technologien:
      • Java Java
      • Python Python
      • AWS S3 AWS S3
      • Scala Scala
      • Kotlin Kotlin
      • TensorFlow TensorFlow
      • Keras Keras
      • PyTorch PyTorch
      • Computer Vision

    Ausbildung

    • Dr. Phil.Computer Science

      Instituto Superior Técnico · 2019 - 2025

    • MSc.Information Systems and Computer Engineering

      Instituto Superior Técnico · 2016 - 2018

    • BSc.Information Systems and Computer Engineering

      Instituto Superior Técnico · 2012 - 2016

    Portfolio

    • Multi-Task Learning & Catastrophic Forgetting in Continual Reinforcement Learning - 1
    • PyTorch Encoder-Decoder Attention Model - 1
    • odel-based Reinforcement Learning for Ad Hoc Teamwork - 1
    • TopSky Tower - 1

    Finden Sie Ihren nächsten Entwickler innerhalb von Tagen, nicht Monaten

    In einem kurzen 25-minütigen Gespräch würden wir gerne:

    • Auf Ihren Bedarf bezüglich des Recruitments von Software-Entwicklern eingehen
    • Unseren Prozess vorstellen und somit wie wir Sie mit talentierten und geprüften Kandidaten aus unserem Netzwerk zusammenbringen können
    • Die nächsten Schritte besprechen, um den richtigen Kandidaten zu finden - oft in weniger als einer Woche

    Unterhalten wir uns