NEU
Proxify is bringing transparency to tech team performance based on research conducted at Stanford. An industry first, built for engineering leaders.
Learn more
João M.
Deep Learning Research Engineer
João ist ein Deep Learning Engineer bei ASML mit mehr als 10 Jahren Erfahrung im Bereich künstlicher Intelligenz.
Er ist spezialisiert auf die Entwicklung fortschrittlicher Modelle, einschließlich großer Sprachmodelle (LLMs), die in der Lage sind, Code Refactoring, Fehlererkennung und kontinuierliches Lernen zu erstellen. João arbeitet umfassend mit PyTorch zusammen und stellt Modelle auf Cloud-Plattformen und Hochleistungsrechnersystemen zur Verfügung.
Vor ASML leitete er Forschungsteams bei GAIPS Lab, publizierte auf führenden KI-Konferenzen und sicherte sich Wettbewerbszuwendungen aus den USA. Luftwaffe und FCT. Er unterrichtete auch KI-Kurse und erhielt für seine Beiträge zur Bildung einen "Teaching Excellence Award".
Zu den wichtigsten Projekten von João gehören die Weiterentwicklung kontinuierlicher Lerntechniken, die es der KI ermöglichen, neues Wissen zu erwerben, ohne vorherige Aufgaben zu vergessen, und die Anwendung des Verstärkungslernens, um Modelle effizienter mit weniger Daten zu trainieren. Er ist leidenschaftlich darum bemüht, die KI-Systeme effektiver, praktischer und ständig zu verbessern.
Hauptkompetenz
- Python 10 Jahre

- Machine Learning 10 Jahre

- Data Science 10 Jahre
Andere Fähigkeiten
Ausgewählte Erfahrung
Beschäftigung
Deep Learning Research Engineer
ASML - 1 jahr 4 monate
- Ein Forschungsteam am Projekt "LLMs for Software Engineering" mit Schwerpunkt auf der technischen Schuldenreduzierung, Fehlererkennung und Dokumentationsanalyse mit Hilfe von Large Language Models.
- Entwickelt, implementiert, geschult, getestet und implementiert LLMs zur automatischen Code-Refactoring und Fehlererkennung.
- Deployed models to cloud production environments and HPC distributed computing cluster.
- Überwachung der kontinuierlichen Leistung der eingesetzten Modelle mit Werkzeugen wie MLFlow, Sacred und Weights & Biases.
- Verbunden der Forschungsabteilung des Unternehmens mit akademischen Partnern bei TU/e.
Technologien:
- Technologien:
Docker
Java
Flask
Python
C++
AWS S3
Azure
- Data Science
Google Cloud
TensorFlow
NumPy
OpenCV
XGBoost
Keras
Caffe
Matlab
Pandas
Linux
- MLOps
Open source
LaTeX
PyTorch
PyCharm
- Unit Testing
Git
- Command-line interface
Unix
SciPy
Scikit-learn
Matplotlib
Azure ML
Random Forest
- Clustering
- SVM
- PCA
Convolutional neural network
- Recurrent neural network
- Transformer Network
- NLP
Machine Learning
- Automation Testing
- Boost
Cuda
Pytest
Apache Flink
YAML
OpenAI API
- Prompt Engineering
Julia
- Mojo
Stable Diffusion
- Neural Network
Large Language Models (LLM)
- JAX
- MLflow
PyTorch Lightning
- Slurm
Hugging Face
Deep Learning Research Engineer
GAIPS Research - 5 jahre 8 monate
- Entwickelt, implementiert, geschult, getestet und implementiert modernste Tieflernarchitekturen, einschließlich Schauspielerkritik, DQNs, und LLMs mit Hilfe von konvolutionären, wiederkehrenden und aufmerksamkeitsbasierten Mechanismen zur Leistungsextraktion über eine Vielzahl von Aufgaben.
- Verteilte Modelle für Cloud-Produktionsumgebungen auf Plattformen wie Google Cloud, Amazon AWS und Slurm HPC verteilte Computercluster.
- Überwachung der kontinuierlichen Leistung von eingesetzten Modellen mit Werkzeugen wie MLFlow, Sacred und Weights & Biases.
- Anordnung des HPC Slurm Clusters.
- Led fünf Forschungsteams als erster Autor, veröffentlicht ein Forschungsdokument für jeden in Top-AI-Veranstaltungsorte, einschließlich AAAI, IJCAI, ECAI, dem Artificial Intelligence Journal, und PLoS One Journal.
- Präsentation der AI-Forschung auf internationalen Top-Konferenzen wie AAI, IJCAI und ECAI.
- Sicherung von zwei wettbewerbsfähigen Fördergeldern, einer aus den USA. Air Force Office of Scientific Research und ein weiteres von der Portugiesischen Stiftung für Wissenschaft und Technologie (FCT).
- Erhalten des Best Paper Award für das Projekt „Helping People On The Fly: Ad Hoc Teamwork for Human-Robot Teams.“
Technologien:
- Technologien:
Docker
Python
- Data Science
Joomla
NumPy
OpenCV
XGBoost
Keras
- MLOps
Open source
PyTorch
PyCharm
Git
- Command-line interface
SciPy
Scikit-learn
Matplotlib
Azure ML
Convolutional neural network
- Recurrent neural network
- Transformer Network
Machine Learning
- Computer Vision
- Boost
Cuda
Pytest
YAML
OpenAI API
- Neural Network
Hugging Face Transformers
- JAX
- MLflow
PyTorch Lightning
- Slurm
Hugging Face
Software Engineer
Thales - 8 monate
- Reduzierte technische Schulden und eine erhöhte Gesamtprüfung der Top Sky Tower Lösung, ein Werkzeug für die Fluglotsen zur Verwaltung von elektronischen Streifen.
- Implementierte und getestete kritische Sicherheitserkennungssysteme.
Technologien:
- Technologien:
Java
C++
C#
WPF
Software Engineer
IST IT Department - 1 jahr
- Ein Neuronales Netzwerk ausgebildet, um gültige Identitätskartenbilder zu klassifizieren.
- Implementierte Software für automatische und periodische Sicherungen der Universitätsdatensätze in der AWS-Cloud.
- Reimplementierte Legacy-Software mit modernen Technologien wie Scala und Kotlin.
Technologien:
- Technologien:
Java
Python
AWS S3
Scala
Kotlin
TensorFlow
Keras
PyTorch
- Computer Vision
Ausbildung
Dr. Phil.Computer Science
Instituto Superior Técnico · 2019 - 2025
MSc.Information Systems and Computer Engineering
Instituto Superior Técnico · 2016 - 2018
BSc.Information Systems and Computer Engineering
Instituto Superior Técnico · 2012 - 2016
Portfolio
Finden Sie Ihren nächsten Entwickler innerhalb von Tagen, nicht Monaten
In einem kurzen 25-minütigen Gespräch würden wir gerne:
- Auf Ihren Bedarf bezüglich des Recruitments von Software-Entwicklern eingehen
- Unseren Prozess vorstellen und somit wie wir Sie mit talentierten und geprüften Kandidaten aus unserem Netzwerk zusammenbringen können
- Die nächsten Schritte besprechen, um den richtigen Kandidaten zu finden - oft in weniger als einer Woche




