Lucas M.
Machine Learning Engineer
Lucas Miura Semenzim ist ein erfahrener Data-/Maschinenlern-Ingenieur mit mehr als fünf Jahren Erfahrung in Data Engineering, Datenwissenschaften, maschinellem Lernen und Python.
Er verfügt über nachweisliche Erfahrungen in der Entwicklung und Umsetzung verschiedener ML- und Datenpipelines und hat eine Datenplattform von Grund auf aufgebaut. Lucas hat bereits in den Bereichen Gesundheitswesen, Immobilien, Bildung und Meerestechnik gearbeitet und er ist ein neugieriger, enthusiastischer und wissbegieriger Generalist.
Er arbeitet besonders gern für Unternehmen, in denen Daten oder künstliche Intelligenz eine entscheidende Rolle spielen.
Zurzeit arbeitet Lucas für ein neu gegründetes Gesundheits-Technologie-Unternehmen, das sich mit den Problemen Übergewicht und Fettleibigkeit in Lateinamerika beschäftigt.
Hauptkompetenz
- Data Engineering 2 Jahre
- Data Science 4 Jahre
- Docker 3 Jahre
Andere Fähigkeiten
- Matlab 2 Jahre
- PostgreSQL 2 Jahre
- Scrum 2 Jahre
Ausgewählte Erfahrung
Beschäftigung
Senior Data Engineer
Liti - 2 jahre 9 monate
- Als Teil des Gründungsteams Aufbau der hochskalierbaren, robusten Datenplattform des Unternehmens mit Airflow, Fivetran, DBT und BigQuery, cloud-basiert in GCP;
- Aufbau vollständig rückverfolgbarer, transparenter Transformationsebenen (raw/stg/int/mart) mit DBT, die Daten von Hubspot, Calendly, Typeform und MongoDB in intuitive, aufschlussreiche Datenmodelle umwandelten;
- Entwicklung und Orchestrierung von Datenpipelines mit Python und Airflow für Kerngeschäftsdatenquellen wie Calendly und Google Sheets;
- Erstellung eines EHR-Systems, das Python, Kubernetes und Cloud SQL verwendet, und sich in BigQuery integrieren lässt;
- Verringerung der Arbeitszeit, die Gesundheitsfachkräfte für die Suche nach Daten aufwenden, um 30 Minuten pro Termin.
Technologien:
- Technologien:
- Apache Airflow
- Data Engineering
- Docker
- Git
- Google Cloud
- Kubernetes
- MongoDB
- Python
Data Scientist
Loft - Top Brazilian Unicorn startup - Lunicorn - 8 monate
- Erzielung einer Finanzierung der Serie D im Wert von 3 Mrd. USD;
- Entwicklung mehrerer ETL-Prozesse in den großen Data Warehouses des Unternehmens mit Python, Pandas, Databricks und Spark;
- Durchführung von A/B-Tests mit 100 GB Navigationsdaten, um die Auswirkungen von Empfehlungsmodellen auf den Umsatz von Unternehmen zu ermitteln;
- Optimierung eines Python-Empfehlungssystems mit maschinellem Lernen für die Besichtigungen von Immobilien mithilfe von Richtlinien für Begrenzungsrahmen. Dies führte zu einer Steigerung der Besichtigungen um 15 %;
- Aufbau eines multiplen Reggressionssystems mit Python, Pandas, Streamlit und Plotly zur Zuweisung von Immobilienmakler:innen in drei brasilianischen Großstädten, wodurch die Überbuchung von Besichtigungen um mehr als 30 % reduziert werden konnte;
- Erstellung einer Verkaufsprognose mithilfe eines SARIMA-Modells.
Technologien:
- Technologien:
- Data Science
- Git
- Machine Learning
- Pandas
- Python
Data Scientist und Ausbilder
Ada Tech - 1 jahr
- Aufbau einer kompletten BI-Plattform für das Unternehmen mit Python, Pandas und Streamlit;
- Entwicklung vieler ETL-Prozesse, die in das Data Warehouse des Unternehmens integriert wurden;
- Leitung zweier End-to-End-Datenprojekte;
- Erstellung von Datenpipelines, Datenmodellen, Live-Analytics-Dashboards, Modellen für maschinelles Lernen, CI/CD-Prozessen und A/B-Tests, alle AWS-nativ mit Lambda, S3 und Code (Commit, Build, Pipeline);
- Arbeit an auf maschinellem Lernen basierendem Vertrieb durch Wertung des Systems, das Daten aus Quellen wie WhatsApp und Google Analytics bezieht;
- Entwicklung eines Empfehlungssystems, mit dem die Fragen gefunden werden sollen, die am besten zum Studienmuster einzelner Lernenden passen, mit Reinforcement und Unsupervised Learning.
Technologien:
- Technologien:
- Matlab
- Git
- Machine Learning
- Pandas
- Python
Forscher für Reinforcement Learning
University of São Paulo - 1 jahr 1 monat
- Mitverfasser einer Forschungsarbeit über KI für große Schiffe in der realen Welt unter eingeschränkten Umwelt- und Manövrierbedingungen;
- Design von Experimenten und Modellierung von Datendarstellungen für das Training hochmoderner asynchronen Deep-Reinforcement-Learning-Algorithmen mit Python, Tensorflow und Redis;
- Entwicklung einer robusten, auf Docker basierenden RL-Trainingsinfrastruktur, die Skalierbarkeit und Zuverlässigkeit für schwere Maschinenlern-Operationen auf dem lokalen Cluster bietet;
- Erstellung von Visualisierungs- und Testtools für einwöchige, mehrere Terabyte umfassende KI-Trainingseinheiten, die erhebliche Forschungsfortschritte ermöglichten.
Technologien:
- Technologien:
- Docker
- Machine Learning
- Python
- TensorFlow
Ausbildung
BSc.Elektrotechnik
Escola Politécnica da USP · 2017 - 2021
Portfolio
Finden Sie Ihren nächsten Entwickler innerhalb von Tagen, nicht Monaten
In einem kurzen 25-minütigen Gespräch würden wir gerne:
- Auf Ihren Bedarf bezüglich des Recruitments von Software-Entwicklern eingehen
- Unseren Prozess vorstellen und somit wie wir Sie mit talentierten und geprüften Kandidaten aus unserem Netzwerk zusammenbringen können
- Die nächsten Schritte besprechen, um den richtigen Kandidaten zu finden - oft in weniger als einer Woche