Lucas M.

Machine Learning Engineer

Lucas Miura Semenzim ist ein erfahrener Data-/Maschinenlern-Ingenieur mit mehr als fünf Jahren Erfahrung in Data Engineering, Datenwissenschaften, maschinellem Lernen und Python.

Er verfügt über nachweisliche Erfahrungen in der Entwicklung und Umsetzung verschiedener ML- und Datenpipelines und hat eine Datenplattform von Grund auf aufgebaut. Lucas hat bereits in den Bereichen Gesundheitswesen, Immobilien, Bildung und Meerestechnik gearbeitet und er ist ein neugieriger, enthusiastischer und wissbegieriger Generalist.

Er arbeitet besonders gern für Unternehmen, in denen Daten oder künstliche Intelligenz eine entscheidende Rolle spielen.

Zurzeit arbeitet Lucas für ein neu gegründetes Gesundheits-Technologie-Unternehmen, das sich mit den Problemen Übergewicht und Fettleibigkeit in Lateinamerika beschäftigt.

Hauptkompetenz
  • Data Engineering 2 Jahre
  • Data Science 4 Jahre
  • Docker
    Docker 3 Jahre
Andere Fähigkeiten
  • Matlab
    Matlab 2 Jahre
  • PostgreSQL
    PostgreSQL 2 Jahre
  • Scrum
    Scrum 2 Jahre
Lucas
Lucas M.

Brazil

Erste Schritte

Ausgewählte Erfahrung

Beschäftigung

  • Senior Data Engineer

    Liti - 2 jahre 9 monate

    • Als Teil des Gründungsteams Aufbau der hochskalierbaren, robusten Datenplattform des Unternehmens mit Airflow, Fivetran, DBT und BigQuery, cloud-basiert in GCP;
    • Aufbau vollständig rückverfolgbarer, transparenter Transformationsebenen (raw/stg/int/mart) mit DBT, die Daten von Hubspot, Calendly, Typeform und MongoDB in intuitive, aufschlussreiche Datenmodelle umwandelten;
    • Entwicklung und Orchestrierung von Datenpipelines mit Python und Airflow für Kerngeschäftsdatenquellen wie Calendly und Google Sheets;
    • Erstellung eines EHR-Systems, das Python, Kubernetes und Cloud SQL verwendet, und sich in BigQuery integrieren lässt;
    • Verringerung der Arbeitszeit, die Gesundheitsfachkräfte für die Suche nach Daten aufwenden, um 30 Minuten pro Termin.

    Technologien:

    • Technologien:
    • Apache Airflow Apache Airflow
    • Data Engineering
    • Docker Docker
    • Git Git
    • Google Cloud Google Cloud
    • Kubernetes Kubernetes
    • MongoDB MongoDB
    • Python Python
  • Data Scientist

    Loft - Top Brazilian Unicorn startup - Lunicorn - 8 monate

    • Erzielung einer Finanzierung der Serie D im Wert von 3 Mrd. USD;
    • Entwicklung mehrerer ETL-Prozesse in den großen Data Warehouses des Unternehmens mit Python, Pandas, Databricks und Spark;
    • Durchführung von A/B-Tests mit 100 GB Navigationsdaten, um die Auswirkungen von Empfehlungsmodellen auf den Umsatz von Unternehmen zu ermitteln;
    • Optimierung eines Python-Empfehlungssystems mit maschinellem Lernen für die Besichtigungen von Immobilien mithilfe von Richtlinien für Begrenzungsrahmen. Dies führte zu einer Steigerung der Besichtigungen um 15 %;
    • Aufbau eines multiplen Reggressionssystems mit Python, Pandas, Streamlit und Plotly zur Zuweisung von Immobilienmakler:innen in drei brasilianischen Großstädten, wodurch die Überbuchung von Besichtigungen um mehr als 30 % reduziert werden konnte;
    • Erstellung einer Verkaufsprognose mithilfe eines SARIMA-Modells.

    Technologien:

    • Technologien:
    • Data Science
    • Git Git
    • Machine Learning Machine Learning
    • Pandas Pandas
    • Python Python
  • Data Scientist und Ausbilder

    Ada Tech - 1 jahr

    • Aufbau einer kompletten BI-Plattform für das Unternehmen mit Python, Pandas und Streamlit;
    • Entwicklung vieler ETL-Prozesse, die in das Data Warehouse des Unternehmens integriert wurden;
    • Leitung zweier End-to-End-Datenprojekte;
    • Erstellung von Datenpipelines, Datenmodellen, Live-Analytics-Dashboards, Modellen für maschinelles Lernen, CI/CD-Prozessen und A/B-Tests, alle AWS-nativ mit Lambda, S3 und Code (Commit, Build, Pipeline);
    • Arbeit an auf maschinellem Lernen basierendem Vertrieb durch Wertung des Systems, das Daten aus Quellen wie WhatsApp und Google Analytics bezieht;
    • Entwicklung eines Empfehlungssystems, mit dem die Fragen gefunden werden sollen, die am besten zum Studienmuster einzelner Lernenden passen, mit Reinforcement und Unsupervised Learning.

    Technologien:

    • Technologien:
    • Matlab Matlab
    • Git Git
    • Machine Learning Machine Learning
    • Pandas Pandas
    • Python Python
  • Forscher für Reinforcement Learning

    University of São Paulo - 1 jahr 1 monat

    • Mitverfasser einer Forschungsarbeit über KI für große Schiffe in der realen Welt unter eingeschränkten Umwelt- und Manövrierbedingungen;
    • Design von Experimenten und Modellierung von Datendarstellungen für das Training hochmoderner asynchronen Deep-Reinforcement-Learning-Algorithmen mit Python, Tensorflow und Redis;
    • Entwicklung einer robusten, auf Docker basierenden RL-Trainingsinfrastruktur, die Skalierbarkeit und Zuverlässigkeit für schwere Maschinenlern-Operationen auf dem lokalen Cluster bietet;
    • Erstellung von Visualisierungs- und Testtools für einwöchige, mehrere Terabyte umfassende KI-Trainingseinheiten, die erhebliche Forschungsfortschritte ermöglichten.

    Technologien:

    • Technologien:
    • Docker Docker
    • Machine Learning Machine Learning
    • Python Python
    • TensorFlow TensorFlow

Ausbildung

  • BSc.Elektrotechnik

    Escola Politécnica da USP · 2017 - 2021

Portfolio

  • porfolio-0
  • porfolio-1
  • porfolio-2

Finden Sie Ihren nächsten Entwickler innerhalb von Tagen, nicht Monaten

In einem kurzen 25-minütigen Gespräch würden wir gerne:

  • Auf Ihren Bedarf bezüglich des Recruitments von Software-Entwicklern eingehen
  • Unseren Prozess vorstellen und somit wie wir Sie mit talentierten und geprüften Kandidaten aus unserem Netzwerk zusammenbringen können
  • Die nächsten Schritte besprechen, um den richtigen Kandidaten zu finden - oft in weniger als einer Woche

Unterhalten wir uns