Dimitrios M.

Data Engineer & Scientist

Dimitrios ist Senior Data Engineer und Data Scientist mit einem Doktortitel in Mathematischer Neurowissenschaften an der Rockefeller University.

Er ist spezialisiert auf neuronale Netzwerke, Datenmodellierung und dynamische Systeme mit umfassender Expertise in der ETL-Entwicklung. klinische Datenmodellierung und umfangreiche Datenverarbeitung in den Bereichen Gesundheitswesen, Biowissenschaften und AI.

Er hat komplexe Datenlösungen für führende Organisationen wie SAP, EPAM (Odysseus Inc. , und Femtec Health, bauen skalierbare Datenpipelines auf Databricks, AWS und Snowflake und implementieren prädiktive Modelle zur Verbesserung der Gesundheitsergebnisse.

Mit einer einzigartigen Mischung aus wissenschaftlicher Strenge und technischer Präzision übersetzt Dimitrios fortschrittliche Theorie in produktionsfähige, intelligente Datensysteme.

Hauptkompetenz

  • Python
    Python 8 Jahre
  • SQL
    SQL 8 Jahre
  • Data Science 8 Jahre

Andere Fähigkeiten

  • R (programming language)
    R (programming language) 4 Jahre
  • Machine Learning
    Machine Learning 4 Jahre
  • Matlab
    Matlab 3 Jahre
Dimitrios

Dimitrios M.

Greece

Erste Schritte

Ausgewählte Erfahrung

Beschäftigung

  • Senior Data Engineer / ETL Developer

    Odysseus Inc (part of EPAM Systems) - 2 jahre 11 monate

    • Die Entwicklung und Optimierung von ETL-Pipelines zur Umwandlung von Gesundheitsdaten in das OMOP Common Data Model (CDM) für mehrere globale Kunden.
    • Entwickelte und implementierte Datenarchitektur-Lösungen, um die Skalierbarkeit und Wartbarkeit in verteilten Umgebungen zu verbessern.
    • Zusammenarbeit mit Analysten und Datenwissenschaftlern, um Datenqualität, Validierung und Standardisierung für klinische Forschungsanwendungen sicherzustellen.
    • Verbesserte existierende Python ETL Orchestrierungsbibliotheken, die zu Performance- und Zuverlässigkeitsverbesserungen beitragen.
    • Arbeiten mit Databricks, Schneefloke, Spark, Hadoop, AWS und Azure Data Factory zum Bau automatisierter Datenerfassungs-Pipelines.
    • Unterstützte Bereitstellungsprozesse, Versionskontrolle und CI/CD-Workflows unter Verwendung von Bitbucket und Containerized Umgebungen.

    Technologien:

    • Technologien:
    • AWS AWS
    • Databricks Databricks
    • Python Python
    • SQL SQL
    • Azure Data Factory Azure Data Factory
    • Bitbucket Bitbucket
    • Data Analytics
    • Snowflake Snowflake
    • ETL ETL
    • Hadoop Hadoop
  • Senior Data Scientist

    Femtec Health - 2 jahre 6 monate

    • Gründung und Leitung von Femtecs Vier Datenwissenschaftsteams, die die technische Richtung und die Betreuung von Datenwissenschaftlern definieren.
    • Engineered large ETL processes to integration and harmonize health claims data from multiple US sources in the OMOP CDM.
    • Entworfene und implementierte Vorhersagemodelle zur Früherkennung gynäkologischer Zustände mit Spark, Redshift, und AWS EMR.
    • Angewandte OHDSI Frameworks für Modellschulung und externe Validierung über Datensätze mit unterschiedlichen medizinischen Codierungsstandards.
    • Entwickelte Maschinenlern-Algorithmen (Zufallswald, Lasso, Ridge, Gradient Boosting, Naïve Bayes, kNN) und unkontrollierte Modelle für die Clusterierung von Mikrobiomdaten.
    • Erstellte interaktive Dashboards und Visualisierungen mit Seaborn, Plotly, und Cufflinks für das Executive Reporting.

    Technologien:

    • Technologien:
    • Docker Docker
    • AWS AWS
    • Python Python
    • SQL SQL
    • R (programming language) R (programming language)
    • Scikit-learn Scikit-learn
    • Data Analytics
    • ETL ETL
    • Machine Learning Machine Learning
    • Plotly Plotly
    • Redshift Redshift
    • PySpark PySpark
    • Seaborn Seaborn
    • AWS EMR AWS EMR
  • Senior Data Scientist

    Vivante Health (Cylinder) - 8 monate

    • Entwickelte Vorhersage- und Klassifikationsmodelle für gastrointestinale Zustände unter Verwendung von Angaben und tragbaren Daten.
    • Erstellte und optimierte Datenleitungen in GCP und BigQuery, um eine sichere und effiziente Aufnahme von medizinischen Unterlagen zu gewährleisten.
    • Zusammenarbeit bei der Feature-Engineering, der Modellvalidierung und dem Einsatz von Google-Cloud-AI-Modellen in Produktionssystemen.
    • Beitrag zur Schaffung automatisierter klinischer Datenpipelines mit Python, SQL und Apache Spark.

    Technologien:

    • Technologien:
    • Apache Spark Apache Spark
    • Python Python
    • SQL SQL
    • Google Cloud Google Cloud
    • Pandas Pandas
    • BigQuery BigQuery
    • Data Analytics
    • Machine Learning Machine Learning
  • Research Assistant

    The Rockefeller University - 6 jahre 6 monate

    • Durchführung von Doktorarbeiten in der Mathematischen Neurowissenschaft, Modellierung der neuronalen Netzwerkdynamik mit nichtlinearen Systemen und stochastischen Prozessen.
    • Vorschlag eines mathematischen Rahmens für adaptive, selbst rekonfigurierbare neuronale Dynamik, das im Journal of Statistical Physics (2017) veröffentlicht wurde.
    • Entwickelte neuronale Netzwerkmodelle, die input-abhängige Berechnungen in der visuellen Cortex und nichtlinearen Wellenausbreitung in der Cochlea simulieren.
    • Analysierte großflächige ECoG und Multielektrode Array-Aufnahmen unter Anwendung fortschrittlicher statistischer und rechnerischer Modellierungstechniken.
    • Autor mehrerer Publikationen in Peer-Review-Zeitschriften und trug zu theoretischen neurowissenschaftlichen Forschungsgemeinschaften bei.

    Technologien:

    • Technologien:
    • Python Python
    • TensorFlow TensorFlow
    • Keras Keras
    • Matlab Matlab
    • Neural Network

Ausbildung

  • Dr. Phil.Mathematical Neuroscience

    The Rockefeller University · 2014 - 2019

  • MSc.Mathematics

    Brown University · 2010 - 2012

  • BSc.Mathematics

    National and Kapodistrian University of Athens · 2004 - 2008

Finden Sie Ihren nächsten Entwickler innerhalb von Tagen, nicht Monaten

In einem kurzen 25-minütigen Gespräch würden wir gerne:

  • Auf Ihren Bedarf bezüglich des Recruitments von Software-Entwicklern eingehen
  • Unseren Prozess vorstellen und somit wie wir Sie mit talentierten und geprüften Kandidaten aus unserem Netzwerk zusammenbringen können
  • Die nächsten Schritte besprechen, um den richtigen Kandidaten zu finden - oft in weniger als einer Woche

Unterhalten wir uns