Dimitrios M.

Data Engineer & Scientist

Dimitrios er Senior Data Engineer and Data Scientist med en ph.d. i Matematisk Neuroscience fra Rockefeller University.

Han har specialiseret sig i neurale netværk, datamodellering, og dynamiske systemer, med omfattende ekspertise i ETL udvikling, modellering af kliniske data og omfattende databehandling på tværs af sundheds-, bio- og AI-sektorer.

Han har leveret komplekse dataløsninger til førende organisationer, herunder SAP, EPAM (Odysseus Inc. , og Femtec Sundhed, bygning skalerbare datamørledninger på Databricks, AWS, og Snowflake og implementere prædiktive modeller til at forbedre resultaterne af sundhedspleje.

Med en unik blanding af videnskabelig rigor og engineering præcision, Dimitrios oversætter avanceret teori til produktions-klar, intelligente datasystemer.

Hovedekspertise

  • Python
    Python 8 år
  • SQL
    SQL 8 år
  • Data Science 8 år

Andre færdigheder

  • R (programming language)
    R (programming language) 4 år
  • Machine Learning
    Machine Learning 4 år
  • Matlab
    Matlab 3 år
Dimitrios

Dimitrios M.

Greece

Match med udvikler her

Udvalgt oplevelse

Beskæftigelse

  • Senior Data Engineer / ETL Developer

    Odysseus Inc (part of EPAM Systems) - 2 flere år 11 måneder

    • Led udviklingen og optimeringen af ETL rørledninger, der omdannede sundhedsdata til OMOP Common Data Model (CDM) for flere globale kunder.
    • Designet og implementeret data arkitektur løsninger til at forbedre skalerbarhed og vedligeholdelse på tværs af distribuerede miljøer.
    • Samarbejdet med analytikere og data-forskere for at sikre datakvalitet, validering og standardisering til klinisk forskning brug tilfælde.
    • Forbedret eksisterende Python ETL orkestration biblioteker, bidrager til ydeevne og pålidelighed forbedringer.
    • Arbejdet med Databricks, Snowflake, Spark, Hadoop, AWS, og Azure Data Factory til at opbygge automatiserede data ingestion rørledninger.
    • Understøttede implementeringsprocesser, versionskontrol og CI/CD-arbejdsgange ved hjælp af Bitbucket og indesluttede miljøer.

    Teknologier:

    • Teknologier:
    • AWS AWS
    • Databricks Databricks
    • Python Python
    • SQL SQL
    • Azure Data Factory Azure Data Factory
    • Bitbucket Bitbucket
    • Data Analytics
    • Snowflake Snowflake
    • ETL ETL
    • Hadoop Hadoop
  • Senior Data Scientist

    Femtec Health - 2 flere år 6 måneder

    • Oprettet og ledet Femtecs datalogi team af fire, der definerer den tekniske retning og mentoring af data forskere.
    • Udviklet store ETL processer til at integrere og harmonisere sundhedsanprisninger data fra flere amerikanske kilder i OMOP CDM.
    • Designet og implementeret prædiktive modeller til tidlig påvisning af gynækologiske forhold ved hjælp af Spark, Redshift, og AWS EMR.
    • Anvendt OHDSI rammer for modeltræning og ekstern validering på tværs af datasæt med forskellige medicinske kodningsstandarder.
    • Udviklet machine learning algoritmer (Random Forest, Lasso, Ridge, Gradient Boosting, Naiţve Bayes, kNN) og uovervåget modeller for klynge microbiome data.
    • Opbygget interaktive dashboards og visualiseringer ved hjælp af Seaborn, Plotly, og Cufflinks til executive rapportering.

    Teknologier:

    • Teknologier:
    • Docker Docker
    • AWS AWS
    • Python Python
    • SQL SQL
    • R (programming language) R (programming language)
    • Scikit-learn Scikit-learn
    • Data Analytics
    • ETL ETL
    • Machine Learning Machine Learning
    • Plotly Plotly
    • Redshift Redshift
    • PySpark PySpark
    • Seaborn Seaborn
    • AWS EMR AWS EMR
  • Senior Data Scientist

    Vivante Health (Cylinder) - 8 måneder

    • Udvikling af prædiktive modeller og klassifikationsmodeller for gastrointestinale forhold ved brug af anprisninger og bærbare data.
    • Bygget og optimeret datamørledninger i GCP og BigQuery, der sikrer sikker og effektiv indtagelse af medicinske journaler.
    • Samarbejdet om funktionsteknik, modelvalidering og implementeret Google Cloud AI- modeller i produktionssystemer.
    • Bidragede til oprettelsen af automatiske kliniske datalørledninger ved hjælp af Python, SQL, og Apache Spark.

    Teknologier:

    • Teknologier:
    • Apache Spark Apache Spark
    • Python Python
    • SQL SQL
    • Google Cloud Google Cloud
    • Pandas Pandas
    • BigQuery BigQuery
    • Data Analytics
    • Machine Learning Machine Learning
  • Research Assistant

    The Rockefeller University - 6 flere år 6 måneder

    • Udført ph.d.-forskning i Matematisk Neuroscience, modellering neurale netværk dynamik ved hjælp af bratte systemer og stokastiske processer.
    • Foreslået en matematisk ramme for adaptive, selv-reconfigurable neural dynamics, som blev offentliggjort i Journal of Statistical Physics (2017).
    • Udviklede neurale netværk modeller, der simulerede input-afhængige beregninger i den visuelle cortex og bratte bølge formering i cochlea.
    • Analyseret stor skala EKoG og multi-elektrode array optagelser, anvende avancerede statistiske og beregningsmæssige modellering teknikker.
    • Authored multiple publications in peer-reviewed tidsskrifter og bidrog til teoretiske neuroscience forskning samfund.

    Teknologier:

    • Teknologier:
    • Python Python
    • TensorFlow TensorFlow
    • Keras Keras
    • Matlab Matlab
    • Neural Network

Uddannelse

  • Doctor Of PhilosophyMathematical Neuroscience

    The Rockefeller University · 2014 - 2019

  • MSc.Mathematics

    Brown University · 2010 - 2012

  • BSc.Mathematics

    National and Kapodistrian University of Athens · 2004 - 2008

Find din næste udvikler inden for få dage, ikke måneder

Book en 25-minutters samtale, hvor vi:

  • udfører behovsafdækning med fokus på udviklingsopgaver
  • Forklar vores proces, hvor vi matcher dig med kvalificerede, godkendte udviklere fra vores netværk
  • beskriver de næste trin for at finde det perfekte match på få dage

Lad os snakke om det