Dimitrios M.

Data Engineer & Scientist

Dimitrios is een Senior Data Engineer and Data Scientist met een PhD in Mathematical Neuroscience van The Rockefeller University.

Hij specialiseert zich in neurale netwerken, data-modellering en dynamische systemen, met uitgebreide expertise op het gebied van ETL-ontwikkeling. klinische gegevensmodellen en grootschalige gegevensverwerking in de gezondheidszorg, de biowetenschappen en de AI-sectoren.

Hij heeft complexe gegevensoplossingen geleverd voor leidende organisaties, waaronder SAP, EPAM (Odysseus Inc. , en Femtec Health, het bouwen van schaalbare dataleidingen op Databricks, AWS en Sneeuwflake en het implementeren van voorspellende modellen om zorgresultaten te verbeteren.

Dimitrios vertaalt zich met een unieke mix van wetenschappelijke nauwkeurigheid en technische precisie, in productietechnieke, intelligente gegevenssystemen.

Hoofd expertise

  • Python
    Python 8 jaar
  • SQL
    SQL 8 jaar
  • Data Science 8 jaar

Andere vaardigheden

  • R (programming language)
    R (programming language) 4 jaar
  • Machine Learning
    Machine Learning 4 jaar
  • Matlab
    Matlab 3 jaar
Dimitrios

Dimitrios M.

Greece

Aan de slag

Geselecteerde ervaring

Dienstverband

  • Senior Data Engineer / ETL Developer

    Odysseus Inc (part of EPAM Systems) - 2 jaar 11 maanden

    • Led de ontwikkeling en optimalisatie van ETL-pijpleidingen die gezondheidsgegevens veranderden in het OMOP Gemeenschappelijk Gegevensmodel (CDM) voor meerdere mondiale cliënten.
    • Ontworpen en geïmplementeerde gegevensarchitectuur oplossingen om de schaalbaarheid en onderhoudsmogelijkheden in gedistribueerde omgevingen te verbeteren.
    • Gezamenlijk met analisten en gegevenswetenschappers hebben samengewerkt om de kwaliteit van gegevens, validatie en standaardisatie van zaken voor het gebruik van klinisch onderzoek te waarborgen.
    • Betere bestaande Python ETL-orkestatiebibliotheken, die bijdragen aan prestaties en betrouwbaarheidsverbeteringen.
    • Werk samen met databases, Snowflake, Spark, Hadoop, AWS en Azure Data Factory om geautomatiseerde data inname pipelines te bouwen.
    • Ondersteunde implementatieprocessen, versiemanagement en CI/CD workflows met behulp van Bitbucket en containerzed omgevingen.

    Technologieën:

    • Technologieën:
    • AWS AWS
    • Databricks Databricks
    • Python Python
    • SQL SQL
    • Azure Data Factory Azure Data Factory
    • Bitbucket Bitbucket
    • Data Analytics
    • Snowflake Snowflake
    • ETL ETL
    • Hadoop Hadoop
  • Senior Data Scientist

    Femtec Health - 2 jaar 6 maanden

    • Het gegevenswetenschapsteam van Femtec werd ingesteld en geleid door Femteest, die de technische richting vaststelt en wetenschappers begeleidt.
    • Grote ETL-processen opgezet om gezondheidsclaims uit meerdere Amerikaanse bronnen te integreren en te harmoniseren in de OMOP-CDM.
    • Voorlichtingsmodellen ontworpen en geïmplementeerd voor het vroegtijdig opsporen van gynecologische omstandigheden met behulp van Spark, Redshift, en AWS EMR.
    • Toegepaste OHDSI-kaders voor modeltraining en externe validatie in datasets met diverse medische coderingsnormen.
    • Gebouwd machine-leeralgoritmen (Willekeurig Boest, Lasso, Ridge, Gradiënt Boosting, Naïve Bayes, kNN) en ongecontroleerde modellen om microbiome gegevens te clusteren.
    • Interactieve dashboards en visualisaties gebouwd met behulp van Seaborn, Ploly, en Cufflinks voor verslaglegging door de directie.

    Technologieën:

    • Technologieën:
    • Docker Docker
    • AWS AWS
    • Python Python
    • SQL SQL
    • R (programming language) R (programming language)
    • Scikit-learn Scikit-learn
    • Data Analytics
    • ETL ETL
    • Machine Learning Machine Learning
    • Plotly Plotly
    • Redshift Redshift
    • PySpark PySpark
    • Seaborn Seaborn
    • AWS EMR AWS EMR
  • Senior Data Scientist

    Vivante Health (Cylinder) - 8 maanden

    • Voorspellende en classificatiemodellen ontwikkeld voor gastrointestinale omstandigheden met behulp van claims en wearable data.
    • Gebouwd en geoptimaliseerd dataleidingen in GCP en BigQuery, voor een veilige en efficiënte opname van medische dossiers.
    • Gezamenlijk samengewerkt aan functie-engineering, modelvalidatie en ingezette Google Cloud AI- modellen in productiesystemen.
    • Bijdragen aan de creatie van geautomatiseerde klinische data pipelines met behulp van Python, SQL en Apache Spark.

    Technologieën:

    • Technologieën:
    • Apache Spark Apache Spark
    • Python Python
    • SQL SQL
    • Google Cloud Google Cloud
    • Pandas Pandas
    • BigQuery BigQuery
    • Data Analytics
    • Machine Learning Machine Learning
  • Research Assistant

    The Rockefeller University - 6 jaar 6 maanden

    • Uitgevoerd PhD-onderzoek in wiskundig Neuroscience, het modelleren van de dynamiek van het neurale netwerk met niet-lineaire systemen en stochastische processen.
    • Voorgesteld een wiskundig kader te creëren voor adaptieve, zelf herconfigureerbare neurale dynamiek, die werd gepubliceerd in Journal of Statistical Physics (2017).
    • Ontwikkeld van neurale netwerkmodellen die input-afhankelijke berekeningen in de visuele cortex en niet-lineaire golfpropagatie in de cochlea simuleerden.
    • Grote ECoG en multi-elektrode array-opnamen geanalyseerd, waarbij geavanceerde statistische en computationele modelleertechnieken worden toegepast.
    • Meerdere publicaties zijn opgesteld in door medemensen gecontroleerde tijdschriften en hebben bijgedragen aan theoretische onderzoeksgemeenschappen.

    Technologieën:

    • Technologieën:
    • Python Python
    • TensorFlow TensorFlow
    • Keras Keras
    • Matlab Matlab
    • Neural Network

Educatie

  • Doctor Of PhilosophyMathematical Neuroscience

    The Rockefeller University · 2014 - 2019

  • MSc.Mathematics

    Brown University · 2010 - 2012

  • BSc.Mathematics

    National and Kapodistrian University of Athens · 2004 - 2008

Vind jouw volgende ontwikkelaar binnen enkele dagen, niet maanden

In een kort gesprek van 25 minuten:

  • gaan we in op wat je nodig hebt om je product te ontwikkelen;
  • Ons proces uitleggen om u te matchen met gekwalificeerde, doorgelichte ontwikkelaars uit ons netwerk
  • delen we de stappen met je om de juiste match te vinden, vaak al binnen een week.

Maak een afspraak