Dimitrios M.

Data Engineer & Scientist

Dimitrios är Senior Data Engineer and Data Scientist med doktorsexamen i matematisk neurovetenskap från Rockefeller University.

Han är specialiserad på neurala nätverk, datamodellering och dynamiska system, med omfattande kompetens inom ETL-utveckling, klinisk datamodellering och storskalig databehandling inom hälso- och sjukvård, livsvetenskap och AI-sektorer.

Han har levererat komplexa datalösningar för ledande organisationer, inklusive SAP, EPAM (Odysseus Inc. , och Femtec Health, bygga skalbara data pipelines på Databricks, AWS, och Snowflake, och implementera prediktiv modeller för att förbättra hälsoresultat.

Med en unik blandning av vetenskaplig noggrannhet och teknisk precision översätter Dimitrios avancerad teori till produktionsfärdiga, intelligenta datasystem.

Huvudsaklig expertis

  • Python
    Python 8 år
  • SQL
    SQL 8 år
  • Data Science 8 år

Andra kompetenser

  • R (programming language)
    R (programming language) 4 år
  • Machine Learning
    Machine Learning 4 år
  • Matlab
    Matlab 3 år
Dimitrios

Dimitrios M.

Greece

Hitta en utvecklare

Utvald erfarenhet

Anställningar

  • Senior Data Engineer / ETL Developer

    Odysseus Inc (part of EPAM Systems) - 2 år 11 månader

    • Ledde utveckling och optimering av ETL-pipelines som omvandlade sjukvårdsdata till OMOP Common Data Model (CDM) för flera globala kunder.
    • Konstruerade och implementerade lösningar för dataarkitektur för att förbättra skalbarhet och underhåll i distribuerade miljöer.
    • Samarbeta med analytiker och datavetare för att säkerställa datakvalitet, validering och standardisering för fall av klinisk forskning.
    • Förbättrade befintliga Python ETL-orkestreringsbibliotek, vilket bidrar till prestanda- och tillförlitlighetsförbättringar.
    • Arbetade med Databricks, Snowflake, Spark, Hadoop, AWS och Azure Data Factory för att bygga automatiserade datainmatningsrörledningar.
    • Distributionsprocesser, versionskontroll och CI/CD-arbetsflöden med hjälp av Bitbucket och containeriserade miljöer.

    Teknologier:

    • Teknologier:
    • AWS AWS
    • Databricks Databricks
    • Python Python
    • SQL SQL
    • Azure Data Factory Azure Data Factory
    • Bitbucket Bitbucket
    • Data Analytics
    • Snowflake Snowflake
    • ETL ETL
    • Hadoop Hadoop
  • Senior Data Scientist

    Femtec Health - 2 år 6 månader

    • Etablerat och lett Femtecs datavetenskapliga team av fyra, definiera teknisk riktning och mentorskap data forskare.
    • Konstruerade storskaliga ETL-processer för att integrera och harmonisera hälsopåståendedata från flera amerikanska källor i OMOP-CDM.
    • Konstruerade och implementerade prediktiva modeller för tidig upptäckt av gynekologiska förhållanden med Gnista, Redshift och AWS EMR.
    • Tillämpade OHDSI-ramverk för modellutbildning och extern validering av data med olika medicinska kodningsstandarder.
    • Utvecklade maskininlärningsalgoritmer (Random Forest, Lasso, Ridge, Gradient Boosting, Nai ve Bayes, kNN) och oövervakade modeller för att samla in mikrobiomdata.
    • Byggd interaktiva instrumentpaneler och visualiseringar med hjälp av Seaborn, Plotly, och manschettlänkar för chefsrapportering.

    Teknologier:

    • Teknologier:
    • Docker Docker
    • AWS AWS
    • Python Python
    • SQL SQL
    • R (programming language) R (programming language)
    • Scikit-learn Scikit-learn
    • Data Analytics
    • ETL ETL
    • Machine Learning Machine Learning
    • Plotly Plotly
    • Redshift Redshift
    • PySpark PySpark
    • Seaborn Seaborn
    • AWS EMR AWS EMR
  • Senior Data Scientist

    Vivante Health (Cylinder) - 8 månader

    • Utvecklade prediktiva och klassificeringsmodeller för mag-tarmtillstånd med hjälp av påståenden och bärbara data.
    • Byggt och optimerat datapipelines i GCP och BigQuery, vilket säkerställer säker och effektiv intag av medicinska journaler.
    • Samarbete kring funktionskonstruktion, modellvalidering och implementering av Google Cloud AI-modeller i produktionssystem.
    • Bidraget till skapandet av automatiserade kliniska data pipelines med hjälp av Python, SQL och Apache Spark.

    Teknologier:

    • Teknologier:
    • Apache Spark Apache Spark
    • Python Python
    • SQL SQL
    • Google Cloud Google Cloud
    • Pandas Pandas
    • BigQuery BigQuery
    • Data Analytics
    • Machine Learning Machine Learning
  • Research Assistant

    The Rockefeller University - 6 år 6 månader

    • Genomfört doktorandforskning i matematisk neurovetenskap, modellering av neurala nätverk dynamik med hjälp av ickelinjära system och stokastiska processer.
    • Föreslå ett matematiskt ramverk för adaptiv, självkonfigurerbar neurala dynamik, som publicerades i Journal of Statistical Physics (2017).
    • Utvecklade neurala nätverksmodeller som simulerade input-beroende beräkningar i den visuella cortex och ickelinjära vågutbredningen i snäckan.
    • Analyserade storskaliga ECoG och multi-electrode array inspelningar, tillämpa avancerade statistiska och beräkningsmodelleringstekniker.
    • Författade flera publikationer i peer-review-tidskrifter och bidrog till teoretiska neuroscience-forskargrupper.

    Teknologier:

    • Teknologier:
    • Python Python
    • TensorFlow TensorFlow
    • Keras Keras
    • Matlab Matlab
    • Neural Network

Utbildning

  • Doctor Of PhilosophyMathematical Neuroscience

    The Rockefeller University · 2014 - 2019

  • MSc.Mathematics

    Brown University · 2010 - 2012

  • BSc.Mathematics

    National and Kapodistrian University of Athens · 2004 - 2008

Hitta din nästa utvecklare inom ett par dagar

Ge oss 25 minuter av din tid, så kommer vi att:

  • Sätta oss in i dina utmaningar och behov
  • Berätta om våra seniora och beprövade utvecklare
  • Förklara hur vi kan matcha dig med precis rätt utvecklare

Låt oss ta ett kort digitalt möte.