NEW
Proxify is bringing transparency to tech team performance based on research conducted at Stanford. An industry first, built for engineering leaders.
Learn more
Dimitrios M.
Data Engineer & Scientist
Dimitrios est un ingénieur principal en informatique et informaticien titulaire d'un doctorat en neuroscience mathématique de l'Université Rockefeller.
Il se spécialise dans les réseaux neuronaux, la modélisation des données et les systèmes dynamiques, avec une vaste expertise dans le développement de ETL. la modélisation des données cliniques et le traitement de données à grande échelle dans les secteurs des soins de santé, des sciences de la vie et de l’IA.
Il a fourni des solutions de données complexes pour des organismes de premier plan, dont SAP, EPAM (Odysseus Inc. , et Femtec Health, construisant des pipelines de données évolutifs sur Databricks, AWS et Snowflake, et mettant en œuvre des modèles prédictifs pour améliorer les résultats des soins de santé.
Avec un mélange unique de rigueur scientifique et de précision d'ingénierie, Dimitrios traduit la théorie avancée en systèmes de données intelligents et prêts à la production.
Principale expertise
- Python 8 ans

- SQL 8 ans

- Data Science 8 ans
Autres compétences
- R (programming language) 4 ans

- Machine Learning 4 ans

- Matlab 3 ans

Expérience sélectionnée
Emploi
Senior Data Engineer / ETL Developer
Odysseus Inc (part of EPAM Systems) - 2 années 11 mois
- Conduire le développement et l'optimisation des pipelines ETL qui ont transformé les données des soins de santé en un modèle commun de données (CDM) OMOP pour de multiples clients mondiaux.
- Des solutions d’architecture de données conçues et mises en œuvre pour améliorer l’évolutivité et la maintenabilité des environnements distribués.
- Collaboré avec des analystes et des chercheurs de données pour assurer la qualité, la validation et la normalisation des données pour les cas d'utilisation de la recherche clinique.
- Amélioration des bibliothèques d'orchestration ETL Python existantes, contribuant à l'amélioration des performances et de la fiabilité.
- Travaillé avec Databricks, Snowflake, Spark, Hadoop, AWS et Azure Data Factory pour construire des pipelines automatisés d'ingestion de données.
- Processus de déploiement, contrôle de versions et flux de travail CI/CD pris en charge en utilisant Bitbucket et des environnements conteneurs.
Les technologies:
- Les technologies:
AWS
Databricks
Python
SQL
Azure Data Factory
Bitbucket
- Data Analytics
Snowflake
ETL
Hadoop
Senior Data Scientist
Femtec Health - 2 années 6 mois
- Établi et dirigé par l’équipe de science des données de Femtec composée de quatre, définissant la direction technique et le mentorat des informaticiens.
- Conception de processus ETL à grande échelle pour intégrer et harmoniser les données relatives aux demandes de soins de santé provenant de multiples sources américaines dans le CDM OMOP.
- Conçu et mis en œuvre des modèles prédictifs pour la détection précoce des conditions gynécologiques à l’aide de Spark, Redshift et AWS EMR.
- Appliqué des frameworks OHDSI pour la formation de modèles et la validation externe entre les jeux de données avec diverses normes médicales de codage.
- Des algorithmes d’apprentissage automatique développés (Forêt de Random Lasso, Crête, Boost de dégradés, Bayes de Nai ve, KNN) et des modèles non supervisés pour le regroupement de données microbiomes.
- Construire des tableaux de bord interactifs et des visualisations à l'aide de Seaborn, Plotly, et Cufflinks pour les rapports exécutifs.
Les technologies:
- Les technologies:
Docker
AWS
Python
SQL
R (programming language)
Scikit-learn
- Data Analytics
ETL
Machine Learning
Plotly
Redshift
PySpark
Seaborn
AWS EMR
Senior Data Scientist
Vivante Health (Cylinder) - 8 mois
- Développer des modèles de prédictions et de classification pour les affections gastro-intestinales en utilisant des données d’allégations et d’usures.
- Des pipelines de données construits et optimisés dans GCP et BigQuery, assurant une ingestion sécurisée et efficace des dossiers médicaux.
- Collaboré sur l'ingénierie de fonctionnalités, la validation de modèles et déployé les modèles Google Cloud AI- dans les systèmes de production.
- A contribué à la création de pipelines de données cliniques automatisés utilisant Python, SQL et Apache Spark.
Les technologies:
- Les technologies:
Apache Spark
Python
SQL
Google Cloud
Pandas
BigQuery
- Data Analytics
Machine Learning
Research Assistant
The Rockefeller University - 6 années 6 mois
- Doctorat en Neuroscience mathématique, modélisation de la dynamique du réseau neuronal en utilisant des systèmes non linéaires et des processus stochastiques.
- Propose un cadre mathématique pour la dynamique neuronale adaptative auto-reconfigurable, qui a été publié dans Journal of Statistical Physics (2017).
- Développer des modèles de réseau neuronal qui simulent les calculs dépendants de l'entrée dans le cortex visuel et la propagation des ondes non linéaires dans la cochlée.
- Analyse des enregistrements ECoG à grande échelle et multi-électrode, en appliquant des techniques de modélisation statistique et informatique avancées.
- Authored multiple publications in peer-reviewed Journals and Contributed to theoretical neuroscience research communities.
Les technologies:
- Les technologies:
Python
TensorFlow
Keras
Matlab
- Neural Network
Éducation
DoctoratMathematical Neuroscience
The Rockefeller University · 2014 - 2019
Maîtrise ès sciencesMathematics
Brown University · 2010 - 2012
License ès sciencesMathematics
National and Kapodistrian University of Athens · 2004 - 2008
Trouvez votre prochain développeur en quelques jours et non sur plusieurs mois
Dans un court appel de 25 minutes, nous voulons:
- Comprendre vos besoins en développement
- Vous expliquez comment nous allons vous mettre en relation avec le développeur le mieux qualifié pour votre projet, sélectionné avec soin
- Vous indiquez nos prochaines démarches afin de vous trouver le meilleur développeur, souvent en moins d'une semaine
