Oscar C.

Data Engineer

Oscar ist ein hochspezialisierter Senior Data Engineer mit 13 Jahren Berufserfahrung. Er hat in verschiedenen Branchen wie AdTech, FinTech, HealthTech und Unternehmenssoftware gearbeitet und dabei sein Fachwissen in verschiedenen Bereichen unter Beweis gestellt.

Oscar hat sowohl in den USA als auch in den Niederlanden wertvolle Erfahrungen gesammelt. Zu seinen technischen Fähigkeiten gehört der Einsatz von Golang, Python, BigQuery, Apache Spark auf Databricks (AWS) und Scala zur Erstellung robuster Softwaresysteme.

Einer von Oscars stolzesten Erfolgen war die Entwicklung einer patentierten Idee beim USPTO, die er erfolgreich auf den Markt brachte. Dieses Projekt ist ein Beispiel für seine Innovationskraft und seine Fähigkeit, die Kluft zwischen Konzept und Vermarktung zu überbrücken.

Zusätzlich zu seinem technischen Fachwissen hat Oscar im Laufe seiner Karriere außergewöhnliche Fähigkeiten als Teamleiter bewiesen, was seine Fähigkeit unterstreicht, bei komplexen Projekten hochwertige Ergebnisse zu erzielen.

Hauptkompetenz

  • Apache Spark
    Apache Spark 10 Jahre
  • AWS
    AWS 10 Jahre
  • BigQuery
    BigQuery 5 Jahre

Andere Fähigkeiten

  • MySQL
    MySQL 13 Jahre
  • PostgreSQL
    PostgreSQL 13 Jahre
  • ETL
    ETL 11 Jahre
Oscar

Oscar C.

Guatemala

Erste Schritte

Ausgewählte Erfahrung

Beschäftigung

  • Senior MLOps Engineer

    Sago Mini - 2 monate

    • Promoting Machine Learning models to Production on GCP

    Technologien:

    • Technologien:
    • Python Python
    • Vertex AI Vertex AI
  • Tech Lead / MLOps & Optimization Platform

    Occidental Petroleum (Oxy) - 4 monate

    Summary: Led design and delivery of Oxy’s Optimization Pillar MLOps platform in AWS ● Designed and implemented MLOps platform integrating AWS (S3, ECS/Fargate, SageMaker, Lambda) with Oxy’s ODAP Lakehouse ● Packaged and deployed Python optimization models (Gurobi/Pyomo) with CI/CD pipelines in Azure DevOps + MLflow ● Built PySpark ingestion pipelines from Kabal APIs, SQL Server, and PI systems into ODAP, ensuring governance and schema validation ● Collaborated with data scientists and IT to enable predictive maintenance and vessel scheduling optimization use cases ● Mentored engineers and defined role skill matrices across MLOps, DevOps, Backend, and QA

    Technologien:

    • Technologien:
    • AWS AWS
    • Python Python
    • Machine Learning Machine Learning
  • Senior Backend Developer

    Reddit - 5 monate

    Summary: Backend development in Golang and Python ● Developed new integrations with Notification Platform to send emails to 300k+ users ● Implemented concurrency in email send increasing performance by 98% ● Implemented Spam filters in email send increasing performance further by 46% ● Developed client support for Business Experiences team to tap into Notification Platform, making progress towards goal of deprecating integrations with legacy Mailroom messaging. ● Code reviews and various team activities

    Technologien:

    • Technologien:
    • Golang Golang
    • Apache Kafka Apache Kafka
  • Senior Data Engineer

    Curinos - 8 monate

    • Led data product development on the Databricks Lakehouse platform, ensuring efficient data handling and analysis;

    • Migrated data from MySQL and PostgreSQL databases using AWS Database Migration Service (DMS) to streamline data management;

    • Developed Data Pipelines using Delta Live Tables (DLT) for real-time and batch processing of data;

    • Created a Code Generation tool to automatically generate Scala code for Databricks, enhancing development speed and accuracy;

    • Proficient in Databricks, Scala, and Python, with a strong focus on scalable data engineering solutions.

    Technologien:

    • Technologien:
    • MySQL MySQL
    • PostgreSQL PostgreSQL
    • AWS AWS
    • Databricks Databricks
    • Python Python
    • Scala Scala
    • Data Engineering
  • Senior Data Engineer

    Clevertech - 2 jahre 11 monate

    • Developed a Reporting API for analyzing large-scale advertising campaigns (Golang, BigQuery)
    • Created an Advanced Query Tool in Golang for complex SQL queries, reducing processing time by 50%
    • Implemented Data Modeling for forecasting TV Ads performance to extrapolate impressions, increasing revenue by 20%
    • Debugged and improved complex queries in BigQuery, reducing overall query complexity
    • Enhanced collaboration with the Data Science team by serving as an interface with the Backend team

    Technologien:

    • Technologien:
    • Golang Golang
    • SQL SQL
    • Data Engineering
    • BigQuery BigQuery
  • Co-Founder and CTO

    Sciencesheet - 1 jahr 8 monate

    • Developed Codegen for ML pipelines (Spark, Scala, Python), accelerating data science processes by 10x
    • Invented and patented Codegen technology for processing millions of spreadsheet rows in Spark using Excel formulas
    • Launched a startup from idea to market within one year
    • Increased market reach by developing plugins for Google Sheets and Microsoft Excel
    • Successfully developed the AWS Backend using Sagemaker Autopilot, Lambda, EC2, SNS, and SES

    Technologien:

    • Technologien:
    • AWS AWS
    • Python Python
    • AWS Lambda AWS Lambda
    • Scala Scala
    • AWS EC2 AWS EC2
    • Hadoop Hadoop
    • Microsoft Excel Microsoft Excel
  • Data Scientist / Engineering Manager

    PayPal (Xoom) - 3 jahre 9 monate

    • Tech Lead for Data Science and Engineering team (Spark, Scala, Python)
    • Managed a team of five data scientists and data engineers
    • Developed a Locations indexer, doubling the speed of finding bank branches in India
    • Increased market coverage for the Sendmoney product by supporting FP&A analyses in Spark instead of Excel
    • Enhanced the effective reach of push notifications by 20% through segmentation analyses in Spark

    Technologien:

    • Technologien:
    • Apache Spark Apache Spark
    • Python Python
    • Scala Scala
    • Data Engineering
    • Team Leading
    • Microsoft Excel Microsoft Excel
  • Cloud Engineer

    Mendix - 3 jahre 5 monate

    • Developed the Mendix Cloud platform using a Mendix code generation tool, streamlining the development process;

    • Architected robust security protocols for the Mendix Enterprise Cloud Platform, ensuring data protection and compliance;

    • Automated parallel firewall installation and configuration across thousands of cloud nodes, enhancing security and operational efficiency;

    • Reverse-engineered Mendix code generation to reproduce applications using the open-source WebDSL language, expanding platform versatility and open-source integration.

    Technologien:

    • Technologien:
    • AWS AWS
    • Python Python
    • Data Engineering
  • Summer Intern

    Google - 3 monate

    • Conducted data mining on a Git repository containing 70 Apache projects, extracting valuable insights for analysis;

    • Presented the project findings at ApacheCon US in Atlanta, showcasing expertise and contributing to the open-source community.

    Technologien:

    • Technologien:
    • Apache Spark Apache Spark
    • Data Engineering
    • Git Git

Ausbildung

  • MSc.Computer Science

    Delft University of Technology · 2009 - 2011

  • MSc.Management and Technology

    Delft University of Technology · 2007 - 2009

  • MSc.Management and Technology

    Delft University of Technology · 2007 - 2009

  • BSc.Computer Science

    Universidad Francisco Marroquín · 1997 - 2002

Finden Sie Ihren nächsten Entwickler innerhalb von Tagen, nicht Monaten

In einem kurzen 25-minütigen Gespräch würden wir gerne:

  • Auf Ihren Bedarf bezüglich des Recruitments von Software-Entwicklern eingehen
  • Unseren Prozess vorstellen und somit wie wir Sie mit talentierten und geprüften Kandidaten aus unserem Netzwerk zusammenbringen können
  • Die nächsten Schritte besprechen, um den richtigen Kandidaten zu finden - oft in weniger als einer Woche

Unterhalten wir uns