Onur S.
Data Scientist
Onur er en dygtig Data Scientist med fire års kommerciel erfaring i it-sektoren, hvor han primært har arbejdet med Big Data, forskning, IoT, Deep Learning, Chatbots og machine learning.
Han er en dygtig problemløser, der opnår et objektivt overblik og genererer levedygtige løsninger - analytisk og velorganiseret med en solid teoretisk ingeniørmæssig og matematisk baggrund og han lærer hurtigt nye teknologier.
Han kan spille en afgørende rolle i hele projektets udviklings-/support life cycle for at sikre, at kvalitetsløsninger opfylder forretningsmålene. Desuden har han en god holdånd og er tidsorienteret.
Hovedekspertise
- Python 5 år
- Data Science 3 år
- Machine Learning 4 år
Andre færdigheder
- Data Analytics 4 år
- Git 4 år
- Linux 4 år
Udvalgt oplevelse
Beskæftigelse
Data Scientist
Pazarama, Turkey - 2 flere år 5 måneder
- Arbejde på søgemaskine med ElasticSearch og implementering af semantisk søgemetode ved hjælp af ordindlejringer.
- Bygning af dynamiske og statiske anbefalingsmotorer til kunderne, mens de handler og besøger platformen. – Trænede Sasrec- og Ssept-modeller til sekventielle anbefalinger og trænede fasttext-modeller baseret på den semantiske nærhed mellem de viste produkter og ønskelisteprodukterne.
Teknologier:
- Teknologier:
- Python
- Data Science
- Machine Learning
- NumPy
- MySQL
- ElasticSearch
Forskningsingeniør
Huawei Turkey - 1 år 1 måned
- Arbejder på at udtrække brugerintentioner fra søgeforespørgsler på Huawei App Gallery og bruger mBERT-modellen til at klassificere søgte forespørgslers kategori i tre niveauer.
- Gruppering af forespørgsler på tyrkisk, russisk og andre nødvendige sprog for at annotere dem og træne en klassifikationsmodel til at udtrække oplysninger om, hvilke kategorier brugerne søger efter, for at kunne vise bedre resultater.
- Deltog i et forskningsprojekt om emnebaseret tekstgruppering. Eksperimenter med forskellige grupperingsalgoritmer på forskellige datasæt for at evaluere og opnå et fikspunkt.
- Forskning i projektet Hierarchical Superordinate Word Representations med henblik på at forbedre ordvektorer og semantiske ligheder mellem underkategorier og overklasser.
Teknologier:
- Teknologier:
- Python
- Data Science
- Machine Learning
- NumPy
- Pandas
- Scikit-learn
- TensorFlow
- Data Analytics
Specialist i kunstig intelligens
ETIYA, Turkey - 5 måneder
- Byggede en søgemaskinetjeneste baseret på semantiske dokumenter for Akbank, en af de største banker i Tyrkiet, for at kunne nå et vilkårligt dokument i bankens database ved hjælp af ordindlejringer. Benyttede ELK stack på Docker, ElasticSearch til indeksering af data og anvendelse af funktionen cosinussimilaritet til at finde den semantiske lighed mellem søgte forespørgsler og dokumentets indhold, titel og beskrivelse.
- Trænede grupperingsmodel til anbefalingsmotor ud over at bruge ordindlejringer. Implementerede prøvebrugerlogdata og trænede word2vec-modellen med funktionerne for produkter og datoer i rækkefølge for hver kunde og repræsenterede disse funktioner med ordvektorer. Grupperede alle kunder ved hjælp af k-means-modellen for at tildele nye brugere baseret på deres produktsøgning og anbefale produkter i overensstemmelse hermed. Desuden justerede han denne model til statistisk at anbefale, når brugeren kommer for at handle efter en session, og dynamisk ved at ændre de anbefalede produkter, mens brugeren lægger produkter i sin indkøbskurv. Denne model blev udrullet og købt af Basbug Otomotiv, en af de største forretninger, der sælger bilreservedele.
Teknologier:
- Teknologier:
- Data Science
- Machine Learning
- NumPy
- Pandas
- Scikit-learn
- ElasticSearch
- Data Analytics
- Docker
Forskningsingeniør
Xinapse, South Korea - 1 år 1 måned
- Arbejdede på at opbygge et spørgsmåls- og svarsystem til engelsk og koreansk ved hjælp af BERT for at erstatte det regelbaserede system, der var blevet implementeret i virksomhedens chatbot-arkitektur;
- Oprettede en koreansk nyhedsdatacrawler fra Naver-nyhedssiden ved hjælp af EFK (ElasticSearch + Fluentd + Kibana)-stak indeni Docker-containeren;
- Implementerede en mere effektiv tokeniseringsmetode for Hangeul (koreansk) ved navn Sentencepiece, hvor oprindeligt Wordpiece-tokenisering er implementeret inden i BERT. (Udført af Korea Industrial Research Institute);
- Han byggede også en model til at forudsige erhvervscyklusindekser baseret på tidsserier af koreanske nyhedsdata for en specifik branche. Implementerede Topic Modeling med NMF, semantisk analyse af nyhedsdata, dynamisk faktormodel, latent tærskelmodel osv.
Teknologier:
- Teknologier:
- Data Science
- NumPy
- Pandas
- TensorFlow
- ElasticSearch
- Kibana
- Keras
- Selenium
- Docker
- Linux
Uddannelse
BSc.Datalogi og teknik
Kangnam University, Sydkorea · 2015 - 2019
Find din næste udvikler inden for få dage, ikke måneder
Book en 25-minutters samtale, hvor vi:
- udfører behovsafdækning med fokus på udviklingsopgaver
- Forklar vores proces, hvor vi matcher dig med kvalificerede, godkendte udviklere fra vores netværk
- beskriver de næste trin for at finde det perfekte match på få dage