Türkçe Doğal Dil İşleme Girişimimiz Summarify’ı Yakından Tanımak İster misiniz?
Türkiye Açık Kaynak Platformu bünyesinde düzenlenen Açıkhack Türkçe Doğal Dil İşleme Hackathonu’nda (2019) birincilik ödülü alan Summarify ekibinden Yunus Emre Gündoğmuş henüz 22 yaşında tepe yönetici olan genç bir veri bilimci.
Karmaşık sistemler, yapay zeka ve veri bilimi üzerine çalışmalarıyla tanınan akademisyen Uzay Çetin liderliğinde kurulan Summarify ekibi, geliştirdikleri projeyi ‘’Kullanıcıların NLP ile ilgili tüm sorunlarını çözmek için çok çeşitli en güncel algoritmaları ve araçları kullanan Türkçe NLP’nin İsviçre çakısı’’ olarak tanımlıyor.
Marmara Üniversitesi İstatistik Bölümü mezunu Yunus Emre Gündoğmuş henüz 22 yaşındayken yönetici koltuğuna oturmuş bir veri bilimci. Karmaşık sistemler, yapay zeka ve veri bilimi üzerine çalışmalarıyla tanınan akademisyen Uzay Çetin ile Gündoğmuş’un yolu Sarıyer Akademi’de, Uzay Çetin‘in düzenlediği Yapay Zeka eğitim programında kesişiyor.
Yunus Emre Gündoğmuş ataklığı, merakı ve heyecanı ile önce Uzay hocanın asistanı oluyor. Bu yol arkadaşlığı Yunus Emre için Summarify projesinde kurucu ortaklığa evriliyor. Gündoğmuş halen Uzay Çetin ile birlikte şirketin yöneticiliğini üstlenmekte. Bilgi Üniversitesi’nde akademisyen olarak görev yapan Çetin’in liderliğinde kurulan ekipte, Yunus Emre Gündoğmuş’un yanı sıra Hasan Kemik, Murat Cebeci, Feyza Zeynep Salam, Mehmet Ali Özer ve Büşra Gökmen yer alıyor.
Summarify kurulmadan önce Koç Finans’ta veri bilimci olarak çalışan Yunus Emre Gündoğmuş, Türkiye Açık Kaynak Platformu bünyesinde düzenlenen Açıkhack Türkçe Doğal Dil İşleme Hackathon’unda birincilik ödülünü alan ve Bilişim Vadisi’nde bir yıllık ofis kazanan Summarify girişimini anlattı.
Aynı zamanda Uzay Çetin’in yürütücülüğünde, TÜBİTAK 1512 sürecinde 3289 başvuru arasından destek almaya hak kazanan 144 girişimden biri olan Summarify, Metin Özetleme ve Doğal Dil İşleme alanında farklı ihtiyaçlara yönelik ürün paketleri ve hizmetler sunuyor.
Summarify neler yapıyor?
Veri bilimi, yapay öğrenme ve derin öğrenme tekniklerini kullanarak metin özetleme, sınıflandırma ve metin analizi bazlı ürünler geliştiren Summarify temelde metin/belge özetleme ve özel arşivleme hizmetleri içeren bir NLP servisi. Mevcut ve en güncel yapay zeka, derin öğrenme yöntemlerini kullanarak geliştirilen algoritmaları içeriyor.
Söz konusu yöntemleri kullanarak Summarify tarafından oluşturulan dört ana ürün bulunuyor. Bu ürünlerden SumSocial, kullanıcılarına kapsamlı bir sosyal medya analizi sunarken, SumDoc, yasal bir süreci takip etmek istediğinizde, bilimsel araştırma yaparken, tez yazarken ya da herhangi bir dokümana ulaşmanız gerektiğinde aradığınız bilgilere kısa sürede ulaşmanızı sağlayan bir arşiv hizmeti sağlıyor.
Summarify tarafından geliştirilen SumAPI ürünü ise Geliştiricilere ve Türkçe doğal dil işleme projesi geliştirmek isteyen şirketlere özel Türkçe Doğal Dil İşleme Servisi sağlıyor.
SumNews adlı ürün ise yoğun iş hayatının koşuşturmacasında gündemi takip etmekte zorlananlar için gün içindeki önemli gelişmeleri özetliyor. Kullanıcı, 15–30–45 saniyelik özetler ile her bir haberi ne kadar ayrıntılı dinleyeceğini kendisi belirleyebiliyor.
Covid-19’da sosyal medyada en uzun dikkat süresi 4 gün oldu
Summarify’ın çarpıcı çalışmalarından biri de SumSocial ürünü çerçevesinde, geçtiğimiz Mart ayında hazırladıkları Covid-19 Sosyal Medya Durum Analizi oldu. Türkçe atılmış toplam 1.136.548 tweet’i inceleyerek sosyal medyanın Covid-19 ile ilgili nabzını tutan bu çalışmanın çarpıcı sonuçlarından biri de gündem yaratan sosyal bir konuya Twitter’da toplumun dikkat süresinin 4 gün olduğu verisiydi.
Yunus Emre Gündoğmuş ile Summarify projesi ve açık kaynak kültürü üzerine konuştuk.
Öncelikle Summarify nasıl doğdu ?
Uzay Çetin hocayla Sarıyer Akademi’de düzenlenen eğitim programında tanıştık. O sırada Marmara Üniversitesi’nde 1.sınıf öğrencisi olarak İstatistik okuyordum. Yapay zeka temelinde istatistik olan bir alan olduğu için kendimi geliştirmek için büyük bir istek ve heyecan duyuyordum. Uzay hoca bana çok önemli bir fırsat sundu. Önce asistanı daha sonra ortağı oldum ve şimdi de şirketimizde yönetici pozisyonuna ulaştım.
‘’Sosyal medya takibi ve analizine odaklandık’’
Açıkhack yarışmasında Türkçe Doğal Dil İşleme’de birincilik ödülüyle birlikte önemli bir yatırım da aldınız. Bu yatırımı değerlendirme konusunda planlarınız neler?
Summarify‘ın TÜBİTAK’tan ve ayrıca başka yatırımcılardan aldığı desteklerle öncelikli olarak geliştirdiğimiz ürünlerden SumSocial’a odaklanmış durumdayız. Biz kurulduğumuz ilk günden itibaren uzman elinden çıkmış özetleme hizmeti sunacağız dedik ve bu süreçte dört farklı ürün geliştirdik. Son geliştirdiğimiz ürünlerden biri olan SumSocial ürününün lansmanını önümüzdeki günlerde yapmayı planlıyoruz.
Bu ürün detaylı bir sosyal medya takibi yapıyor. Aynı zamanda rakip analizi, şirketler için itibar takibi gibi içerikler geliştiriyoruz. Aldığımız desteği de ağrılıklı olarak bu ürünü geliştirmek için kullanıyoruz.
Sistemimizde Twitter, İnstagram, Facebook, Youtube, EkşiSözlük gibi platformlar var ve her geçen gün yeni platformlar sisteme ekleniyor.
Çalışmalarımızdan örnek vermek gerekirse, analiz etmek istediğiniz konuya dair anahtar kelimelerle Twitter platformunda kullanıcıların pozitif, nötr veya negatif yöndeki duygu durumunu analiz edebiliyoruz. Örneğin Marmaris yangını konusunda atılan tweetler arasında en popüler olanları gözlemliyor, en çok tweet atan kullanıcıları, bu kullanıcıların güvenirliğini ölçmek için çalışmalarımıza devam ediyoruz. Tek tıkla şikayet içerikli veya tek tıkla sadece pozitif içerikli tweetleri gözlemleyebiliyoruz.
Kurumlar veya şirketlerle ilgili rakip analizleri yapıyoruz. Ayrıca geriye dönük veriyi alıp analiz edebilmek müşterilerimize sunduğumuz önemli bir avantaj. Inhouse geliştirdiğimiz NLP modelleri kullanıyoruz. Yakın zamanda verinin belli bir kısmını açık kaynak paylaşıp makale yazmak gibi bir projemiz mevcut. Geniş etkisi olan çeşitli toplumsal olaylara dair sosyal medya takibi ve analizleri yaparak belli verileri herkese açık hale getirmek ise uzun vadede iş planımızda olmasını planladığımız bir çalışma.
Yazının devamını okumak için tıklayınız.