METİN TABANLI TÜRKÇE İÇERİKLERİN ÇİZGE VERİ YAPISIYLA TEMSİL EDİLMESİ


Tezin Türü: Yüksek Lisans

Tezin Yürütüldüğü Kurum: Marmara Üniversitesi, Fen Bilimleri Enstitüsü, Bilgisayar Mühendisliği Anabilim Dalı, Türkiye

Tezin Onay Tarihi: 2019

Tezin Dili: Türkçe

Öğrenci: TARIK ŞAHİN

Asıl Danışman (Eş Danışmanlı Tezler İçin): Önder Demir

Eş Danışman: Kazım Yıldız

Özet:

ÖZET METİN TABANLI TÜRKÇE İÇERİKLERİN ÇİZGE VERİ YAPISIYLA TEMSİL EDİLMESİ Günümüzde gelişen internet teknolojileriyle birlikte artık insanlar daha fazla içerik üretmeye başladılar. Özellikle sosyal medya gibi araçların ve mobil cihazlardan internete erişimin yaygınlaşmasıyla üretilen içerikler devasa boyutlara ulaşmıştır. Ayrıca günümüzde iş dünyası da artık neredeyse tamamen dijitalleşmiş ve şirketlerin tamamına yakını verilerini elektronik ortamda saklar hale gelmiştir. Bunun gibi daha bir çok veri kaynağı örneği verilebilir. Veriler bu denli arttıkça, insanlar bu verilerden anlamlı bilgiler elde etme arayışına girmişlerdir. Ham olarak duran verilerden çeşitli istatistiksel veya mantıksal çıkarımlar elde etmek insan hayatını kolaylaştırmaktadır. Bu kadar devasa verilerin olduğu sistemleri analiz etmek, hatta birbirinden bağımsız sistemlerden elde edilecek verileri entegre ederek analiz etmek üzerinde yoğun olarak çalışılan bir konu haline gelmiştir. Bu çalışmada hızlı ve doğru analiz yapabilmek için metin tabanlı verilerin Neo4J veritabanında çizge yapısında saklanması sağlanmıştır. Birbirinden bağımsız farklı veri kaynaklarından elde edilen veriler tek bir veritabanında birbiriyle entegre bir şekilde saklanmıştır. İki farklı uygulama geliştirilmiş ve bu iki uygulama üzerinden yapılan metin tabanlı içerik analizlerinin sonuçları değerlendirilmiştir. -------------------- ABSTRACT REPRESENTATION OF TEXT BASED TURKISH CONTENTS WITH GRAPH DATA STRUCTURE As a result of development of internet technologies, poeple produce more contents. Especially because of development of tools like social media and growing up access to internet from mobile devices, these contents has reached enormous dimensions. In addition, nowadays, the business world is almost completely digitalized and almost all companies have stored their data electronically. Data sources examples like these can be increased. As data increased so much, people sought to derive meaningful inferences from these data. Obtaining various statistical or logical inferences from raw data makes human life easier. Analyzing the systems with such enormous data and even analyzing them by integrating the data to be obtained from independent systems has become an area of intense work. In this study, it is provided to store text based data in graph structure in Neo4J database for fast and accurate analysis. Data from different independent data sources are stored in a single database. Two different applications were developed and the results of the text-based content analyzes were evaluated.