Sınıflandırma sorunu için en uygun değişken alt kümesi seçimi üzerine bir uygulama


Tezin Türü: Yüksek Lisans

Tezin Yürütüldüğü Kurum: Marmara Üniversitesi, İşletme Fakültesi, İşletme Bölümü, Türkiye

Tezin Onay Tarihi: 2018

Tezin Dili: Türkçe

Öğrenci: EMRAH SEZER

Danışman: ÖZGÜR ÇAKIR

Özet:

Teknolojik gelişmelerin etkisi ile kaydedilen operasyonel veriler giderek artmaktadır. Veri miktarı ve çeşitliliğindeki artış nedeni ile analiz aşamasında ve analiz sonuçlarının değerlendirilmesi aşamasında bir çok zorluk yaşanmaktadır. İlgili ve ilgisiz birçok verinin analiz aşamasına aktarılmasının sonucunda analizlerin yapılabilmesi için gerekli zaman ve kaynak gereksinimleri artmaktadır. Kaynakların ve zamanın daima sınırlı olacağı aşikardır. Bu çalışmadaki amacımız, bankacılık müşteri verisi üzerinde sınıflandırma için farklı değişken seçimi uygulamaları yaparak ilgisiz değişkenleri elemek ve sınıflandırma çalışmasına katkıda bulunmaktır. Farklı değişken seçimi yöntemleri kullanılarak seçilen değişken alt kümeleri üzerinde sınıflandırma uygulaması yapılmıştır. Sınıflandırma sonuçları karşılaştırılarak değişken seçim yöntemlerinin faydaları araştırılmıştır. ABSTRACT Recorded operational data is gradually increasing with the effect of technological developments. Due to the increase in the amount of data and its diversity, there are many difficulties in the analysis phase and in the evaluation of its results as a result of transferring many relevant and irrelevant data to the analysis stage, the time and resources required for the analysis are increased. It is obvious that resources and time will always be limited. Our aim in this study is to contribute to the study of classifying and eliminating irrelevant features by applying different feature selection methods for classification on a banking customer data. Classification is applied on the selected subsets of features using different feature selection methods. By comparing the classification results, the benefits of the feature selection methods investigated.