Özellik Seçimli Tip 1 Bulanık Fonksiyonlar


Tak N. (Yürütücü), Eğrioğlu E.

TÜBİTAK Projesi, 2024 - 2026

  • Proje Türü: TÜBİTAK Projesi
  • Başlama Tarihi: Şubat 2024
  • Bitiş Tarihi: Şubat 2026

Proje Özeti

Gelişen teknoloji ve dijitalleşme ile elde edilen veri setleri karmaşık ve büyük boyutlu bir hal almıştır. Bu tip veri setleri ile modelleme yapılırken hantal yapı ve aşırı öğrenme gibi sorunlar ortaya çıkabilmektedir. Bazı modeller belli başlı varsayımlar altında çok etkin ve hızlı bir şekilde çalışırken, bazı modeller varsayımlardan bağımsız bir şekilde ciddi hesaplamalar yaparak çalışır. Büyük veride bulunan ilişkili özellikler, klasik modeller için varsayımların ihlal edilmesine olanak sağlayabilirken, ileri/alternatif modeller için ise aşırı öğrenme ve hantal yapı sorunlarına neden olabilir. Bu sorunlar özellik seçimi veya boyut indirgeme yöntemleri ile aşılmaya çalışılır. Özellik seçimi, diğer bir deyişle istatistiksel olarak modele katkısı olmayan özelliklerin eliminasyonu, makine öğrenmesi yöntemlerinde günümüzde önemli bir yere sahiptir. Bu çalışmada, tip 1 bulanık fonksiyonlar yönteminin performansının önerilecek yeni bir özellik seçimi yöntemi ile arttırılması amaçlanmaktadır. Tip 1 bulanık fonksiyonlar yöntemi model çözümlemesi aşamasında en küçük kareler yöntemini kullanması ve çok sayıda hesaplamalar yapması bakımından karmaşık yapılı veriler için yukarıda bahsedilen sorunları içerisinde barındırmaktadır. Hem en küçük kareler yönteminin varsayımlarını gerektirmemesi hem de aşırı öğrenme ve hantal yapı sorunlarını gidermesi bakımından bu projede önerilen yöntem özgün bir değere sahiptir. Önerilecek olan yöntem, veri setinde bulunan değişkenlerin kümelenmesi ve bu kümeleri en iyi temsil eden özelliklerin seçilmesi mantığına dayanmaktadır. Planlanan proje kapsamında bahsi geçen özellik seçimi yöntemi, literatürde var olan (i) k-ortamalar, (ii) bulanık c-ortalamalar, (iii) sezgisel bulanık ve (iv) olabilirlik bulanık kümeleme yöntemleri ile değerlendirilip önerilecektir. Ayrıca tip 1 bulanık fonksiyonlar yöntemi hem zaman serisi hem de kesit verilerine uygun bir model olması bakımından, farklı disiplinlerdeki araştırmacılar için daha iyi sonuçlar veren alternatif bir yöntem olacaktır. 

 

Tip 1 bulanık fonksiyonlar yöntemi ülkemizde ve dünyada çok yaygın olarak çalışılan bir konu olmasa da literatürde yapılan çalışmalar bu yöntemin başarılı sonuçlar verdiğini göstermiştir. Bu nedenle, planlanan projenin ülkemizde bu alanda yapılacak çalışmaların niteliklerinin ve niceliklerinin artmasında önemli rol oynayacağı düşünülmektedir. Ayrıca bu proje, yukarıda belirtilen konu kapsamında yeni lisansüstü tezlerinin yazılmasına ve bu alanda çalışan nitelikli akademisyenlerin sayısının artmasına olanak sağlayacaktır. Bu da proje yürütücüsünün lisansüstü öğrencisi yetiştirmesine olanak sağlayacaktır. Proje kapsamında önerilecek yöntemlerin performansları hem kesit hem de zaman serileri verilerinde çeşitli enerji, iklim, sağlık ve çevre alanındaki gerçek dünya verileri ile değerlendirilecek ve literatürde var olan yöntemler (çoklu regresyon modeli) ile uygun performans kriterleri (RMSE, MAPE) kullanılarak karşılaştırılacaktır.