Tez Türü: Yüksek Lisans
Tezin Yürütüldüğü Kurum: Marmara Üniversitesi, Fen Bilimleri Enstitüsü, Bilgisayar Mühendisliği Anabilim Dalı, Türkiye
Tez Danışmanı: Doç. Dr. Kazım Yıldız ; Dr. Öğr. Üyesi Eyüp Emre Ülkü
Tezin Onay Tarihi: 2022
Tezin Dili: Türkçe
Özet:
Günümüzde
nesnelerin interneti, mobil uygulamalar gibi hayatımızı kolaylaştıran,
istemcilerin ve sunucuların birlikte çalışması gereken sistemlerin kullanımı
artmıştır. Bu alanlarda makine öğrenmesi modeli kullanılması ihtiyaç haline
gelmiştir. Ancak istemcilerden verilerin toplanması, sunucuya aktarılması,
makine öğrenmesi modeli eğitilmesi ve ardından bu modelin istemcilerde çalışan
cihazlara entegre edilmesi bir çok problemi beraberinde getirmektedir.
Verilerin istemcilerden sunucuya transferi ağ trafiğine sebep olmakta ve fazla
enerji gerektirmektedir. Veriler içerisinde kişisel veriler yer almaktadır.
Transfer sırasında kişisel verilerin aktarılması veri mahremiyetini istismar
edilebilmektedir. Veri mahremiyetini sağlamak için veri paylaşımının yapılmaması
ise veri çeşitliliğini ve büyüklüğünü azalttığından dolayı sunucuda
geliştirilecek modelin doğru sonuç vermemesine sebep olmakta, verimliliğini
düşürmekte ve bu alandaki makine öğrenmesi çalışmalarını kısıtlamaktadır.
Tez çalışması
kapsamında bahsedilen bu problemlere çözüm üretmek için federe öğrenme mimarisi
kullanılmaktadır. Mimariye göre her bir
istemci, kendi verilerini kullanılarak yerel bir makine öğrenmesi modeli
eğitmektedir. Eğitilen modeller sunucuya gönderilmekte ve sunucuda bu modeller
birleştirilerek yeni bir model oluşturulmaktadır. Oluşturulan nihai model
tekrar istemcilere dağıtılmaktadır. Bu sayede ağ trafiği azaltılmakta, enerji
ihtiyacı düşürülmektedir. Veri mahremiyeti ise, bütün veriler yerine tek başına
anlamsız olan veriler gönderildiği için korunmaktadır.
Federe öğrenme
mimarisi güncel ve geliştirilmeye açık bir alandır. Bu alanda geliştirilecek
algoritmalara ihtiyaç duyulmaktadır. Bu çalışmada Veriden Habersiz İlişkili
Kurallara Dayalı Sınıflandırma (Data Unaware Classification Based on
Association, du-CBA) olarak adlandırılan algoritma geliştirilmiştir. Algoritma federe öğrenme
mimarisi için geliştirilmiş ilişkisel sınıflandırma algoritmasıdır. Federe
öğrenme ile klasik öğrenme mimarilerini karşılaştırıp başarılarını ölçmek için
çalışma kapsamında bir simülasyon ortamı oluşturulmuştur. Simülasyonda du-CBA
ve CBA algoritmaları kullanılarak modeller eğitilmiş ve sonuçlar kıyaslanmıştır.
Modellerin eğitiminde University of California Irvine (UCI) veri havuzundan
alınan beş veri seti kullanılmıştır.
Deneysel
sonuçlar ayrı ayrı her bir veri seti için federe öğrenme ile eğitilen modelin, klasik
öğrenme ile eğitilen modelle neredeyse aynı doğruluğu elde ettiğini göstermiştir.
Model federe öğrenme yöntemi ile eğitildiğinde, eğitim süresinin yaklaşık olarak %70 oranında azaldığı ortaya
çıkmıştır. Böylece federe öğrenme mimarisini kullanacak cihazlarda enerji
ihtiyacının düştüğü sonucuna varılmaktadır. Ayrıca veri yerine eğitilmiş model
merkeze gönderildiği için hem veri mahremiyeti sağlanmış hem de ağ trafiği
kayda değer şekilde azalmıştır. Deneysel sonuçlar geliştirilen algoritmanın başarılı
sonuçlar ürettiğini göstermektedir.