Du-CBA: Data Unaware And Incremental Classification-Based Association Rules Extraction Architecture (Federated Learning)


Arş. Gör. BÜŞRA BÜYÜKTANIR

Tez Türü: Yüksek Lisans

Tezin Yürütüldüğü Kurum: Marmara Üniversitesi, Fen Bilimleri Enstitüsü, Bilgisayar Mühendisliği Anabilim Dalı, Türkiye

Tez Danışmanı: Doç. Dr. Kazım Yıldız ; Dr. Öğr. Üyesi Eyüp Emre Ülkü

Tezin Onay Tarihi: 2022

Tezin Dili: Türkçe

Özet:

Günümüzde nesnelerin interneti, mobil uygulamalar gibi hayatımızı kolaylaştıran, istemcilerin ve sunucuların birlikte çalışması gereken sistemlerin kullanımı artmıştır. Bu alanlarda makine öğrenmesi modeli kullanılması ihtiyaç haline gelmiştir. Ancak istemcilerden verilerin toplanması, sunucuya aktarılması, makine öğrenmesi modeli eğitilmesi ve ardından bu modelin istemcilerde çalışan cihazlara entegre edilmesi bir çok problemi beraberinde getirmektedir. Verilerin istemcilerden sunucuya transferi ağ trafiğine sebep olmakta ve fazla enerji gerektirmektedir. Veriler içerisinde kişisel veriler yer almaktadır. Transfer sırasında kişisel verilerin aktarılması veri mahremiyetini istismar edilebilmektedir. Veri mahremiyetini sağlamak için veri paylaşımının yapılmaması ise veri çeşitliliğini ve büyüklüğünü azalttığından dolayı sunucuda geliştirilecek modelin doğru sonuç vermemesine sebep olmakta, verimliliğini düşürmekte ve bu alandaki makine öğrenmesi çalışmalarını kısıtlamaktadır.

 

Tez çalışması kapsamında bahsedilen bu problemlere çözüm üretmek için federe öğrenme mimarisi kullanılmaktadır.  Mimariye göre her bir istemci, kendi verilerini kullanılarak yerel bir makine öğrenmesi modeli eğitmektedir. Eğitilen modeller sunucuya gönderilmekte ve sunucuda bu modeller birleştirilerek yeni bir model oluşturulmaktadır. Oluşturulan nihai model tekrar istemcilere dağıtılmaktadır. Bu sayede ağ trafiği azaltılmakta, enerji ihtiyacı düşürülmektedir. Veri mahremiyeti ise, bütün veriler yerine tek başına anlamsız olan veriler gönderildiği için korunmaktadır.

 

Federe öğrenme mimarisi güncel ve geliştirilmeye açık bir alandır. Bu alanda geliştirilecek algoritmalara ihtiyaç duyulmaktadır. Bu çalışmada Veriden Habersiz İlişkili Kurallara Dayalı Sınıflandırma (Data Unaware Classification Based on Association, du-CBA) olarak adlandırılan algoritma geliştirilmiştir. Algoritma federe öğrenme mimarisi için geliştirilmiş ilişkisel sınıflandırma algoritmasıdır. Federe öğrenme ile klasik öğrenme mimarilerini karşılaştırıp başarılarını ölçmek için çalışma kapsamında bir simülasyon ortamı oluşturulmuştur. Simülasyonda du-CBA ve CBA algoritmaları kullanılarak modeller eğitilmiş ve sonuçlar kıyaslanmıştır. Modellerin eğitiminde University of California Irvine (UCI) veri havuzundan alınan beş veri seti kullanılmıştır.

Deneysel sonuçlar ayrı ayrı her bir veri seti için federe öğrenme ile eğitilen modelin, klasik öğrenme ile eğitilen modelle neredeyse aynı doğruluğu elde ettiğini göstermiştir. Model federe öğrenme yöntemi ile eğitildiğinde, eğitim süresinin yaklaşık olarak %70 oranında azaldığı ortaya çıkmıştır. Böylece federe öğrenme mimarisini kullanacak cihazlarda enerji ihtiyacının düştüğü sonucuna varılmaktadır. Ayrıca veri yerine eğitilmiş model merkeze gönderildiği için hem veri mahremiyeti sağlanmış hem de ağ trafiği kayda değer şekilde azalmıştır. Deneysel sonuçlar geliştirilen algoritmanın başarılı sonuçlar ürettiğini göstermektedir.