Sosyal medya analitiği ile siber zorbalık tespiti


Tezin Türü: Yüksek Lisans

Tezin Yürütüldüğü Kurum: Marmara Üniversitesi, Fen Bilimleri Enstitüsü, Siber Güvenlik Anabilim Dalı, Türkiye

Tezin Onay Tarihi: 2021

Tezin Dili: Türkçe

Öğrenci: FURKAN ZAHİT ATAY

Danışman: Hüseyin Yüce

Özet:

Veri madenciliği konusu günümüzde yapay zekâ ile makine öğrenmesi konularıyla da birleşerek gelişmeye devam eden bir konu haline gelmiştir. Bu alan için çeşitli yazılımlar da yapılmaktadır. Metin madenciliği (text mining) konusu da buna ek olarak ayrıca gelişen konulardandır.

Günümüzde sosyal medya kullanımının çok yaygın hâle gelmiş olması da metin madenciliği uygulamalarının bu alan üzerinde yapılmasını beraberinde getirmiştir. Özellikle de Twitter’da metin yoluyla insanların duygu, fikir ve görüşlerini paylaşması sebebiyle Duygu Analizi çalışmaları yine Twitter üzerinde yoğunlaşmıştır.

Her gün milyonlarca mesaj paylaşılan sosyal medyadaki mesajın okunup analiz edilmesi ve buralardaki siber zorbalıkların insan eliyle tespit edilmesi neredeyse mümkün değildir. Bu nedenle siber zorbalıkların yapay zekâ yardımıyla tespit edilmesi ve zararlı mesajların yaygınlaşmadan ilgililerce gerekli müdahalelerin yapılması önemlidir. Bu yüzden bu çalışmada siber zorbalık içeren tweetlerin yapay zeka destekli algoritmalarla tespit edilip bu mesajları paylaşan hesapların otomatik olarak belirlenmesine sağlayan bir sistemin geliştirilmesi amaçlanmıştır. Bu çalışmayı yapabilmek için öncelikle Twitter’da yüksek takipçi ve etkileşime sahip hesaplardan oluşan bir “Hedef Liste” oluşturulmuştur. Bu listedeki hesaplara atılan tweetler toplanmıştır. Siber zorbalık tespitlerini yapabilen makine öğrenmesi modelini oluşturabilmek için elde ettiğimiz bu veri seti kullanılmıştır.

Bölüm 1’de giriş yaptığımız bu çalışmada Bölüm 2’de literatür araştırması yapılmıştır. Bölüm 3’de kavramların genel tanımlarının yapılması ve sosyal medya analitiği çalışmalarının hangi alanlarda yapıldığından bahsedilmiştir. Bölüm 4’de ise kullandığımız çalışmamızdaki materyal ve yöntem ele alınmıştır. Çalışmayı yaparken bir veri madenciliği ve makine öğrenmesi uygulaması olan RapidMiner Studio uygulaması kullanılmıştır. Bölüm 5’de ise çalışmamızdan elde ettiğimiz bulgulardan bahsedilmiştir. Son bölümde sonuçlardan bahsedilerek çalışma tamamlanmıştır.