Dijital reklam verilerinden yararlanarak potansiyel konut alıcılarının rastgele orman yöntemiyle sınıflandırılması


Tezin Türü: Yüksek Lisans

Tezin Yürütüldüğü Kurum: Marmara Üniversitesi, İktisat Fakültesi, Ekonometri Bölümü, Türkiye

Tezin Onay Tarihi: 2019

Tezin Dili: Türkçe

Öğrenci: HAYDAR EKELİK

Danışman: DİLEK ALTAŞ

Özet:

Günümüzde internet ağlarının yaygınlaşması ve internete erişimin bir ihtiyaç haline gelmesi internet sitelerinde ve diğer dijital platformlardaki reklamların kullanılmasını yaygınlaştırmıştır. Dijital reklamcılık olarak adlandırılan bu süreç firmalar, markalar ve diğer kuruluşlar için insanlara ulaşma ve reklam amaçları doğrultusunda hedeflerini gerçekleştirmelerinde vazgeçilmez bir reklam aracı olmuştur. En önemli özelliği ölçülebilir olan dijital reklamcılık, firmalara çok geniş veriler(istatistikler) vermektedir. Firmalar bu verileri kullanıp dijital reklamların değerlendirmesini yaparak gelecek reklam planları için ön görüye sahip olurlar. Dijital reklam yayınlarından elde edilen veriler çeşitli istatistiksel yöntemlerle analiz elde edilebilir. Bu tezin amacı bir inşaat firmasının dijital reklam kampanyasından elde edilen kullanıcı verilerini kullanarak bir sınıflandırma yapmaktır. Kullanıcıların satış ofisine gelip gelmediklerinin kaydının tutulduğu veriler analiz edilerek bir sınıflandırıcı oluşturulmuştur. Bundan sonraki reklamlarla elde edilen kullanıcı verileri bu sınıflandırıcı kullanılarak sınıflandırılabilir. Böylece kullanıcıların satış ofisine gelip gelmemeleriyle ilgili bir ön bilgi elde edilir. Firma bu ön bilgi sayesinde satış ve pazarlama doğrultusundaki hedeflerini daha doğru bir şekilde belirleyebilir. Tezin amacı doğrultusunda bağımlı değişken olarak kullanıcıların satış ofisine gelip gelmemesi, bağımsız değişken olarak ise dijital reklamlar sayesinde kullanıcın iletişim bilgilerini hangi gün firma çalışanlarına gönderdiği, kullanıcının cinsiyeti, reklamı hangi sitede görüp siteye geldiği, reklamı hangi reklam alanında (doğal, 300*250 görsel boyutlu vb.) gördüğü, hangi cihazdan (bilgisayar veya telefon) gördüğü, kullanıcının daha önce ilgili firmada kayıtlı olup olmaması ve bu formu hangi amaçla doldurduğu (yatırım, ev sahibi olma vb.) olmak üzere toplamda 7 adet bağımsız değişken kullanılmıştır. Tez kapsamında, karar ağaçları algoritmaları ile birlikte topluluk öğrenme algoritmaları Rastgele Orman (Random Forset), Hızlandırma (Boosting) ve Torbalama (Bagging) algoritmaları tanıtılmış olup aralarındaki farklardan söz edilmiştir. Uygulamada R programı kullanılmış ve veriyi analiz etmek için bir topluluk öğrenme algoritması olan Rastgele Ormanlar Yöntemi kullanılmıştır. Temelinde karar ağaçları olan bu yöntem diğer sınıflandırma algoritmalarına göre daha iyi sonuçlar vermiştir. -------------------- The widespread use of internet networks and the need to access the internet has become widespread in the use of internet sites and other digital platforms. This process, which is called digital advertising, has become an indispensable advertising tool for companies, brands and other organizations to reach their goals and to realize their goals in accordance with advertising purposes. Digital advertising, the most important feature of which is measurable, gives companies very large data (statistics). Digital advertising, the most important feature of which is measurable, gives companies very large data (statistics). Firms use this data to evaluate the digital advertising and have a look to the future advertising plans. Data obtained from digital advertising publications can be analyzed by various statistical methods. The purpose of this thesis is to make a classification by using user data from a construction company's digital advertising campaign. A classifier is created by analyzing the data that the users are kept in the sales office and a classifier is created and the user data obtained with the subsequent ads can be classified using this classifier. Thus, a preliminary information can be obtained about whether the users come to the sales office. Through this preliminary information, the company will determine its targets in sales and marketing more accurately. For the purpose of the thesis, as a dependent variable, whether the users come to the sales office, as the independent variable, thanks to digital ads, the user sends which days the contact information to the employees of the company, the gender of the user, the site in which the advertisement is seen and the site in which it is advertised, in which advertisement area (native, 300*250 visual size etc.). a total of 7 independent variables were used, which were seen by the user (computer or telephone), whether the user had previously been registered in the relevant company and for which purpose he filled in this form (investment, host, etc.) Within the scope of the thesis, Random Forset, Boosting and Bagging algorithms have been introduced together with decision trees algorithms and differences between them have been mentioned In practice the R program was used and the Random Forests Method, a community learning algorithm, was used to analyze the data. This method, which is based on decision trees, yields better results than other classification algorithms.