KARAR AĞACI ALGORİTMALARI VE ÇOCUK İŞÇİLİĞİ ÜZERİNE BİR UYGULAMA


Tezin Türü: Yüksek Lisans

Tezin Yürütüldüğü Kurum: Marmara Üniversitesi, İktisat Fakültesi, Ekonometri Bölümü, Türkiye

Tezin Onay Tarihi: 2019

Tezin Dili: Türkçe

Öğrenci: ŞEYDA DEMİREL

Danışman: SELAY GİRAY YAKUT

Özet:

Çocuk işçiliği tüm dünyanın karşı karşıya olduğu ciddi bir sorundur. Çocuklar başta yoksulluk olmak üzere birçok nedenden dolayı çalışmak zorunda kalmaktadırlar. Çocuğun çalışma hayatına girmesi, okuldan uzaklaşarak vasıfsız işçi olması anlamına gelmektedir. Bu çalışmanın amacı çocuk işçiliğine neden olan çeşitli faktörlerin veri madenciliği yöntemlerinden biri olan karar ağaçları ile belirlenmesidir. Çalışmada kullanılan veri seti 114 ülkeden oluşmaktadır. İlgili ülkeler ve çalışma kapsamındaki değişkenler belirlenirken literatür taraması ve kayıp gözlemlerin en aza indirilmesi hususları gözönünde bulundurulmuştur. Veriler Dünya Bankası'ndan elde edilmiş olup eksik veriler ILO, UNİCEF, OECD, TÜİK‘den derlenmiştir. Uygulamada mevcut olan en güncel veriler ele alınmıştır. Analiz uygulamaları SPSS 22 paket programı kullanılarak gerçekleştirilmiştir. Veri madenciliği, veriler arasında gizli kalmış ilişkileri ortaya çıkaran ve bu bilgiler ışığında geleceğe dönük tahmin yapmaya imkan sağlayan dinamik bir süreç şeklinde tanımlanabilir. Karar ağaçları yöntemi ise anlaşılabilir kurallar oluşturması, yorumlanmasının kolay olması, farklı değişken tipleri için kullanılabilmesi nedeniyle kullanım alanı en yaygın olan başlıca veri madenciliği yöntemlerinden biridir. Çalışma kapsamında çocuk işçi oranı üzerinde etkili olabilecek değişkenlerin belirlenmesinde CART ve CHAID algoritmalarından yararlanılmıştır. Algoritmalara göre çıkan sonuçlar karşılaştırmalı olarak yorumlanmıştır. -------------------- Child labor is a serious problem faced by the whole world. Children are forced to work for many reasons, especially because of poverty. When children start working at different jobs, this means that they drop out of the school and become unskilled workers. In this sense, the main purpose of this study is to determine the various factors causing child labor through the data mining method of decision trees. The data set used in the study was collected from 114 countries and the literature review and the minimization of missing observations were taken into consideration when determining the relevant countries and variables. The research data were obtained from the World Bank and the missing data were collected from ILO, UNICEF, OECD, and TurkStat. The latest data available in the databases were analyzed. The analysis of the research data was performed using SPSS 22 package software. Data mining is a dynamic process that explores the hidden relationships among the data and enables predictions in the light of this information. The decision trees method, on the other hand, is one of the most common methods of data mining because it creates understandable rules and is easy to interpret and can be used for different types of variables. In this study, CART and CHAID algorithms were used to determine the variables that could be effective on the child labor rate. The results obtained by the algorithms were interpreted comparatively.