Avrupa Birliği Ülkeleri İle Türkiye’nin Ekonomik Göstergelerinin Karar Ağacı Yöntemi İle Karşılaştırılması


Tezin Türü: Yüksek Lisans

Tezin Yürütüldüğü Kurum: Marmara Üniversitesi, Türkiye

Tezin Onay Tarihi: 2008

Tezin Dili: Türkçe

Öğrenci: Vildan Gülpınar

Danışman: DİLEK ALTAŞ

Özet:

Avrupa Birliği üyeliği ve aday ülkelerin değerlendirildiği üyelik süreci Türkiye başta olmak üzere pek çok diğer ülke için ekonomik ve sosyal olarak büyük öneme sahiptir. Bu bağlamda Avrupa Birliği'nin üye ülkeleri hangi kıstaslara göre belirlediği ve ekonomik gelişmişliğin üyelik surecine nasıl bir etkisi olduğu son yılların en çok tartışılan konularından birisi olmuştur. Bu tezin amacı; ekonomik gelişmişlik kıstasının müzakere sürecine etki edip etmediği ve eğer etkili ise bu süreçte hangi ekonomik kıstasların daha belirleyici olduğunu ortaya çıkarmaktır. Ayrıca çalışma sonucunda oluşturulan model, AB'ye tam üyelik başvurusunda bulunacak ülkelerin, müzakere sürecinin kaç yıl süreceğini tahmin etmelerine olanak sağlayacaktır. Tezin amacı doğrultusunda AB üyesi 20 ülke ve Türkiye’nin makro ekonomik verilerinden Enflasyon Oranları, Kur Oranları, İşsizlik Oranları, İhracat, İthalat, Toplam İş Gücü, Sabit Sermaye Yatırımları, Gayri Safi Yurtiçi Hâsıla (GSYIH) ve Nüfus Yoğunluğu değişkenleri incelenmiştir. Makro ekonomik veriler, ülkelerin tam üyelik başvurusu yaptıkları yıl ile üye kabul edildikleri yılda görülen değerlerin değişim miktarları alınarak hesaplanmıştır. Kurucu ülkelerin adaylık süreci olmadığından tezin kapsamı dışında tutulmuştur. Veri Madenciliği, verilerde daha önce bilinmeyen gizli örüntüleri açığa çıkaran ve bu bilgilerden yararlı sonuçlar elde ederek geleceğe yönelik tahmin yapmaya imkân tanıyan dinamik bir süreçtir. Karar Ağacı yöntemi, kolay anlaşılan kurallar üretmesi, kuralların görselleştirilebilmesi ve farklı değişken yapılarına uygun güçlü algoritmalara sahip olması sebebiyle en sık kullanılan Veri Madenciliği tekniklerindendir. Tez kapsamında önemli karar ağacı algoritmalarından ID3, C4.5, CART (Sınıflandırma ve Regresyon Ağaçları), CHAID (Ki-kare Otomatik Etkileşim Tespiti) ve QUEST (Çabuk Objektif Etkili İstatistik Ağacı) algoritmaları tanıtılmış olup aralarındaki farklar tespit edilmiştir. Uygulamada C4.5 algoritmasının elde çözümü yapılmış ve karar kurallarına ulaşılmıştır. C4.5 algoritmasının elde çözümünde kullanılan veriler WEKA bilgisayar programında J48 ve J48-Part algoritmasında da uygulanmış ve elde edilen sonuçlar tartışılmıştır. ABSTRACT COMPARISON OF THE ECONOMICAL INDICATORS OF TURKEY AND EUROPEAN UNION STATES VIA DECISION TREE METHOD The EU membership and accession process are essential in economical and social aspects for Turkey and many other non-member states. In this context the criteria for determining the candidate states and how these criteria affect the accession process have been a question for debate recently. The purpose of the thesis is to investigate whether the level of economic development criteria had an impact on the EU accession process and if they have an impact, to determine which economic criteria are the most important. The model, developed as a result of this study, allows the states considering applying for full membership to estimate their acceptance time. In line with the purpose of the thesis, Inflation Rates, Export, Import, Exchange Rates, Unemployment Rates, Total Labor, Fixed Capital Investments, Gross Domestic Product and Population Density variables of Turkey and 20 EU member states have been analyzed. Macroeconomic data is calculated based on the change in the values between the year of application for full membership and the year they are awarded full membership. Since the founder states were not subject to accession process they are not under scope of the thesis. Data Mining is a dynamic process enabling estimations about the future by revealing the latent patterns in the data which were previously unknown. The Decision Tree method is among the most frequently used Data Mining Techniques due to producing easily comprehensible rules, visualizing the rules and its strong algorithms fitting the different variable structures. Within the scope of this thesis, important decision tree algorithms such as ID3, C4.5, CART (Classification and Regression Trees), CHAID (Chi-square Automatic Interactivity Determination) and QUEST (Quick, Unbiased and Efficient Statistical Tree) algorithms are utilized and the differences between them have been described. In application, the C4.5 algorithm data was manually derived, and certain rules have been reached. The data used in the manual solution of the C4.5 algorithm were then applied to the J48 and J48-Part algorithms in WEKA computer program and the obtained results have been discussed.