Mekansal dağılımın veri analizine etkisi


Tezin Türü: Doktora

Tezin Yürütüldüğü Kurum: Marmara Üniversitesi, İktisat Fakültesi, Ekonometri Bölümü, Türkiye

Tezin Onay Tarihi: 2016

Tezin Dili: Türkçe

Öğrenci: ÖZLEM ERGÜT

Danışman: AHMET METE ÇİLİNGİRTÜRK

Özet:

MEKANSAL DAĞILIMIN VERİ ANALİZİNE ETKİSİ Mekansal veri analizi, analiz sonuçları nesnelerin ya da analiz edilen olayların konumlarına bağlı olan, hem konum bilgisi hem de nesnelerin özelliklerinin kullanımı gerektiren yöntemlerden oluşmaktadır. Mekansal veri analizinin, coğrafya, epidemiyoloji, madencilik alanlarının yanı sıra iktisat, ekoloji, şehir planlama, arkeoloji gibi alanlarda da kullanımı ile günümüzde giderek önemli hale gelen bir çalışma alanı haline gelmiştir. Özellikle Coğrafi Bilgi Sistemlerinde meydana gelen ilerlemeler ve verinin analiz edilmesine yönelik programların geliştirilmesi mekansal veri analizde kullanılan yöntemleri daha uygulanabilir hale getirmiştir. Mekansal veri analizinde mekansal etkileşim ön plana çıkmakta ve mekansal etkileşim hem mekansal bağımlılığı hem de mekansal heterojenliği kapsamaktadır. Mekansal verideki bağımlılık yapısı regresyon analizini de içeren çeşitli istatistiksel yöntemlerde geçerli olan bağımsızlık varsayımının ihlal edilmesine neden olmaktadır. Konumun ve konumlar arasındaki etkileşimin önemli olduğu çalışmalarda bu bağımlılık yapısını dikkate alarak geliştirilmiş yöntemlerin kullanılması gerekmektedir. Mekansal analizde kullanılan en yaygın yöntemlerden biri mekansal regresyon analizidir. Bu çalışmanın amacı bir konuma sahip olan verilerin yapısını, desenini ve bunların diğer konumlarla olan etkileşimini açıklayan mekansal veri analizi yöntemlerinin tanıtılması, birimler arasındaki komşuluk ilişkisini ifadesinde kullanılan farklı türdeki mekansal ağırlık matrislerinin oluşturularak elde edilen sonuçların birbirleriyle karşılaştırılması ve verileri en iyi temsil eden uygun modelin belirlenmesine yönelik kullanılan testlerin incelenerek; uygun modeller ile mekansal regresyon analizinin bir uygulamasını gerçekleştirmektir. Bu amaç doğrultusunda mekansal analiz literatüründeki son gelişmeler ışığında mekansal etkilerin de dahil edildiği farklı mekansal modeller kullanılarak Türkiye’de il düzeyindeki mutluluk verilerinde mekansal bağımlılık yapısının olup olmadığı incelenmiştir. Yapılan simülasyon çalışması ile de mekansal bağımlılığın arttığı ve ihmal edilen değişkenle modelde yer alan bağımsız değişken arasında ilişkinin yüksek olması durumunda klasik regresyon ve Durbin modeli tahmin sonuçlarının nasıl etkileneceği araştırılmıştır. SUMMARY EFFECTS OF SPATIAL DATA DISTRIBUTION ON DATA ANALYSIS Spatial data analysis, whose results depend on the location of the event or the object being analyzed, consists of methods that require the use of both objects features and location. Spatial data analysis has become an important field of study with its increasing use in geography, epidemiology, mining as well as economics, ecology, urban planning and archeology. Especially developments in take place at GIS and programmes analyzing data enabled methods used in the analysis of spatial data more feasible. Spatial effect exits to forefront in spatial data analysis and it contains both spatial dependence and spatial heterogeneity. Spatial dependence violates independence assumption valid for statistical methods. Studies working spatial dependence should use methods taking this dependence into consideration. One of the most common method used in spatial analysis is spatial regression analysis. The aim of the study is explaining methods of spatial data analysis, building different spatial weight matrices and comparing results of analysis with one another, examining tests used for defining the optimum model and applying of spatial regression analysis. To that end different spatial models are used to study if there is spatial dependence in happiness data set in cities in Turkey. Simulation study is applied in order to investigate how OLS and spatial Durbin model estimation results are effected, in existence of different spatial dependence degrees and the correlation between independent variable in model and the omitted variable is high.