Die dichte-basierten methoden für die cluster analyse

Tezin Türü: Yüksek Lisans

Tezin Yürütüldüğü Kurum: Marmara Üniversitesi, Sosyal Bilimler Enstitüsü, Enformatik (Almanca) Anabilim Dalı, Türkiye

Tezin Onay Tarihi: 2004

Tezin Dili: Almanca

Öğrenci: HANDE KÜÇÜKAYDIN

Danışman: Haludun Akpınar

Özet:

KÜMELEME ANALİZİNDE YOĞUNLUK TEMELLİ METOTLAR Akademisyenler ve pazar araştırmacıları, homojen obje gruplarının tanımıyla en iyi şekilde çözülebilecek durumlarla sık sık karşılaşmaktadılar; bu objelerin kişiler, kurumlar, ürünler veya davranışlar olması ise fark yaratmamaktadır. Segmentlere ayırma ve hedef pazarlamada olduğu gibi popülasyon içindeki grupların teşhisine dayanan strateji opsiyonları nesnel bir metodoloji olmadan mümkün olamazdı. Aynı ihtiyaca başka alanlarda da rastlanmaktadır. Bütün örneklerde gözlemler arasında “doğal bir yapı” aranmaktadır. Bu amaç doğrultusunda genellikle “Kümeleme Analizi” tekniği kullanılmaktadır. Bu çalışmada bir veri tabanını küme bileşenlerine ayırabilmek için yoğunluk temelli genel bir metot tanıtılmıştır. Bu metot her türlü veri tipine sahip objelerde şu iki koşulla uygulanabilmektedir: (1) objeler için simetrik ve dönüşlü, ikili bir yüklem ve (2) kullanıcıya, bir obje kümesinin minimum ağırlığı olup olmadığını tespit etmesine izin veren bir yüklem bulunmalıdır. Dozenten und Marktforscher stoßen meistens auf die Situationen, die am besten von der Definition der Gruppen von homogenen Objekten gelöst werden können, egal ob diese Objekte Individuen, Unternehmen, Produkte oder sogar Verhalten sind. Strategie-Optionen basiert auf die Identifizierung der Gruppen innerhalb der Population wie die Segmentierung und Zielmarketing würden ohne eine objektive Methodologie nicht möglich sein. Dem gleichen Bedürfnis wird auch in vielen anderen Bereichen getroffen. In allen Instanzen sucht man eine „natürliche Struktur “ unter den Beobachtungen nach. Zu diesem Zweck wird meistens die Technik „Cluster Analyse“ verwendet. In dieser Arbeit wird eine allgemeine Dichte-basierte Methode vorgestellt, die auf Objekten von beliebigen Datentyp anwendbar ist, vorausgesetzt, dass (1) es ein binäres (Nachbarschaft) Prädikat für Objekte, das symmetrisch und reflexiv ist, und (2) ein Prädikat gibt, das dem Benutzer erlaubt, zu bestimmen, ob eine Menge von Objekten „minimales Gewicht“ hat oder nicht, um eine Datenbank in eine Menge von Cluster-Komponenten zu zerlegen.