Application of data mining on medical diagnosis


Tezin Türü: Yüksek Lisans

Tezin Yürütüldüğü Kurum: Marmara Üniversitesi, Mühendislik Fakültesi, Bilgisayar Mühendisliği Bölümü, Türkiye

Tezin Onay Tarihi: 2017

Tezin Dili: Türkçe

Öğrenci: MUYASAIER AIHAITI

Danışman: ALİ FUAT ALKAYA

Özet:

Veri Madenciliğinin Tıbbi Tanı Konusunda Uygulanması Günümüzde, Meme kanseri kadınlarda en çok rastlanan deri kanseri olmayan kanseridir. Mamografi, belli bir yaşa Kadar meme kanseri teşhisi için net bulguları vermiyor, çünkü ultrason bir görüntüleme tekniği olarak uygulanır. Ardından, ultrasound bulgularına göre, mamogram veya diğer algılama teknikleri gibi görüntüleme teknikleri uygulanır. Ultrason bulguları şüpheliyse veya hasta belirli bir yaş üzerinde ise hastadan mamografi istenir. Hastanın mamografi bulguları ve diğer risk faktör değerlerine göre hastaya biyopsi uygulanacaktır. Bu süreçteki her adım, hastayı kaygıya ve harcamalara yol açacaktır. Ancak bu süreçten geçmemek eğer kanseri bir durum ise hastayı ciddi sorunlara ve harcamalarına yol açacaktır Bu nedenle, sürecin her adımı en doğru bilgi tahmin etmek için hayati önem taşımaktadır. Bilgisayar destekli teşhis modelleri (CADX) çok sayıda değişkenlerin işlemi ve risk faktörleri ve risk tahmini arasındaki boşluğa yardım sağlayabilir. Birçok CADX modelleri mamografik bulguları değerlendirerek uzmanlar için destek sağlamak ve belirisz kanser hastalarının tespit oranını arttırmak için radyologlar tarafından kullanılır ve meme kanseri tespiti için duyarlı CADX modelleri geliştirmek ise aktif bir araştırma konusudur. Bu çalışmada, iyi bilinen veri madenciliği teknikleri kamu meme kanseri veri seti üzerinde uygulanmıştır Bir yenilik olarak, iki meta-sezgisel tarama, Tavlama Benzetimi - iyi bilinen bir optimizasyon meta-sezgisel ve Göçen Kuşlar Optimizasyonu - oldukça yeni bir metasezgisel yöntemlerle aynı veri üzerinde uygulanır ve sonuçları tartışılmıştır. Iki meta-sezgisel optimize teknik sonuçları ve veri madenciliği teknikleri performansları karşılaştırılarak iyi performans gösterdiği görülmektedir. ABSTRACT APPLICATIONOFDATAMININGONMEDICALDIAGNOSIS Today, breast cancer is the most common non-skin cancer affecting women. Because mammograms do not give clear findings until a certain age for the diagnosis of breast cancer, ultrasounds are applied as an imaging technique. Then, according to the findings in ultrasounds, imaging techniques like mammograms or other detection techniques are applied. Patient will be required mammograms if ultrasound findings look suspicious or the patient is above a certain age. Patients will have biopsy according to the mammogram findings and other risk factors values. Each step in this process will lead the patient anxiety, and expenditures. But the result of not performing these processes will lead one case of cancer and leads the patient more serious problems and expenditures. Therefore, every step of the process is of vital importance to predict the most accurate information available. CADX models are helpful working on a huge number of variables, and related the risk factors and risk estimation together. Many CADX models provide support for experts by evaluating the mammographic findings and are used by radiologists to increase the detection rate of missed cancer patients, and developing sensitive CADX models for breast cancer detection is an active research topic. In this study, application of well-known data mining techniques is done on a public breast cancer data set. As a novelty, two meta-heuristics, Simulated Annealing – a well-known optimization meta-heuristic and Migrating Birds Optimization – a fairly new meta heuristic are also applied on the same data set and the results are discussed. It is shown that the two meta-heuristics show comparable performance with the well-known data mining techniques.