Please use this identifier to cite or link to this item: https://hdl.handle.net/11499/1898
Title: Koroner arter hastalığının risk faktörlerinin irdelenmesinde alternatif bir yaklaşım: Genetik algoritmalar
Other Titles: An alternative approach to the examination of coronary artery disease risk factors: Genetic algorithms
Authors: Şenol, Hande
Advisors: Handan Ankaralı
Keywords: Genetik Algoritma
Random Forest
Sınıflama ve Regresyon Ağaçları
Genetic Algorithms
Classification and Regression Trees
Publisher: Pamukkale Üniversitesi Sağlık Bilimleri Enstitüsü
Abstract: Bilgisayar uygulamalarının her alanda yaygın olarak kullanıldığı günümüzde, potansiyel olarak depolanan veri hacmi hızla artmaktadır. Özellikle sağlık sektöründe depolanan ancak kullanılmayan bilgilerin hayata geçirilmesi işlemi, büyük önem taşımaktadır. Veri tabanlarında toplanan çok büyük hacimli verilerden, anlamlı bilgilerin elde edilmesi için geliştirilen ve özellikle son yıllarda yaygın kullanım alanları bulan yöntemler veri madenciliği yöntemleri olarak adlandırılırlar. Bu alanda birçok algoritmadan faydalanılmaktadır. Genetik Algoritmalar (GA) yönteminde problemler sanal olarak evrimsel süreçten geçirilir ve bu süreç sonunda en iyi sonucu veren çözüme ulaşılmaya çalışılır. Bu çalışmada, GA ile optimize edilerek sınıflama yapılmış olan 20, 50, 100, 500 ve 1000 ağaçlı Random Forest (RF) sonuçları; tek bir Karar Ağacından elde edilen sonuçlarla, GA ile optimizasyon yapılmamış olan 20, 50, 100, 500 ve 1000 ağaçlı RF sonuçlarıyla aynı zamanda da sınıflamalara etki eden en önemli 9 değişken temel alınarak sınıflama yapılmış olan 20, 50, 100, 500 ve 1000 ağaçlı RF sonuçlarıyla kıyaslanmıştır. Yapılan bu çalışmadan elde edilen sonuçlardan yola çıkılarak, GA yöntemiyle optimize edilerek kurulan RF modellerinin, optimize edilmemiş olan RF modellerine oranla çok daha yüksek başarıya sahip olduğu söylenebilir. Aynı şekilde RF modellerinin sınıflama başarısını yükseltmesi açısından, ağaç sayısı kaç olursa olsun, kurulacak olan modellerin GA yöntemiyle optimize edilmesi yapılan bu çalışma sonucunda ulaşılabilen en önemli sonuç olmaktadır.
In the present day that computer applications are widely being used in all areas, potentially the data volume being stored is rapidly increasing. Particularly, putting into practice the stored but not used data in the health sector has a great importance. Methods which are developed for obtaining significant informations from huge datas accumulated in data bases, and which are finding wide are of usage particularly in late years, are called data mining. In this area many algorithms are followed up. In Genetic Algorithms (GA) method, problems are virtually undergone an evolutionary process, and at the end of this process it is tried to achieve the solution giving the best result. In this study, 20, 50, 100, 500 and 1000 trees Random Forest (RF) results classified by optimizing with GA were compared with; the results obtained from only one Decision Tree, nonoptimized 20, 50, 100, 500 ve 1000 ağaçlı RF results, at the same time 20, 50, 100, 500 ve 1000 trees RF results classified based on the most important 9 variables affecting the classifications. Setting out from the results of this study, it can be speculated that the RF models optimized by GA method have greater succes than nonoptimized RF models. In the same way, the most important result achieved in this study is that, in terms of increasing the succes in classification of RF models, optimizing the established models by GA method irrelevant from the number of trees.
URI: https://hdl.handle.net/11499/1898
Appears in Collections:Tez Koleksiyonu

Files in This Item:
File Description SizeFormat 
Hande Şenol.pdf1.7 MBAdobe PDFThumbnail
View/Open
Show full item record



CORE Recommender

Page view(s)

46
checked on May 27, 2024

Download(s)

66
checked on May 27, 2024

Google ScholarTM

Check





Items in GCRIS Repository are protected by copyright, with all rights reserved, unless otherwise indicated.