Please use this identifier to cite or link to this item: https://hdl.handle.net/11499/57207
Title: Meme kanseri tahmininde makine öğrenmesi algoritmaları ve AutoML
Other Titles: Breast cancer diagnosis with machine learning algorithms and AutoML
Authors: Karakaya, Arslan
Advisors: Tokat, Sezai̇
Keywords: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol
Computer Engineering and Computer Science and Control
Makine Öğrenmesi
Otomatik Makine Öğrenmesi
Meme Kanseri Tahmini
Machine Learning
AutoML
Breast Cancer Prediction
Breast Cancer Prediction
Publisher: Pamukkale University
Abstract: Makine öğrenmesi tıp dahil olmak üzere birçok alanda önemli rol oynamaktadır. Özellikle sağlık alanında makine öğrenmesi çeşitli hastalıkların teşhis ve tedavisine yardımcı olan önemli bir araç olarak hizmet vermektedir. Makine öğrenmesinin önemli uygulamalarından biri özellikle kadınlar arasında dünya genelinde kanserden ölüm nedenleri arasında önde gelen meme kanseri gibi hastalıkların erken teşhisidir. Meme kanserinin teşhisinde yüksek doğruluk elde etmek tedavinin etkinliğini ve hastanın genel durumunu doğrudan etkilediği için çok önemlidir. Veri analizi yapılarak farklı makine öğrenmesi modelleri ile tıbbi veriler doğru şekilde analiz edilebilir. Bu çalışmada çeşitli makine öğrenmesi algoritmalarının (Lojistik Regresyon, Karar Ağacı, KNN, Naive Bayes, Destek Vektör Makinesi, Rassal Orman, Stokastik Gradyan İniş, Adaboost, XGBoost, LightGBM, Yapay Sinir Ağları) önce ön işleme,veri artırma, hiperparametre optimizasyonlu olarak sonra AutoML yöntemlerinin (TPOT, H2O, MLJAR) veri artırma ve ön işlemeler ile Wisconsin Meme Kanseri (Teşhis) veriseti üzerinde makine öğrenmesi modeli geliştirmeye yönelik iki farklı yaklaşımın karşılaştırmalı performansı araştırılmıştır. Standardizasyon, SMOTE ve rassal az örnekleme, hiperparametre optimizasyonu model sonuçlarını genel olarak iyileştirmiştir. AutoML yöntemleri makine öğrenmesi algoritmalarının hepsinden daha yüksek doğruluk ve F1-skor değerleri elde etmiştir. AutoML yöntemleri model oluşturma sürecini otomatikleştirmek ve modeli optimize etmek için etkili bir araç olma potansiyeli göstermektedir.
Machine learning plays an important role in many fields including medicine. Especially in the field of healthcare, machine learning serves as an important tool to help diagnose and treat various diseases. One of the important applications of machine learning is the early detection of diseases such as breast cancer which is the leading cause of cancer death worldwide especially among women. Achieving high accuracy in the diagnosis of breast cancer is very important as it directly affects the effectiveness of treatment and general condition of patient. Medical data can be accurately analyzed with data analysis and different machine learning models. In this study the comparative performance of two different approaches to machine learning model development on the Wisconsin Breast Cancer (Diagnosis) dataset is investigated using various machine learning algorithms (Logistic Regression, Decision Tree, KNN, Naive Bayes, Support Vector Machine, Random Forest, Stochastic Gradient Descent, Adaboost, XGBoost, LightGBM, Artificial Neural Networks) with preprocessing, data augmentation, hyperparameter optimization and AutoML methods (TPOT, H2O, MLJAR) with data augmentation and preprocessing. Standardization, SMOTE and random undersampling and hyperparameter optimization generally improved model results. AutoML methods achieved higher accuracy and F1-score values than all machine learning algorithms. AutoML methods show the potential to be an effective tool for automating the model building process and optimizing the model.
URI: https://tez.yok.gov.tr/UlusalTezMerkezi/TezGoster?key=KMB79M3N7zK1UR2WYeRgQgxleo9jv6cSVCu9s2BHhxeb0-vRrAAFjZ0o38HeqdH_
https://hdl.handle.net/11499/57207
Appears in Collections:Tez Koleksiyonu

Files in This Item:
File SizeFormat 
10520953.pdf2.92 MBAdobe PDFView/Open
Show full item record



CORE Recommender

Google ScholarTM

Check





Items in GCRIS Repository are protected by copyright, with all rights reserved, unless otherwise indicated.