Please use this identifier to cite or link to this item: https://hdl.handle.net/11499/26878
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorTokat, Sezai-
dc.contributor.authorSabancı, Aylin-
dc.date.accessioned2019-10-16T08:52:54Z-
dc.date.available2019-10-16T08:52:54Z-
dc.date.issued2019-06-
dc.identifier.urihttps://hdl.handle.net/11499/26878-
dc.description.abstractGünümüzde teknolojinin gelişmesiyle birlikte bilgiye verilen önem ve veri miktarı artmaktadır. Büyük miktarlardaki verinin araştırılması, analiz edilmesi ve veri yığınları arasından anlamlı bilgiler ortaya çıkarılması için veri madenciliği tekniklerinin kullanılması gerekmektedir. Bu tez çalışmasında, veri madenciliği tekniklerinin endüstriyel bir probleme uygulanması üzerinde durulmuştur. Çalışmada kullanılan veri seti nanoteknoloji alanında faaliyet gösteren özel bir şirketten alınmıştır. EN 779:2012 kalite standartlarına göre filtre sınıfının belirlenmesi amacıyla nanofiber kaplı filtre malzemelerinin laboratuvar ölçümleri veri madenciliği yöntemleriyle analiz edilmiştir. C4.5 Karar Ağacı, Rastgele Orman, Yapay Sinir Ağları, Naive Bayes sınıflandırma algoritmaları ile k-means ve bulanık c-ortalama kümeleme algoritmaları kullanılmıştır. Veri analizleri RStudio geliştirme ortamında R programlama dili ile gerçekleştirilmiş. Verilerin normalizasyonu aşamasında; minimum-maksimum, ondalık ölçeklendirme, z-değeri ve sigmoid normalizasyon yöntemleri karşılaştırılmıştır. Yapılan analizler sonucunda k-en yakın komşu algoritması kullanılarak elde edilen 0.8902 doğruluk değeri ile en başarılı yöntemin sigmoid normalizasyon yöntemi olduğu tespit edilmiştir. Verilerin sınıflandırılması aşamasında; model performans değerlendirme yöntemi olarak hold-out performans değerlendirme yöntemi ve k-kat çapraz geçerleme yöntemi uygulanmıştır. Sınıflandırma algoritması olarak C4.5 Karar Ağacı, Rastgele Orman, Naive Bayes ve Yapay Sinir Ağları algoritmaları kullanılarak modeller oluşturulmuştur. Modellerin performansları doğruluk, kesinlik, duyarlılık, F-ölçütü ve Kappa değerine göre karşılaştırılmıştır. Bilgi kazancına dayalı özellik seçim algoritması veri setine uygulanarak özellikler önem derecesine göre sıralanmıştır. Verilerin kümeleme aşamasında; k-means ve bulanık c-ortalama algoritmaları kullanılarak modeller oluşturulmuştur. Modellerin performansları entropi ve saflık başarı ölçütlerine göre karşılaştırılmıştır.en_US
dc.description.abstractNowadays with the evolution of technology, the importance of information and the amount of data increases. Data mining techniques should be used to investigate and analyze large amounts of data and extract meaningful information from among the data stacks. In this thesis study, the application of data mining techniques to an industrial problem is emphasized. The data set used in the study was obtained from a private company operating in the field of nanotechnology. In order to determine the filter class according to EN 779: 2012 quality standards, laboratory measurements of nanofiber coated filter materials were analyzed by data mining methods. C4.5 Decision Tree, Random Forest, Artificial Neural Networks, Naive Bayes classification algorithms and k-means and fuzzy c-means clustering algorithms were used as data mining methods. Data analysis was performed with R programming language in RStudio development environment.. During the normalization of data; the minimum-maximum, decimal scaling, z-value and sigmoid normalization methods were compared. The most successful method was found to be the sigmoid normalization method with the accuracy value of 0.8902 obtained using the nearest neighbor algorithm. In the classification stage of the data; hold-out performance evaluation method and kfold cross validation method were applied as model performance evaluation method. Models were created using C45 Decision Tree, Random Forest, Naive Bayes and Artificial Neural Networks algorithms as the classification algorithm. The performances of the models were compared according to accuracy, precision, recall, F-criterion and Kappa value. In the clustering stage of the data; models were created using k-means and fuzzy c-mean algorithms. The performances of the models were compared according to the success criteria of entropy and purity.en_US
dc.language.isotren_US
dc.publisherPamukkale Üniversitesi Fen Bilimleri Enstitüsüen_US
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.subjectData Miningen_US
dc.subjectClassificationen_US
dc.subjectClusteringen_US
dc.subjectNanotechnologyen_US
dc.subjectNanofiber metarialsen_US
dc.subjectEN 779:2012en_US
dc.subjectVeri Madenciliğien_US
dc.subjectSınıflandırmaen_US
dc.subjectKümelemeen_US
dc.subjectNanoteknolojien_US
dc.subjectNanofiber malzemeen_US
dc.titleNanofiber kaplı filtre malzemelerinin kalite standartlarının belirlenmesinde veri madenciliğien_US
dc.title.alternativeData mınıng ın determınıng the qualıty standards of nanofıber coated fılter materıalsen_US
dc.typeMaster Thesisen_US
dc.authorid14412-
dc.relation.publicationcategoryTezen_US
dc.identifier.yoktezid573456en_US
dc.ownerPamukkale University-
item.fulltextWith Fulltext-
item.languageiso639-1tr-
item.cerifentitytypePublications-
item.grantfulltextopen-
item.openairetypeMaster Thesis-
item.openairecristypehttp://purl.org/coar/resource_type/c_18cf-
Appears in Collections:Tez Koleksiyonu
Files in This Item:
File Description SizeFormat 
Aylin Sabancı.pdf4.11 MBAdobe PDFView/Open
Show simple item record



CORE Recommender

Page view(s)

222
checked on Mar 4, 2025

Download(s)

400
checked on Mar 4, 2025

Google ScholarTM

Check





Items in GCRIS Repository are protected by copyright, with all rights reserved, unless otherwise indicated.