Nanofiber kaplı filtre malzemelerinin kalite standartlarının belirlenmesinde veri madenciliği

Sabancı, Aylin

Please use this identifier to cite or link to this item: https://hdl.handle.net/11499/26878

Title:	Nanofiber kaplı filtre malzemelerinin kalite standartlarının belirlenmesinde veri madenciliği
Other Titles:	Data mınıng ın determınıng the qualıty standards of nanofıber coated fılter materıals
Authors:	Sabancı, Aylin
Advisors:	Tokat, Sezai
Keywords:	Data Mining Classification Clustering Nanotechnology Nanofiber metarials EN 779:2012 Veri Madenciliği Sınıflandırma Kümeleme Nanoteknoloji Nanofiber malzeme
Publisher:	Pamukkale Üniversitesi Fen Bilimleri Enstitüsü
Abstract:	Günümüzde teknolojinin gelişmesiyle birlikte bilgiye verilen önem ve veri miktarı artmaktadır. Büyük miktarlardaki verinin araştırılması, analiz edilmesi ve veri yığınları arasından anlamlı bilgiler ortaya çıkarılması için veri madenciliği tekniklerinin kullanılması gerekmektedir. Bu tez çalışmasında, veri madenciliği tekniklerinin endüstriyel bir probleme uygulanması üzerinde durulmuştur. Çalışmada kullanılan veri seti nanoteknoloji alanında faaliyet gösteren özel bir şirketten alınmıştır. EN 779:2012 kalite standartlarına göre filtre sınıfının belirlenmesi amacıyla nanofiber kaplı filtre malzemelerinin laboratuvar ölçümleri veri madenciliği yöntemleriyle analiz edilmiştir. C4.5 Karar Ağacı, Rastgele Orman, Yapay Sinir Ağları, Naive Bayes sınıflandırma algoritmaları ile k-means ve bulanık c-ortalama kümeleme algoritmaları kullanılmıştır. Veri analizleri RStudio geliştirme ortamında R programlama dili ile gerçekleştirilmiş. Verilerin normalizasyonu aşamasında; minimum-maksimum, ondalık ölçeklendirme, z-değeri ve sigmoid normalizasyon yöntemleri karşılaştırılmıştır. Yapılan analizler sonucunda k-en yakın komşu algoritması kullanılarak elde edilen 0.8902 doğruluk değeri ile en başarılı yöntemin sigmoid normalizasyon yöntemi olduğu tespit edilmiştir. Verilerin sınıflandırılması aşamasında; model performans değerlendirme yöntemi olarak hold-out performans değerlendirme yöntemi ve k-kat çapraz geçerleme yöntemi uygulanmıştır. Sınıflandırma algoritması olarak C4.5 Karar Ağacı, Rastgele Orman, Naive Bayes ve Yapay Sinir Ağları algoritmaları kullanılarak modeller oluşturulmuştur. Modellerin performansları doğruluk, kesinlik, duyarlılık, F-ölçütü ve Kappa değerine göre karşılaştırılmıştır. Bilgi kazancına dayalı özellik seçim algoritması veri setine uygulanarak özellikler önem derecesine göre sıralanmıştır. Verilerin kümeleme aşamasında; k-means ve bulanık c-ortalama algoritmaları kullanılarak modeller oluşturulmuştur. Modellerin performansları entropi ve saflık başarı ölçütlerine göre karşılaştırılmıştır. Nowadays with the evolution of technology, the importance of information and the amount of data increases. Data mining techniques should be used to investigate and analyze large amounts of data and extract meaningful information from among the data stacks. In this thesis study, the application of data mining techniques to an industrial problem is emphasized. The data set used in the study was obtained from a private company operating in the field of nanotechnology. In order to determine the filter class according to EN 779: 2012 quality standards, laboratory measurements of nanofiber coated filter materials were analyzed by data mining methods. C4.5 Decision Tree, Random Forest, Artificial Neural Networks, Naive Bayes classification algorithms and k-means and fuzzy c-means clustering algorithms were used as data mining methods. Data analysis was performed with R programming language in RStudio development environment.. During the normalization of data; the minimum-maximum, decimal scaling, z-value and sigmoid normalization methods were compared. The most successful method was found to be the sigmoid normalization method with the accuracy value of 0.8902 obtained using the nearest neighbor algorithm. In the classification stage of the data; hold-out performance evaluation method and kfold cross validation method were applied as model performance evaluation method. Models were created using C45 Decision Tree, Random Forest, Naive Bayes and Artificial Neural Networks algorithms as the classification algorithm. The performances of the models were compared according to accuracy, precision, recall, F-criterion and Kappa value. In the clustering stage of the data; models were created using k-means and fuzzy c-mean algorithms. The performances of the models were compared according to the success criteria of entropy and purity.
URI:	https://hdl.handle.net/11499/26878
Appears in Collections:	Tez Koleksiyonu

Files in This Item:

File	Description	Size	Format
Aylin Sabancı.pdf		4.11 MB	Adobe PDF	View/Open

Show full item record

CORE Recommender

Page view(s)

222

checked on Mar 4, 2025

Download(s)

400

checked on Mar 4, 2025

Google Scholar^TM

Check

Files in This Item:

Page view(s)

Download(s)

Google ScholarTM

Google Scholar^TM