Please use this identifier to cite or link to this item:
https://hdl.handle.net/11499/26878
Title: | Nanofiber kaplı filtre malzemelerinin kalite standartlarının belirlenmesinde veri madenciliği |
Other Titles: | Data mınıng ın determınıng the qualıty standards of nanofıber coated fılter materıals |
Authors: | Sabancı, Aylin |
Advisors: | Tokat, Sezai |
Keywords: | Data Mining Classification Clustering Nanotechnology Nanofiber metarials EN 779:2012 Veri Madenciliği Sınıflandırma Kümeleme Nanoteknoloji Nanofiber malzeme |
Publisher: | Pamukkale Üniversitesi Fen Bilimleri Enstitüsü |
Abstract: | Günümüzde teknolojinin gelişmesiyle birlikte bilgiye verilen önem ve veri miktarı artmaktadır. Büyük miktarlardaki verinin araştırılması, analiz edilmesi ve veri yığınları arasından anlamlı bilgiler ortaya çıkarılması için veri madenciliği tekniklerinin kullanılması gerekmektedir. Bu tez çalışmasında, veri madenciliği tekniklerinin endüstriyel bir probleme uygulanması üzerinde durulmuştur. Çalışmada kullanılan veri seti nanoteknoloji alanında faaliyet gösteren özel bir şirketten alınmıştır. EN 779:2012 kalite standartlarına göre filtre sınıfının belirlenmesi amacıyla nanofiber kaplı filtre malzemelerinin laboratuvar ölçümleri veri madenciliği yöntemleriyle analiz edilmiştir. C4.5 Karar Ağacı, Rastgele Orman, Yapay Sinir Ağları, Naive Bayes sınıflandırma algoritmaları ile k-means ve bulanık c-ortalama kümeleme algoritmaları kullanılmıştır. Veri analizleri RStudio geliştirme ortamında R programlama dili ile gerçekleştirilmiş. Verilerin normalizasyonu aşamasında; minimum-maksimum, ondalık ölçeklendirme, z-değeri ve sigmoid normalizasyon yöntemleri karşılaştırılmıştır. Yapılan analizler sonucunda k-en yakın komşu algoritması kullanılarak elde edilen 0.8902 doğruluk değeri ile en başarılı yöntemin sigmoid normalizasyon yöntemi olduğu tespit edilmiştir. Verilerin sınıflandırılması aşamasında; model performans değerlendirme yöntemi olarak hold-out performans değerlendirme yöntemi ve k-kat çapraz geçerleme yöntemi uygulanmıştır. Sınıflandırma algoritması olarak C4.5 Karar Ağacı, Rastgele Orman, Naive Bayes ve Yapay Sinir Ağları algoritmaları kullanılarak modeller oluşturulmuştur. Modellerin performansları doğruluk, kesinlik, duyarlılık, F-ölçütü ve Kappa değerine göre karşılaştırılmıştır. Bilgi kazancına dayalı özellik seçim algoritması veri setine uygulanarak özellikler önem derecesine göre sıralanmıştır. Verilerin kümeleme aşamasında; k-means ve bulanık c-ortalama algoritmaları kullanılarak modeller oluşturulmuştur. Modellerin performansları entropi ve saflık başarı ölçütlerine göre karşılaştırılmıştır. Nowadays with the evolution of technology, the importance of information and the amount of data increases. Data mining techniques should be used to investigate and analyze large amounts of data and extract meaningful information from among the data stacks. In this thesis study, the application of data mining techniques to an industrial problem is emphasized. The data set used in the study was obtained from a private company operating in the field of nanotechnology. In order to determine the filter class according to EN 779: 2012 quality standards, laboratory measurements of nanofiber coated filter materials were analyzed by data mining methods. C4.5 Decision Tree, Random Forest, Artificial Neural Networks, Naive Bayes classification algorithms and k-means and fuzzy c-means clustering algorithms were used as data mining methods. Data analysis was performed with R programming language in RStudio development environment.. During the normalization of data; the minimum-maximum, decimal scaling, z-value and sigmoid normalization methods were compared. The most successful method was found to be the sigmoid normalization method with the accuracy value of 0.8902 obtained using the nearest neighbor algorithm. In the classification stage of the data; hold-out performance evaluation method and kfold cross validation method were applied as model performance evaluation method. Models were created using C45 Decision Tree, Random Forest, Naive Bayes and Artificial Neural Networks algorithms as the classification algorithm. The performances of the models were compared according to accuracy, precision, recall, F-criterion and Kappa value. In the clustering stage of the data; models were created using k-means and fuzzy c-mean algorithms. The performances of the models were compared according to the success criteria of entropy and purity. |
URI: | https://hdl.handle.net/11499/26878 |
Appears in Collections: | Tez Koleksiyonu |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Aylin Sabancı.pdf | 4.11 MB | Adobe PDF | View/Open |
CORE Recommender
Items in GCRIS Repository are protected by copyright, with all rights reserved, unless otherwise indicated.