Please use this identifier to cite or link to this item:
https://hdl.handle.net/11499/1269
Title: | KPSS sonuçlarının veri madenciliği yöntemleriyle tahmin edilmesi | Other Titles: | Predicting KPSS results using data mining methods | Authors: | Özçınar, Hüseyin | Advisors: | Sezai Tokat | Keywords: | Veri Madenciligi Yapay Sinir Agları Regresyon Analizi Öngörü KPSS Data Mining Artificial Neural Networks Regression Analysis Prediction |
Publisher: | Pamukkale Üniversitesi Fen Bilimleri Enstitüsü | Abstract: | Araştırmada materyal olarak sınıf öğretmenliği A.B.D. öğrencilerinin lisans eğitimleri süresince bazı derslerden aldıkları ders geçme notları, genel not ortalamaları, öğretim türleri ve KPSS puanları kullanılmıştır. Çalışmada ilk olarak toplanan veriler temizlenip birleştirilmiş ve veri madenciliği uygulamasında kullanılabilecek şekilde düzenlenmiştir. Daha sonra veriler veri madenciliği uygulamasında kullanılmak üzere öğrencilerin üniversiteye giriş yılına göre ayrılarak dört farklı veri kümesi oluşturulmuştur. Toplanan verinin anlaşılabilmesi için frekans analizi ve regresyon analizi yöntemleri kullanılarak derslere ve yıllara göre verinin özellikleri incelenmiştir. Yapılan inceleme sonucunda bazı derslerde A1 ve A2 gibi yüksek notlarla geçen öğrencilerin oranı % 5-6 civarında iken C ile geçen öğrencilerin tüm veri kümesi için oranının % 38,6 olduğu görülmüştür. Bu aşamada bazı derslerin not dağılımlarının yıllara göre % 10 ile %20 arasında değişimler gösterebildiği saptanmıştır. Modelleme aşamasında tahmin doğruluklarının karşılaştırılabilmesi için yapay sinir ağı ve regresyon modelleri oluşturulmuştur. Yapay sinir ağı modelini oluşturmak için öğrenme yöntemi olarak geriye yayılım algoritmasını kullanan çok katmanlı perseptron kullanılmıştır. Regresyon modelini oluşturmak için çoklu doğrusal regresyon yöntemi kullanılmıştır. Frekans analizi yöntemiyle veri kümesinin özellikleri belirlenmiştir. Oluşturulan regresyon modeli ile KPSS sonuçlarının değişimi üzerinde anlamlı katkısı olan değişkenler incelenmiş ve oluşturulan modellerin tahmin doğrulukları, ortalama mutlak hata ve ortalama hata kareler kökü değerleri kullanılarak karşılaştırılmıştır. In this study, general point average, grades of lessons and type of school were to predict KPSS results. Initially collected data were cleaned, merged and formated which could be used in data mining application. Data tables were splitted according to universtiy entry date of students and four data sets were created. Data sets were examined with frequency and regression analysis techniques to get a better understanding of collected data. The analysis results showed that while the percentage of high grades like A1, A2 were about %5-6, the percentage of students who get C was % 38,6. At this stage it was noted that the grade distributions of some of lessons were changed % 10, % 20 with respect to years. At the modeling stage, artificial neural networks model and regression model were created in order to compare predictive accuracy of these data mining techniques. Multilayer perceptron with backpropagation used for artificial neural network model and multiple linear regression technique used for regression model. Frequency analysis was used to explore data set charecteristics and variables which have signicant effect on KPSS results found using regression model. The error term of models were compared using mean absolute error and root mean squared error. |
URI: | https://hdl.handle.net/11499/1269 |
Appears in Collections: | Tez Koleksiyonu |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Hüseyin Özçinar.pdf | 418.31 kB | Adobe PDF | View/Open |
CORE Recommender
Page view(s)
378
checked on Aug 24, 2024
Download(s)
342
checked on Aug 24, 2024
Google ScholarTM
Check
Items in GCRIS Repository are protected by copyright, with all rights reserved, unless otherwise indicated.