Please use this identifier to cite or link to this item:
https://hdl.handle.net/11499/1501
Title: | Destek vektör makineleri ile ses tanıma uygulaması | Other Titles: | Speech recognition application with support vector machines | Authors: | Eray, Osman | Advisors: | Serdar İplikçi | Keywords: | Ses Tanıma Destek Vektör Makineleri LPC Speech Recognition Support Vector Machines |
Publisher: | Pamukkale Üniversitesi Fen Bilimleri Enstitüsü | Abstract: | Ses tanıma sistemleri insan-bilgisayar arası iletişimi hızlı ve etkin bir şekilde gerçekleştirmeyi amaçlar. Bu amaçla, ses tanıma teknolojilerini geliştirmek için, son yıllarda çeşitli araştırma ve çalışmalar yapılmaktadır. Bu çalışmalara örnek olarak ses tanıma, konuşmacı tanıma ve konuşmacı doğrulama verilebilir. Fakat Türkçe ses tanıma üzerine çok fazla çalışma bulunmamaktadır. Bu çalışmada ses tanıma sistemleri incelenmiş, kullanılan yöntemler araştırılmış ve bir Türkçe ses tanıma uygulaması geliştirilmiştir. Uygulama, ses kodlama ve ses tanıma bölümlerinden oluşmaktadır. Bu çalışmada ilk olarak, bilgisayarda sıklıkla kullanılan 20 adet Türkçe komut belirlenmiştir. Her komuttan 20 adet kayıt yapılmıştır. Toplam 400 sözcük mikrofon ile bilgisayara kaydedilmiştir. Uygulamanın ses kodlama bölümünde, bilgisayara kaydedilen bu sözcükler Doğrusal Önkestirim Kodlama (LPC) yöntemi ile kodlanmış ve her bir sözcüğe ilişkin LPC parametreleri elde edilmiştir. Uygulamanın ses tanıma bölümü, eğitim ve test aşamalarından oluşmaktadır. Bu bölümde Destek Vektör Makineleri (SVM) yöntemi kullanılmıştır. İki çeşit SVM sınıflandırıcısı tasarlanmıştır. Bunlar, Soft Margin Destek Vektör Makinesi sınıflandırıcısı ve Least Square Destek Vektör Makinesi sınıflandırıcısıdır. Kodlanmış 200 sözcük Destek Vektör Makinelerinin eğitim aşaması için, 200 sözcük Destek Vektör Makinelerinin test aşaması için kullanılmıştır. Uygulamada, Soft Margin SVM sınıflandırıcısı için %91 doğru tanıma başarısı; Least Square SVM sınıflandırıcısı için %71 doğru tanıma başarısı elde edilmiştir. Speech recognition systems aim to perform communication between human and computer quickly and efficiently. For this purpose, in recent years various researches and studies have been conducted to develop the speech recognition technologies. Exemplary to this studies, speech recognition, speaker recognition and speaker verification can be given. However, there are not so many studies on Turkish speech recognition. In this study, speech recognition systems have been examined, the methods existing in the literature have been investigated and a Turkish speech recognition application was developed. The application consists of speech coding and speech recognition parts. In this study, firstly, 20 Turkish commands which are often used at computer were determined. 20 records were done for each command. Total 400 words were recorded by microphone to computer. In speech recognition part of the application, this words which were recorded to computer were coded with Linear Predictive Coding (LPC) method and thus the related LPC parameters have been obtained. Speech recognition part of the application consists of training and testing phases. In this part, Support Vector Machines (SVM) method was used for recognition. Two types of SVM classifiers were designed. These classifiers are Soft Margin Support Vector Machine classifier and Least Square Support Vector Machine classifier. 200 words which have been coded were used for training phase of Support Vector Machines and 200 words which have been coded were used for testing phase of Support Vector Machines. In the application, the Soft Margin SVM classifier has yielded 91% recognition performance, while the Least Square SVM classifier has 71%. |
URI: | https://hdl.handle.net/11499/1501 |
Appears in Collections: | Tez Koleksiyonu |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Osman Eray.pdf | 1.71 MB | Adobe PDF | View/Open |
CORE Recommender
Page view(s)
624
checked on Aug 24, 2024
Download(s)
744
checked on Aug 24, 2024
Google ScholarTM
Check
Items in GCRIS Repository are protected by copyright, with all rights reserved, unless otherwise indicated.