Please use this identifier to cite or link to this item: https://hdl.handle.net/11499/1217
Title: Türkçe komutları tanıyan ses tanıma sistemi geliştirilmesi
Other Titles: Development of a speech recognition system recognising Turkish commands
Authors: Baygün, Murat Kemal
Advisors: Kadir Yaldır
Keywords: Ses Tanıma
Sözcük Tabanlı Ses Tanıma
Türkçe Ses Tanıma
LPC
DTW
Speech Recognition
Word Based Speech Recognition
Turkish Speech Recognition
Publisher: Pamukkale Üniversitesi Fen Bilimleri Enstitüsü
Abstract: İnsanlar arası iletişim, hızlı ve etkin şekilde sesli olarak sağlanmaktadır. Ses tanıma sistemleri de, buradan yola çıkarak, insan-bilgisayar arası iletişimi daha etkin sağlayabilmek için konuşma dilini kullanmayı amaç edinir. Son yıllarda ses tanıma teknolojileri büyük önem kazanmıştır. Ses tanıma teknolojileri kullanılarak çoğunlukla kişi tanımlama ve konuşma dilini anlama olmak üzere birçok uygulama üzerinde çalışılmaktadır. Ancak Türkçe ses tanıma üzerine çok fazla çalışma bulunmamaktadır. Bu çalışmada ses tanıma sistemleri genel olarak incelenmiş, kullanılan yöntemler araştırılmış ve ses tanıma teknolojileri kullanılarak Türkçe komutları tanıyan bir Ses Tanıma Sistemi geliştirilmeye çalışılmıştır. Ses tanıma süreci, sesin kaydedilmesi ve ifadenin saptanması; sesin işlenmesi; karşılaştırma ve eşleştirme yapılması; son olarak saptanan ifadeye karşılık gelen işlevin gerçekleştirilmesi aşamalarından oluşur. Bu aşamalardan her biri için, geliştirilmiş ve kullanılan birçok teknik bulunmaktadır. Bu çalışmada sesin kaydedilmesi aşamasında sözcük kesimlerinin saptanması için bir çerçevedeki sıfırı geçiş sayısı ve RMS (Root Mean Square) değerinden faydalanılmıştır. Sesin işlenmesi aşamasında kodlayıcı olarak LPC (Linear Predictive Coding) kullanılmış olup karşılaştırma ve eşleştirme aşamasında ise LPC parametreleri üzerinde DTW (Dynamic Time Warping) uygulanmıştır. Geliştirilen bu ses tanıma sistemi, kişiye bağımlı, sözcük tabanlı bir komut-kontrol sistemi olarak oluşturulmuştur. Sözlük kapasitesi, toplam 15 kelime ile sınırlandırılmış olup rakamlar ve beş komuttan oluşmaktadır. Öncelikle, bu kelimeler için ses kaydı yapılıp, LPC ile kodlanmıştır. Her bir kelime için bu şekilde şablonlar oluşturulmuştur. Çalışma anında, kayıt esnasında saptanan ses, LPC ile kodlanarak, tüm kayıtlı şablonlarla DTW algoritması kullanılarak karşılaştırma gerçekleştirilmiştir. Karşılaştırma sonucunda elde edilen en yakın şablon ile kelime eşleştirilmesi gerçekleştirilerek algılanan komut, geliştirilen uygulama ara yüzüne yansıtılmaktadır.
Communication between human beings is done quickly and more efficiently by voice. Speech recognition systems therefore, aim to improve the human - computer interaction by using spoken language. In recent years speech recognition techniques gained more importance. By using speech recognition techniques, many applications are being studied on for speaker identification and speech recognition. However, there are not so many studies on Turkish speech recognition. With this study, speech recognition systems have been examined generally, the methods used have been investigated and a Speech Recognition System has been tried to being developed for recognizing Turkish commands by using speech recognition techniques. Speech recognition process consists of speech recording and determining utterance, signal processing, comparison and matching; and finally processing the function to response the recognized word. For all these phases, there are many techniques that have been investigated and are being used. In this study, zero pass count and RMS (Root Mean Square) are used to determine the utterances in speech recording phase. LPC (Linear Predictive Coding) is used in signal processing phase, and DTW (Dynamic Time Warping) is used in comparison and matching phase on LPC coefficients. The speech recognition system that has been developed is designed as a speaker dependent word based command-control system. The dictionary is limited by 15 words and consists of numbers and five commands. First; speech recording is done and speech is coded with LPC for these words. For all these words, patterns are generated. During run-time, the determined utterance while recording is being coded with LPC and compared by using DTW algorithm with the all word patterns saved. After comparison, the nearest matching pattern is selected, and the recognized command is reflected on the developed application interface.
URI: https://hdl.handle.net/11499/1217
Appears in Collections:Tez Koleksiyonu

Files in This Item:
File Description SizeFormat 
Murat Kemal Baygün.pdf1.17 MBAdobe PDFThumbnail
View/Open
Show full item record



CORE Recommender

Page view(s)

156
checked on Jul 31, 2024

Download(s)

2,108
checked on Jul 31, 2024

Google ScholarTM

Check





Items in GCRIS Repository are protected by copyright, with all rights reserved, unless otherwise indicated.