Türk dili için konuşmacıya bağımlı, fonem tabanlı, sözcük tanıma sistemi gerçekleştirilmesi


Thesis Type: Postgraduate

Institution Of The Thesis: Marmara University, Institute for Graduate Studies in Pure and Applied Sciences, Department of Electronics-Computer Education, Turkey

Approval Date: 2010

Thesis Language: Turkish

Student: ERDEM YAVUZ

Consultant: Vedat Topuz

Abstract:

TÜRK DİLİ İÇİN KONUŞMACIYA BAĞIMLI, FONEM TABANLI, SÖZCÜK TANIMA SİSTEMİ GERÇEKLEŞTİRİLMESİ Elektronik ve bilgisayar teknolojisindeki gelişmeler, bilgiyi işlemede makine kullanımını her geçen gün daha zorunlu kılmaktadır. İnsanların kendi aralarında iletişim kurarken kullandıkları doğal yolun, yani konuşarak iletişim kurabilmenin insan-bilgisayar etkileşimine taşınmasının çok önemli kolaylıklar sağlaması mümkündür. Bu tezde, Türk Dili için konuşmacıya bağımlı, fonem tabanlı, sözcük tanıma sistemi gerçekleştirilmiştir. Sözcükleri fonemlerine ayrıştırmak için fonem sınırlarını tespit etme algoritması geliştirilmiştir. Kelimeleri fonemlerine ayrıştırdıktan sonra, oluşan fonem havuzundaki fonemlerin her biri geldikleri kelimelerdeki konum ve komşuluklarına göre alt gruplara ayrıştırılmıştır. Oluşturulan bu fonem alt grupları, mel-frekansı kepstral katsayılarından oluşan öznitelik vektörü kullanılarak istatistiksel bir yöntem olan Saklı Markov Model ile temsil edilmiştir. Yapılan çalışmada fonem tabanlı yaklaşım benimsendiği için sisteme tanıtılmamış olan birçok sözcüğün sistem tarafından tanımlanabilmesi sağlanmıştır. ABSTRACT IMPLEMENTATION OF A SPEAKER DEPENDENT, PHONEME BASED WORD RECOGNITION SYSTEM FOR TURKISH LANGUAGE Advances in electronics and computer technology require the use of machines for processing information. People have a natural way to communicate among themselves, which is to communicate by talking. Moving it to human-computer interaction is very important to provide convenience. In this thesis, a speaker-dependent, phoneme-based word recognition system has been designed and implemented for Turkish Language. An algorithm for finding phoneme-boundaries has been devised in order to segment the word into its phonemes. After the segmentation of words into phonemes, each phoneme is separated into different sub-groups according to its position and neighbouring phonemes in that word. Generated sub-groups are modeled by Hidden Markov Model, which is a statistical technique, using Mel-frequency cepstral coefficient feature vectors. Since phoneme-based approach was adopted in this study, it has been achieved that many out of vocabulary words could be identified.