END-TO-END MODELLAR ASOSIDA O‘ZBEK TILIDAGI NUTQNI AVTOMATIK TANIB OLISHNING ALGORITMLARI VA DASTURIY TA’MINOTINI ISHLAB CHIQISH
END-TO-END MODELLAR ASOSIDA O‘ZBEK TILIDAGI NUTQNI AVTOMATIK TANIB OLISHNING ALGORITMLARI VA DASTURIY TA’MINOTINI ISHLAB CHIQISH MUNDARIJA KIRISH ………………………………………………………...................... 4 I- BOB NUTQ SIGNALLARINI AVTOMATIK TANIB OLISHNING USULLAR TAHLILI 7 1.1 -§ Nutq signallarini tarkibi va xususiyatlari ………………….............. 7 1.2 -§ Nutq signallariga dastlabki ishlov berishda qo’llaniladigan algoritmlar tahlili…………………. ……………………….……..... 10 Birinchi bob bo yicha xulosalar.........................................................ʻ 17 II- BOB NUTQ SIGNALLARINI PARAMETRLASH ALGORITMLARI.......................................................................... 18 2.1 -§ Nutq signallarini spektral taqdim etishning algoritmlari va usullari…………………………………………………….….......... 18 2.2 -§ Nutq signalini parametrlash tasnifi…………………….….............. 24 2.3 -§ Nutq korpusi shakllantirish texnologiyalari...................................... 29 Ikkinchi bob bo yicha xulosalar ʻ …..………………………………. 33 III- BOB NUTQNI TANISH TIZIMINI LOYIHALASHTIRISH …........ 34 3.1 -§ Neyron tarmoqlari………………………………………………..... 34 3.2 -§ Chuqur neyron tarmoqlarining arxitekturalari………………......... 40 3.3 -§ Nutqni tanish tizimining strukturali sxemasi……………….......... 43 3.4 -§ Neyron tarmoqni loyihalashtirish va arxitekturasini ishlab chiqish……………………………………………………………… 45 Uchinchi bob bo yicha xulosalar ʻ …..……………………………… 58 IV- BOB End-to-End tizimiga asosan nutqni tanish modulini ishlab chiqish ….….……........................................................................... 59 4.1 -§ Python dasturlash tili. TensorFlow kutubxonasi………………........ 59 4.2 -§ Tanib olish modullarini dasturiy amalga oshirish.............................. 61 4.3 -§ Nutqni tanib olish moduli ishini sifatini baholash............................. 64 To‘rtinchi bob bo yicha xulosalar ʻ ………………………………… 67 1
XULOSA …………………………………………………..…....................... 69 ADABIYOTLAR RO YXATIʻ ………………………………………….… 71 ILOVALAR …………………………………………………..….............… 76 ANNOTATSIYA Ushbu ilmiy tadqiqot ishida neyron tarmoqlari modeli asosida o‘zbek tili nutqi nutqini tanib olish masalasini yechish jarayoni o‘rganib chiqilgan. Nutq signallariga ishlov berish, ularni tanib olish va tahlil qilish uchun avtomatlashtirilgan tizimlar yaratishning mavjud usul va algoritmlarini takomillashtirish hamda yangi hisoblash algoritmlarini ishlab chiqishga yo‘naltirilgan keng qamrovli ilmiy-tadqiqot ishlari olib borilgan. N utq signallarga ishlov berish algoritmlari tahliliga asoslangan holda o’zbek tili uchun nutq signalarlarni tanishning neyron tarmog’iga asoslangan algoritmlari va dasturiy vositasi ishlab chiqilgan. Bu borada, nutq korpusini shakllantirish, nutq signallarini xarakterlovchi belgilarni ajratish usullari takomillashtirish va yaratish hamda ushbu xarakterlovchi belgilar asosida tanib olish algoritmlarini ishlab chiqish, ular asosida nutqni avtomatik tanib olishning dasturiy vositalarini yaratish axborot texnologiyalarini rivojlantirishning muhim vazifalaridan biri hisoblanadi. ANNOTATION In this scientific research, the process of solving the problem of Uzbek language speech recognition based on the neural network model was studied. Comprehensive research and development activities aimed at improving the existing methods and algorithms for creating automated systems for processing speech signals, their recognition and analysis, as well as developing new calculation algorithms have been carried out. In this regard, the formation of a speech corpus, the improvement and creation of methods for distinguishing characters characterizing speech signals, the development of recognition algorithms based on these characterizing characters, and 2
the creation of software tools for automatic speech recognition based on them are one of the important tasks of the development of information technologies. KIRISH Dissertasiya ishining dolzarbligi. Mamlakatimizda mustaqillik yillarida ilm fan sohasida keng ko’lamli ishlar amalga oshirildi. Axborot texnologiyalari sohasida zamonaviy texnologiyalarning joriy etilishi muhim ahamiyat kasb etdi. Sohalarga zamonaviy axborot texnologiyalarning kirib borishi natijasida ilm-fan va tadqiqot sohalarining masalalari kengaydi. Hozirgi kunda har bir sohaga axborot texnologiyalari kirib bormoqda. Davlatimizni yanada barqaror va jadal sur’atlar bilan rivojlantirish uchun mutlaqo yangicha yondashuv hamda tamoyillarni ishlab chiqish va ro’yobga chiqarish, Respublikada olib borilayotgan islohotlar samarasini yanada oshirish, davlat va jamiyatning har tomonlama va jadal rivojlanishi uchun shart- sharoitlar yaratish, mamlakatimizni modernizasiya qilish hamda hayotning barcha sohalarini liberallashtirish bo’yicha ustuvor yo’nalishlarni amalga oshirish maqsadida, O’zbekiston Respublikasi Prezidentining 2017 yil 7 fevraldagi “O’zbekiston Respublikasini yanada rivojlantirish bo’yicha Harakatlar strategiyasi to’g’risida”gi PF-4947-son farmoni qabul qilindi [1]. Mazkur farmonda ko’rsatilgan vazifalarni amalga oshirishda jumladan, nutqni tanib olish usullaridan foydalanib axborot tizimlarida ovozli so’rovlarni amalga oshirish, texnik qurilmalarni ovozli buyruqlar asosida boshqarish, ovozli qidiruv, eshitish va nutqida muammosi mavjud bolalar reabilitasiyasi hamda ularni o’qitish muhim masalalardan biridir . Shuning uchun nutqga dastlabki ishlov berish, ularni tavsiflovchi xarakterli belgilarni ajratish va tanib olish masalalari, intellektual ishlov berish usul va algoritmlarini rivojlantirish hamda ularni nutqni avtomatik tanib olish tizimlarda qo’llash dolzarb muammo hisoblanadi. 3
Tadqiqot obyekti va predmeti . Tadqiqot obyekti sifatida turli sharoitlarda yozib olingan o’zbek tili nutq signallari va ulardan hosil qilingan muhim belgilar to’plami, rekurrent neyron tarmoqlarini o’qitish jarayoni qaralgan. Tadqiqot predmeti sifatida nutq signallarni tanishda foydalaniladigan algoritmlar, nutq signalning parametrlari, nutq signallarga ishlov berishda qo’llaniladigan intelektual algoritmlari va modellar tashkil etadi. Tadqiqotning maqsadi va vazifalari. Tadqiqot maqsadi nutq signallarga ishlov berish algoritmlari tahliliga asoslangan holda o’zbek tili uchun nutq signallarni tanishning neyron tarmog’iga asoslangan algoritmlari va dasturiy vositasini ishlab chiqishdan iborat. Ushbu maqsadga erishish uchun dissertasiya ishida quyidagi vazifalar hal etiladi: - Nutq signallariga ishlov berish va ularni tanib olishga mo’ljallangan adabiyotlar tahlilini olib borish; - nutq signallarga ishlov beruvchi apparat va dasturiy vositalarni tahlil qilish va imkoniyatlarini o’rganish; - nutq signallarga ishlov berish jarayonlarida qo’llaniladigan algoritmlarni, modellarni tahlil qilish va ularning asosiy vazifalarini o’zlashtirish; - neyron tarmoqlariga asoslangan nutq signallarini akustik modellashtirishni usullarini tahlil qilish va tanlash. - O’zbek tili nutqini tanib olishning algoritmi va dasturiy vositasini ishlab chiqish. Tadqiqot usullari. Dissertasiya ishi tadqiqotlarni olib borish quyidagi usullardan foydalaniladi: ehtimollar nazariyasi; timsollarni tanish; ma’lumotlarga intellektual ishlov berish; matematik statistika; chiziqli algebra; signallarga raqamli ishlov berish; obyektga yo’naltirilgan dasturlash. Tadqiqotning ilmiy yangiligi quyidagilardan iborat: 4
audio manbalardan nutq korpusini shakllantirish uchun audio fayl va unga mos keluvchi matnni segmentasiyalash algoritmlari hamda segmentlangan audiofayl va uning matni mosligini tekshiruvchi dasturiy interfeysi ishlab chiqilgan; o’zbek tili nutqini avtomatik tanib olishning rekurrent neyron tarmog’i arxitekturasi yaratilgan. Tadqiqotning amaliy natijasi quyidagilardan iborat: Ishlab chiqilgan algoritmlar va dasturiy vositalar asosida quyidagi tizim va sohalarga keng qo’llash mumkin: turli audio manbalardan nutq korpusini shakllantirish algoritmlari asosida dastur ishlab chiqildi va cheklangan lug’atdagi o’zbek tili nutqini tanish tizimi uchun qo’llandi; nutq signallarini yaxshi ifodalay oladigan, turli halaqitlarga barqaror bo’lgan belgilar vektorini hosil qilish algoritmi va dasturi yaratildi; cheklangan lug’atdagi o’zbek tili nutqini avtomatik tanib olish dasturlari texnikalarni ovozli boshqaruv jarayonlariga qo’llaniladi. Dissertasiyaning hajmi va tuzilishi. Magistrlik dissertasiyasi tarkibi kirish, to’rtta bob, umumiy xulosalar, foydalanilgan adabiyotlar ro’yxati va ilovalardan iborat. Dissertatsiya ishida 4 ta jadval, 38 ta rasm keltirilgan. Dissertasiyaning hajmi 83 betni tashkil etgan. 5