END-TO-END MODELLAR ASOSIDA O‘ZBEK TILIDAGI NUTQNI AVTOMATIK TANIB OLISHNING ALGORITMLARI VA DASTURIY TA’MINOTINI ISHLAB CHIQISH

Главная страница

END-TO-END MODELLAR ASOSIDA O‘ZBEK TILIDAGI NUTQNI AVTOMATIK TANIB OLISHNING ALGORITMLARI VA DASTURIY TA’MINOTINI ISHLAB CHIQISH

Загружено в:

12.08.2023

Скачано:

11

Размер:

3.6 MB

Условия скачивания

$Bu esa nisbatan tor polosali aloqa linyalaridan foydalanish imkoniyatini keltirib chiqaradi, shuningdek, nusxa (shablon)larni tanishni osonlashtiradi (bu axborot hajmi kamaytirilishi hisobiga ro y beradi) [30,31,32].ʻ DKA ning ushbu xususiyatlari uni signallarni siqish nuqtai nazaridan samaradarligini bildiradi, bu signal energiyasining past chastotalarda to planishi ʻ natijasida ro y beradi. Bundan tashqari, hisoblashlarning soddaligi va o rtacha ʻ ʻ kvadratik xatolikning kichik (minimal) bo lishini ta minlaydi. ʻ ʼ Bir o lchovli DKA (teskari DKA) almashtirish quyidagi formulalar orqali ʻ amalga oshiriladi: H ij= C i⋅cos (2 j+1)iπ 2 N , i,j= 0..N − 1 (2.5) С i= { 1 N ,i= 0 2 N ,i>0 Teskari almashtirish jarayoni signal spektrini matrisa koeffisiyentlarini transponirlangani ko paytmasiga tengdir. Ya ni ushbu formula quyidagicha ʻ ʼ keltirilgan: ⃗f= ^H T⋅⃗C . (2.6) Uolsh-Adamar almashtirish Yana bir almashtirishlardan biri bu Uolsh-Adamar hisoblanadi.[30,31] Uni fan tilida WHT almashtirish deb ataydilar. Bu algoritm tasvirlarni siqishda kichik effekt bersada hisoblashni tez fursatlarda amalga oshiradi. U o zining maxsus bazaviy ʻ matrisasiga ega hisoblanadi va u quyidagicha aniqlanadi: С(n)= 1 N⋅∑ k=0 N−1 f(k)⋅HW(n,k) (2.7) Teskari transformatsiya H W T koeffitsientlarining transpozitsiyalangan matritsasi va spektral koeffitsientlar vektorining mahsuloti ko rinishiga ega: ʻ 23$ $ILOVA Ilova A 1-Listing. Audiofaylni freymlarga ajratish: Timesteps=np.arange(len(clip))/sample_rate Fig.ax=plt.subplots(2,figsize=(12,5)) Fig. subplots_adjust(hspace=0.5) Ax[0].plot(timesteps,clip) Ax[0].set_xlabel(‘Vremya(s)’) Ax[0].set_ylabel(‘Amplituda )ʼ Ax[0].set_title(‘Fayl:prts_000002.wav({} samples)’.format(len(clip))) N_fft=1024 Start=45000 X=clip[start:start+n_fft] Ax[0].axvline(start/sample_rate,c=’r’) Ax[0].axvline((start+n_fft)/sample_rate,c=’r’) Ax[1].plot(x) Ax[1].set_xlabel(‘Vremya(ms)’) Ax[1].set_ylabel(‘Amplituda ) ʼ Ax[1].set_title(‘Fayl:prts_000002.wav({} samples)’.format(len(x))); 2-Listing- Xemming oyna funksiyasini qo llash: ʻ Window=get_window(‘hann’,n_fft) Wx=x*window Fig.ax=plt.subplots(1,2,figsize=(16,2)) 78$ $Decoded,log_prob=tf.nn.ctc_greedy_decoder(logits,final_seq_lens) Ler=tf.reduce_mean(tf.edit_distance(tf.cast(decoded[0],tf.int32),labels)) Train_op=tf.train.AdamOptimizer(learning_rate=1e-4).minimize(ctc_loss) Neyron tarmoq yaratilgandan so ng o qitish jarayoniga o tkaziladi.ʻ ʻ ʻ 6-Listing. Neyron tarmoqni o qitish: ʻ With tf.Session(graph=graph) as session: Saver=tf.train.Saver(tf.global_variables()) Snapshot=”ctc” Chekpoint=tf.train.latest_checkpoint(checkpoint_dir=”ch_p”) Last_epoch=0 If checkpoint: Try: Saver.restore(session,checkpoint) Ast_epoch=int(checkpoint.split(‘-’)[-1])+1 Except: Print(“Error load checkpoint”) Else: Tf.global_variables_initializer().run() For epoch in range(last_epoch,num_epochs); For X_bath,seq_lens_batch,y_batch,y_batch_origin batch (X_train1, y_train1,100): Feed_dict={ Input_X:X_batch, Labels:y_batch, Seq_lens:seq_lens_batch} Train_loss,train_ler,train_decoded,true,_=session.run([ctc_loss,ler,decoded[0],label s,train_op],feed_dict=feed_dict) 81$

END-TO-END MODELLAR ASOSIDA O‘ZBEK TILIDAGI NUTQNI AVTOMATIK TANIB OLISHNING ALGORITMLARI VA DASTURIY TA’MINOTINI ISHLAB CHIQISH MUNDARIJA KIRISH ………………………………………………………...................... 4 I- BOB NUTQ SIGNALLARINI AVTOMATIK TANIB OLISHNING USULLAR TAHLILI 7 1.1 -§ Nutq signallarini tarkibi va xususiyatlari ………………….............. 7 1.2 -§ Nutq signallariga dastlabki ishlov berishda qo’llaniladigan algoritmlar tahlili…………………. ……………………….……..... 10 Birinchi bob bo yicha xulosalar.........................................................ʻ 17 II- BOB NUTQ SIGNALLARINI PARAMETRLASH ALGORITMLARI.......................................................................... 18 2.1 -§ Nutq signallarini spektral taqdim etishning algoritmlari va usullari…………………………………………………….….......... 18 2.2 -§ Nutq signalini parametrlash tasnifi…………………….….............. 24 2.3 -§ Nutq korpusi shakllantirish texnologiyalari...................................... 29 Ikkinchi bob bo yicha xulosalar ʻ …..………………………………. 33 III- BOB NUTQNI TANISH TIZIMINI LOYIHALASHTIRISH …........ 34 3.1 -§ Neyron tarmoqlari………………………………………………..... 34 3.2 -§ Chuqur neyron tarmoqlarining arxitekturalari………………......... 40 3.3 -§ Nutqni tanish tizimining strukturali sxemasi……………….......... 43 3.4 -§ Neyron tarmoqni loyihalashtirish va arxitekturasini ishlab chiqish……………………………………………………………… 45 Uchinchi bob bo yicha xulosalar ʻ …..……………………………… 58 IV- BOB End-to-End tizimiga asosan nutqni tanish modulini ishlab chiqish ….….……........................................................................... 59 4.1 -§ Python dasturlash tili. TensorFlow kutubxonasi………………........ 59 4.2 -§ Tanib olish modullarini dasturiy amalga oshirish.............................. 61 4.3 -§ Nutqni tanib olish moduli ishini sifatini baholash............................. 64 To‘rtinchi bob bo yicha xulosalar ʻ ………………………………… 67 1

XULOSA …………………………………………………..…....................... 69 ADABIYOTLAR RO YXATIʻ ………………………………………….… 71 ILOVALAR …………………………………………………..….............… 76 ANNOTATSIYA Ushbu ilmiy tadqiqot ishida neyron tarmoqlari modeli asosida o‘zbek tili nutqi nutqini tanib olish masalasini yechish jarayoni o‘rganib chiqilgan. Nutq signallariga ishlov berish, ularni tanib olish va tahlil qilish uchun avtomatlashtirilgan tizimlar yaratishning mavjud usul va algoritmlarini takomillashtirish hamda yangi hisoblash algoritmlarini ishlab chiqishga yo‘naltirilgan keng qamrovli ilmiy-tadqiqot ishlari olib borilgan. N utq signallarga ishlov berish algoritmlari tahliliga asoslangan holda o’zbek tili uchun nutq signalarlarni tanishning neyron tarmog’iga asoslangan algoritmlari va dasturiy vositasi ishlab chiqilgan. Bu borada, nutq korpusini shakllantirish, nutq signallarini xarakterlovchi belgilarni ajratish usullari takomillashtirish va yaratish hamda ushbu xarakterlovchi belgilar asosida tanib olish algoritmlarini ishlab chiqish, ular asosida nutqni avtomatik tanib olishning dasturiy vositalarini yaratish axborot texnologiyalarini rivojlantirishning muhim vazifalaridan biri hisoblanadi. ANNOTATION In this scientific research, the process of solving the problem of Uzbek language speech recognition based on the neural network model was studied. Comprehensive research and development activities aimed at improving the existing methods and algorithms for creating automated systems for processing speech signals, their recognition and analysis, as well as developing new calculation algorithms have been carried out. In this regard, the formation of a speech corpus, the improvement and creation of methods for distinguishing characters characterizing speech signals, the development of recognition algorithms based on these characterizing characters, and 2

the creation of software tools for automatic speech recognition based on them are one of the important tasks of the development of information technologies. KIRISH Dissertasiya ishining dolzarbligi. Mamlakatimizda mustaqillik yillarida ilm fan sohasida keng ko’lamli ishlar amalga oshirildi. Axborot texnologiyalari sohasida zamonaviy texnologiyalarning joriy etilishi muhim ahamiyat kasb etdi. Sohalarga zamonaviy axborot texnologiyalarning kirib borishi natijasida ilm-fan va tadqiqot sohalarining masalalari kengaydi. Hozirgi kunda har bir sohaga axborot texnologiyalari kirib bormoqda. Davlatimizni yanada barqaror va jadal sur’atlar bilan rivojlantirish uchun mutlaqo yangicha yondashuv hamda tamoyillarni ishlab chiqish va ro’yobga chiqarish, Respublikada olib borilayotgan islohotlar samarasini yanada oshirish, davlat va jamiyatning har tomonlama va jadal rivojlanishi uchun shart- sharoitlar yaratish, mamlakatimizni modernizasiya qilish hamda hayotning barcha sohalarini liberallashtirish bo’yicha ustuvor yo’nalishlarni amalga oshirish maqsadida, O’zbekiston Respublikasi Prezidentining 2017 yil 7 fevraldagi “O’zbekiston Respublikasini yanada rivojlantirish bo’yicha Harakatlar strategiyasi to’g’risida”gi PF-4947-son farmoni qabul qilindi [1]. Mazkur farmonda ko’rsatilgan vazifalarni amalga oshirishda jumladan, nutqni tanib olish usullaridan foydalanib axborot tizimlarida ovozli so’rovlarni amalga oshirish, texnik qurilmalarni ovozli buyruqlar asosida boshqarish, ovozli qidiruv, eshitish va nutqida muammosi mavjud bolalar reabilitasiyasi hamda ularni o’qitish muhim masalalardan biridir . Shuning uchun nutqga dastlabki ishlov berish, ularni tavsiflovchi xarakterli belgilarni ajratish va tanib olish masalalari, intellektual ishlov berish usul va algoritmlarini rivojlantirish hamda ularni nutqni avtomatik tanib olish tizimlarda qo’llash dolzarb muammo hisoblanadi. 3

Tadqiqot obyekti va predmeti . Tadqiqot obyekti sifatida turli sharoitlarda yozib olingan o’zbek tili nutq signallari va ulardan hosil qilingan muhim belgilar to’plami, rekurrent neyron tarmoqlarini o’qitish jarayoni qaralgan. Tadqiqot predmeti sifatida nutq signallarni tanishda foydalaniladigan algoritmlar, nutq signalning parametrlari, nutq signallarga ishlov berishda qo’llaniladigan intelektual algoritmlari va modellar tashkil etadi. Tadqiqotning maqsadi va vazifalari. Tadqiqot maqsadi nutq signallarga ishlov berish algoritmlari tahliliga asoslangan holda o’zbek tili uchun nutq signallarni tanishning neyron tarmog’iga asoslangan algoritmlari va dasturiy vositasini ishlab chiqishdan iborat. Ushbu maqsadga erishish uchun dissertasiya ishida quyidagi vazifalar hal etiladi: - Nutq signallariga ishlov berish va ularni tanib olishga mo’ljallangan adabiyotlar tahlilini olib borish; - nutq signallarga ishlov beruvchi apparat va dasturiy vositalarni tahlil qilish va imkoniyatlarini o’rganish; - nutq signallarga ishlov berish jarayonlarida qo’llaniladigan algoritmlarni, modellarni tahlil qilish va ularning asosiy vazifalarini o’zlashtirish; - neyron tarmoqlariga asoslangan nutq signallarini akustik modellashtirishni usullarini tahlil qilish va tanlash. - O’zbek tili nutqini tanib olishning algoritmi va dasturiy vositasini ishlab chiqish. Tadqiqot usullari. Dissertasiya ishi tadqiqotlarni olib borish quyidagi usullardan foydalaniladi: ehtimollar nazariyasi; timsollarni tanish; ma’lumotlarga intellektual ishlov berish; matematik statistika; chiziqli algebra; signallarga raqamli ishlov berish; obyektga yo’naltirilgan dasturlash. Tadqiqotning ilmiy yangiligi quyidagilardan iborat: 4

END-TO-END MODELLAR ASOSIDA O‘ZBEK TILIDAGI NUTQNI AVTOMATIK TANIB OLISHNING ALGORITMLARI VA DASTURIY TA’MINOTINI ISHLAB CHIQISH

12.08.2023

11

3.6 MB

Загрузите документ, чтобы увидеть его полностью.

Похожие