KOMPYUTER LEKSIKOGRAFIYASI
KOMPY UTER LEKSIKOGRA FIY A SI Reja: 1. Kompyuter leksikografiyasi kompyuter lingvistikasining alohida yo‘nalishi sifatida 2. Kompyuter lug‘atlari va ularning ishlash tamoyili 3. Kompyuter leksikografiyasi sohasining rivojlanishi
Ma’lumki, leksikografiya tilshunoslik fanining amaliy sohalaridan biri hisoblanadi. U yunoncha «lexikos» - «so‘z», «lug‘at», «grapho» - yozaman degan ma’nolarni anglatadi. Leksikografiya bo‘limida lug‘atlar, ularni tu-zish yo‘llari va tamoyillari o‘rganiladi. Avtomatizatsiya ijtimoiy hayotning barcha jabhalariga kirib kelishi natijasida lug‘atlar ham elektron holatda yaratilish imkoniyati yuzaga keldi. Kompyuter yordamida lug‘atlar bilan ishlashning oplimallashuvi natijasida kompyuter leksikografiyasi yo‘nalishi shakllandi. Kompyuter leksikografiyasi amaliy tilshunoslikning muhim tarkibiy qismi bo‘lib, unda lingvistik va dasturiy ta’minot asosida ishlaydi-gan, kodlash va dekodlash prinsipi asosida yaratilgan kompyuter lug‘atlari, ularni tuzish dasturlari, algoritmlari o‘rganiladi. Mazkur sohaning rivojla-nishi natijasida turli nomlarda elektron lug‘atlar yaratilmoqda. Eng mash-hur elektron lug‘atlar sirasiga CONTEXT, ABBY LINGVO, MULTl-TRAN, POLYGLOSSTJM, MULTILEKS kabilar kiradi. Leksikografiya sohasiga kompyuter texnologiyalarining tatbiq etilishi lug‘at tuzish ishlarini ancha yengillashtiradi. Lug‘at tuzish jarayonining naqadar murakkabligini bir tilshunos olim hazilomuz tarzda quyidagicha izohlagan: «Agar biror kislii og ‘ ir jinoyat sodir qilsa, imi katorgaga surgun qilish shart emas. U lug‘at tuzsin, sliunda и katorganing barcha azoblarini, qiyinchiliklarini tortgan bo‘ladi». Axborot manbalarini yig‘ish bo‘yicha maxsus dasturlar (Database Software) lug‘at asosini tashkil etuvchi barcha ma’lumot va
misollarni jamlash va sistematik tarzda ishlov berishga qulaylik tug ‘ diradi. Bundan tashqari, boshqa maxsus dasturlar lug‘atni tahrir qi lish va chop etish borasidagi ancha mashaqqatli mehnatni bir qancha oson lashtiradi. Elektron lug ‘ atlar ham, o‘z navbatida, an’anaviy lug‘atlarga qaraganda birmuncha afzalliklarga ega. Bugungi kunda, masalan, ABBY LINGVO kompaniyasining lug ‘ at va tarjima dasturlari ulardan foydalanuvchi har bir xaridorga o‘z lug‘atini tuzish yoki mavjud lug‘at so‘z boyligini to‘ldirib borish imkonini beradi. Ochiq turdagi Internet lug‘atlari (on-line lug‘at lar) ham ko‘p hollarda barcha foydalanuvchilarga ushbu lug‘atlarni to‘ldirish imkonini beradi. Shuningdek, elektron lug‘atlarning hajm jihatidan ixchamligi, kompaktligi, boshqa manbalarga (Internet tarmog‘i orqali, giper-murojaatlar yordamida) ulanish imkoniyati, mavjud matnlar korpuslari yordamida illustrativ misollar tuza olish imkoniyati, multimediali misollar bilan boyitilganligi, so‘zlarning sinonimik variantlari, omonimlik xususiyatlari, grammatik ma’lumotlar bilan ta’minlanganligi va ularning tezlik bilan foydalanuvchiga havola etilishi kabi jihatlari elektron lug‘atlarning optimalligini ta’minlaydi. Kompyuter leksikografiyasini elektron matnlar korpusi yoki parallel matnlar korpuslarisiz tasavvur qilish mumkin emas. Mat nlar k orpusi (« cor pus» lot incha « t ana» degan ma’noni anglat adi) - bu elektron holda saqla- nadigan ma’lum til birliklari
bo‘lib, ular tilshunoslar uchun turli xil muam-molarni hal etish uchun tatbiq etishda va turli yo‘nalishdagi tadqiqotlar uchun zaruriyatga qarab turli shakllarda tuziladi. Bular fonema, grafema, morfefrfalardan tortib undan kattaroq birliklar - leksema, gap va matnlardan (badiiy yoki ilmiy asar, gazeta va jurnal matnlari) tashkil topishi mumkin. Ularning qay tarzda saqlanishiga qarab maxsus dasturlar yorda mida har bir kerakli so‘z yoki so‘z birikmasi uchun darhol uning qo‘llanishi bo‘yicha misollar topilishi, imlo bo‘yicha variantlari, sinonimik qatorlari topilishi mumkin. Matnlar korpusiga oid ilmiy tadqiqotlar salmog‘ining ko‘payishi natijasida tilshunoslikda k orpus lingv ist ik asi yo‘nalishi shakl-landi. Kompyuterda yaratilgan birinchi matnlar korpusi Braun korpusi (БК, inglizcha Brown Corpus, ВС) hisoblanadi, u 1961-yilda Braun universiteti-da yaratilgan, har biri 2000 so‘zli 500 ta matn fragmentini o‘z ichiga oladi. 1970-yillarda 1 mln so‘zni o‘z ichiga olgan matnlar korpusi asosida rus tilining chastotali lug‘ati yaratildi. 1980-yillarda Shvetsiyaning Upsala uni-versitetida ham rus tilida matnlar korpusi yaratildi. Keyinchalik kompyuter leksikografiyasining rivojlanishi natijasida katta hajmli matnlar korpusiga ehtiyoj tug‘ildi. Ya’ni 1 mln ta so‘z elektron lug‘atlar bazasi uchun yetarli emas. Shu asosda yirik hajmli matnlar korpusi yaratila boshlandi. Ko‘pgina mamlakatlarda XX asrning 80- yillaridan boshlab bunday korpuslar tuzila boshlandi. Ular turli maqsad va vazifalarga xizmat qiladi. Buyuk Britani-yada Ingliz tili
Banki (Bank of English) hamda Br it amy a MiUiy Korpusi (British National Corpus, BNC), Rossiyada Rus tilining mashina fundi фашинный фонд русского ячыка) hamda Rus tilining MiUiy Korpusi (Цаииоиальный корпус русского языка) loyihalari ishlab chiqildi.73 Masalan, Rus tilining milliy korpusi hajmi hozirgi kunda 149 mln so‘zdan iborat. Keyingi yillarda Internet tizimining rivojlanishi virtual matnlar kor pusi yuzaga kelishiga olib keldi. Ya’ni Internetdagi qidiriv saytlari, elek-tron kutubxonalar, virtual ensiklopediyalar korpus vazifasini bajarmoqda. Korpusning janri va tematik rang-barangligi Internetdan foydalanuvchi-ning qiziqishlariga bogiiq. Masalan, ilm-fan doirasida Wikipedia katta hajm-dagi matnlar korpusi sifatida foydalanilmoqda.74 Korpus lingvistikasida parallel matnlar korpusi ham muhim ahamiyat kasb etadi. Parallel matnlar korpusi esa, o‘z navbatida, badiiy asar, qo‘llanma, ommaviy axborot vositalari, turli xil hujjatlarning ikki yoki undan ko‘p tillardagi elektron holdagi ko‘rinishlaridir. Masalan, Yevropa Ittifoqi o‘zining barcha qonun va hujjatlarini ingliz, fransuz, nemis, ispan va ital-yan tillarida nashr qiladi hamda ular Internet tizimiga barchaga ochiq arxiv sifatida qo‘yiladi. Bunday korpuslarning afzalligi shundaki, ular yordami- da nafaqat biron bir so‘z yoki jumlaning, balki butun boshli matnlarning turli tillardagi variantlarini bilish imkoniyati mavjud. Xuddi mana shu im-koniyat tufayli maxsus konkordanser dasturlar ishlab chiqish orqali turli xil ixtisoslik lug‘atlari tuzish