logo

KOMPYUTER LEKSIKOGRAFIYASI

Yuklangan vaqt:

08.08.2023

Ko'chirishlar soni:

0

Hajmi:

23.98828125 KB
KOMPY UTER LEKSIKOGRA FIY A SI
Reja:
1. Kompyuter leksikografiyasi kompyuter 
lingvistikasining alohida yo‘nalishi sifatida
2. Kompyuter lug‘atlari va ularning ishlash tamoyili
3. Kompyuter leksikografiyasi sohasining rivojlanishi Ma’lumki,   leksikografiya   tilshunoslik   fanining   amaliy
sohalaridan   biri   hisoblanadi.   U   yunoncha   «lexikos»   -   «so‘z»,
«lug‘at»,   «grapho»   -   yozaman   degan   ma’nolarni   anglatadi.
Leksikografiya   bo‘limida   lug‘atlar,   ularni   tu-zish   yo‘llari   va
tamoyillari   o‘rganiladi.   Avtomatizatsiya   ijtimoiy   hayotning   barcha
jabhalariga   kirib   kelishi   natijasida   lug‘atlar   ham   elektron   holatda
yaratilish imkoniyati yuzaga keldi. Kompyuter yordamida lug‘atlar
bilan   ishlashning   oplimallashuvi   natijasida   kompyuter
leksikografiyasi   yo‘nalishi   shakllandi.   Kompyuter   leksikografiyasi
amaliy tilshunoslikning muhim tarkibiy qismi bo‘lib, unda lingvistik
va   dasturiy   ta’minot   asosida   ishlaydi-gan,   kodlash   va   dekodlash
prinsipi   asosida   yaratilgan   kompyuter   lug‘atlari,   ularni   tuzish
dasturlari,   algoritmlari   o‘rganiladi.   Mazkur   sohaning   rivojla-nishi
natijasida   turli   nomlarda   elektron   lug‘atlar   yaratilmoqda.   Eng
mash-hur   elektron   lug‘atlar   sirasiga   CONTEXT,   ABBY   LINGVO,
MULTl-TRAN, POLYGLOSSTJM, MULTILEKS kabilar kiradi.
Leksikografiya   sohasiga   kompyuter   texnologiyalarining   tatbiq
etilishi   lug‘at   tuzish   ishlarini   ancha   yengillashtiradi.   Lug‘at   tuzish
jarayonining naqadar murakkabligini bir tilshunos olim hazilomuz
tarzda   quyidagicha   izohlagan:   «Agar   biror   kislii   og ‘ ir   jinoyat   sodir
qilsa, imi katorgaga surgun qilish shart emas. U lug‘at tuzsin, sliunda
и   katorganing   barcha   azoblarini,   qiyinchiliklarini   tortgan   bo‘ladi».
Axborot   manbalarini   yig‘ish   bo‘yicha   maxsus   dasturlar   (Database
Software)   lug‘at   asosini   tashkil   etuvchi   barcha   ma’lumot   va misollarni   jamlash   va   sistematik   tarzda   ishlov   berishga   qulaylik
tug ‘ diradi.   Bundan   tashqari,   boshqa   maxsus   dasturlar   lug‘atni
tahrir qi lish va chop etish borasidagi ancha mashaqqatli mehnatni
bir   qancha   oson   lashtiradi.   Elektron   lug ‘ atlar   ham,   o‘z   navbatida,
an’anaviy   lug‘atlarga   qaraganda   birmuncha   afzalliklarga   ega.
Bugungi   kunda,   masalan,   ABBY   LINGVO   kompaniyasining   lug ‘ at
va   tarjima   dasturlari   ulardan   foydalanuvchi   har   bir   xaridorga   o‘z
lug‘atini   tuzish   yoki   mavjud   lug‘at   so‘z   boyligini   to‘ldirib   borish
imkonini   beradi.   Ochiq   turdagi   Internet   lug‘atlari   (on-line
lug‘at lar)   ham   ko‘p   hollarda   barcha   foydalanuvchilarga   ushbu
lug‘atlarni   to‘ldirish   imkonini   beradi.   Shuningdek,   elektron
lug‘atlarning   hajm   jihatidan   ixchamligi,   kompaktligi,   boshqa
manbalarga   (Internet   tarmog‘i   orqali,   giper-murojaatlar
yordamida)   ulanish   imkoniyati,   mavjud   matnlar   korpuslari
yordamida   illustrativ   misollar   tuza   olish   imkoniyati,   multimediali
misollar   bilan   boyitilganligi,   so‘zlarning   sinonimik   variantlari,
omonimlik   xususiyatlari,   grammatik   ma’lumotlar   bilan
ta’minlanganligi   va   ularning   tezlik   bilan   foydalanuvchiga   havola
etilishi   kabi   jihatlari   elektron   lug‘atlarning   optimalligini
ta’minlaydi.
Kompyuter   leksikografiyasini   elektron   matnlar   korpusi   yoki
parallel   matnlar   korpuslarisiz   tasavvur   qilish   mumkin   emas.
Mat nlar   k orpusi   (« cor pus»   lot incha   « t ana»   degan   ma’noni
anglat adi)   -   bu   elektron   holda   saqla- nadigan   ma’lum   til   birliklari bo‘lib,   ular   tilshunoslar   uchun   turli   xil   muam-molarni   hal   etish
uchun   tatbiq   etishda   va   turli   yo‘nalishdagi   tadqiqotlar   uchun
zaruriyatga qarab turli shakllarda tuziladi. Bular fonema, grafema,
morfefrfalardan   tortib   undan   kattaroq   birliklar   -   leksema,   gap   va
matnlardan   (badiiy   yoki   ilmiy   asar,   gazeta   va   jurnal   matnlari)
tashkil   topishi   mumkin.   Ularning   qay   tarzda   saqlanishiga   qarab
maxsus dasturlar yorda mida har bir kerakli so‘z yoki so‘z birikmasi
uchun   darhol   uning   qo‘llanishi   bo‘yicha   misollar   topilishi,   imlo
bo‘yicha  variantlari,   sinonimik  qatorlari  topilishi  mumkin.   Matnlar
korpusiga   oid   ilmiy   tadqiqotlar   salmog‘ining   ko‘payishi   natijasida
tilshunoslikda  k orpus lingv ist ik asi  yo‘nalishi shakl-landi.
Kompyuterda   yaratilgan   birinchi   matnlar   korpusi   Braun
korpusi (БК, inglizcha Brown Corpus, ВС) hisoblanadi, u 1961-yilda
Braun   universiteti-da   yaratilgan,   har   biri   2000   so‘zli   500   ta   matn
fragmentini   o‘z   ichiga   oladi.   1970-yillarda   1   mln   so‘zni   o‘z   ichiga
olgan   matnlar   korpusi   asosida   rus   tilining   chastotali   lug‘ati
yaratildi.   1980-yillarda   Shvetsiyaning   Upsala   uni-versitetida   ham
rus   tilida   matnlar   korpusi   yaratildi.   Keyinchalik   kompyuter
leksikografiyasining   rivojlanishi   natijasida   katta   hajmli   matnlar
korpusiga   ehtiyoj   tug‘ildi.   Ya’ni   1   mln   ta   so‘z   elektron   lug‘atlar
bazasi uchun yetarli emas. Shu asosda yirik hajmli matnlar korpusi
yaratila   boshlandi.   Ko‘pgina   mamlakatlarda   XX   asrning   80-
yillaridan   boshlab   bunday   korpuslar   tuzila   boshlandi.   Ular   turli
maqsad   va   vazifalarga   xizmat   qiladi.   Buyuk   Britani-yada   Ingliz   tili Banki   (Bank   of   English)   hamda   Br   it   amy   a   MiUiy   Korpusi   (British
National   Corpus,   BNC),   Rossiyada   Rus   tilining   mashina   fundi
фашинный   фонд   русского   ячыка)   hamda   Rus   tilining   MiUiy
Korpusi (Цаииоиальный корпус русского языка) loyihalari ishlab
chiqildi.73 Masalan, Rus tilining milliy korpusi hajmi hozirgi kunda
149   mln   so‘zdan   iborat.   Keyingi   yillarda   Internet   tizimining
rivojlanishi   virtual   matnlar   kor pusi   yuzaga   kelishiga   olib   keldi.
Ya’ni   Internetdagi   qidiriv   saytlari,   elek-tron   kutubxonalar,   virtual
ensiklopediyalar   korpus   vazifasini   bajarmoqda.   Korpusning   janri
va   tematik   rang-barangligi   Internetdan   foydalanuvchi-ning
qiziqishlariga   bogiiq.   Masalan,   ilm-fan   doirasida   Wikipedia   katta
hajm-dagi matnlar korpusi sifatida foydalanilmoqda.74
Korpus   lingvistikasida   parallel   matnlar   korpusi   ham   muhim
ahamiyat   kasb   etadi.   Parallel   matnlar   korpusi   esa,   o‘z   navbatida,
badiiy   asar,   qo‘llanma,   ommaviy   axborot   vositalari,   turli   xil
hujjatlarning   ikki   yoki   undan   ko‘p   tillardagi   elektron   holdagi
ko‘rinishlaridir. Masalan, Yevropa Ittifoqi o‘zining barcha qonun va
hujjatlarini   ingliz,   fransuz,   nemis,   ispan   va   ital-yan   tillarida   nashr
qiladi   hamda   ular   Internet   tizimiga   barchaga   ochiq   arxiv   sifatida
qo‘yiladi.   Bunday   korpuslarning   afzalligi   shundaki,   ular   yordami-
da   nafaqat   biron   bir   so‘z   yoki   jumlaning,   balki   butun   boshli
matnlarning   turli   tillardagi   variantlarini   bilish   imkoniyati   mavjud.
Xuddi   mana   shu   im-koniyat   tufayli   maxsus   konkordanser
dasturlar   ishlab   chiqish   orqali   turli   xil   ixtisoslik   lug‘atlari   tuzish imkoniyati   tug‘iladi.   Ushbu   imkoniyatlar   komp-yuter
leksikografiyasi uchun ulkan ahamiyat kasb etadi.
Kompyuter   leksikografiyasiga   semantik   maydon,   semantik
tarmoq,   se mantik   tokr   hamda   freym   semantikasining   faol   tatbiq
etilishi   natijasida   ul kan   kompyuter   leksikografiya   resurslari
yaratildi. Shunday yirik lek-sikografik  resurslardan  biri FRAMENET
bo‘lib, u Internet tizimida on-line rejimida ishlaydi.75 Mazkur tizim
Ch.Fillmorning   «Tools   for   Lexicon   Buil ding»   loyihasi   asosida
Kaliforniya   shtati,   Berkli   shahridagi   Xalqaro   infor-matika
institutida ishlab chiqilgan. Framenet resursining ma’lumotlar ba-
zasida 10 000 ta leksik birlik mavjud, undan 6000 dan ortig‘i toiiq
anno-tatsiyaga ega. Bundan tashqari, ma’lumotlar bazasida 800 ta
semantik   freym   ko‘rsatilgan,   135   000   annotatsiyali   gaplar
keltirilgan.
Elektron   lug‘atlar   tuzish   jarayonida   ma’lumotlar   ombori,
matnlar   korpusini   yaratish,   qidiruv   tizimi,   kodlash,   lingvistik   va
dasturiy ta’minot un-surlari qatorida lemmatizatsiya bosqichi ham
mavjud.   Lemmatizatsiya   -   bu   so‘zning   dastlabki,   boshlang‘ich
formasini   (lug‘atdagi   shaklini   -   lemmasi-ni)   tashkillashtirish
texnikasi bo‘lib, bu jarayon o‘sha so‘zning boshqa so‘z-shakllaridan
kelib chiqqan holda amalga oshiriladi. Lemmatizatsiya mor-fologik
tahlil   metodi   tarkibiga   kiradi,   u   ikki   bosqichni   o‘z   ichiga   oladi:   1)
deklarativ   bosqich   -   bunda   muayyan   so‘zning   mumkin   bo‘lgan
barcha shakl-lari (so‘z-shakllar) belgiianadi; 2) protsedura bosqichi -   bunda   so‘z   asos   va   qo‘shimchalarga,   ya’ni   leksemalarga   yoki
morfemalarga   bo‘linadi.   Lem matizatsiya   so‘zlaming   grammatik
valentligi,   qaysi   affikslar   bilan   birika   olish   imkoniyatini   ham
belgilab beradi. Masalan, o‘zbek tilida so‘zlaming lug‘atdagi shakli
- lemmasi quyidagicha:
ot so‘z turkumi uchun - bosh kelishik, birlik shakli;
fe’l so‘z turkumi uchun - harakat nomi shakli;
sifat so‘z turkumi uchun - oddiy daraja shakli.
Daftarlarni,   daftarlarga,   daftarlarning,   daftarlardan,
daftarlarda ! daftar Yugurdi, yugurgan, yuguryapti, yugurmoqchi !
yugurmoq   Ko‘kimtir,   ko‘kish,   ko‘kroq   !   ko‘k   Kitobiy   lug‘atlar   va
elektron lug‘atlarning farqi quyidagilarda ko‘rinadi:
1. Kitobiy lug‘atlarning tuzilishi: 
a) lug‘atning so‘zligi shakllantiriladi;
b) misollar kartotekalari tuziladi; 
c) lug‘at maqolalari yoziladi; 
d) lug‘atning qolyozrrm varianti tayyorlanadi; 
e) qo‘lyozma tahrir etiladi; 
f) muallif tuzatishlar qiladi; 
g) nashr uchun teriladi; 
h) lug‘at sahifalanadi; 
i) korrektirovkaqilinadi; 
j) lug‘at nashr etiladi.
2. Elektron lug‘atlarning tayyorlanishi:  a) lug‘atning so‘zligi shakllanti riladi; 
b) misollar korpusi (elektron kartotekalari) tuziladi; 
c) lug‘at maqolalari yoziladi; 
d) lug‘at maqolalarini ma’lumotlar bazasiga ko‘chiriladi;
e)   bevosita   ma’lumotlar   bazasida   lug‘at   matni   tahrir   etiladi,
korrektirovka
qilinadi; 
f) lingvistik ta’minot dasturiy ta’minot bilan uyg‘unlashtiriladi;
g) elektron lug‘at.
Kitobiy   lug‘atlar   tuzilishi   sahifalar   ketma-ketligiga   tayanadigan
chiziq-lilik   tamoyiliga   bo‘ysunadi.   Elektron   lug‘atlar   strukturasi
gipertekst   tex-nologiyasiga   asoslangan   bo‘ladi,   bu   esa
foydalanuvchiga   lug‘at   maqola-larining   ixtiyoriy   qismiga   tezkor
murojaat qilish imkonini beradi.
Elektron   lug‘atlarning   ishlash   prinsiplarini   umumlashtirib
quyidagicha izohlash mumkin:76 Tilning har bir so‘ziga mutanosib
keluvchi   kod   ishlab   chiqiladi   va   qo‘llanadi,   kodni   qayta   ishlash
jarayonida   zaruriy   bo‘lgan   Ma’lumotlar   ombori   ma’lumotlar,
tarjimalar, sinonim, antonim va sharhlarga ega bo‘lish mumkin.
So‘zlarni   kodlashtirish   quyidagicha   amalga   oshiriladi.
Ma’lumotlar tekst fayllarga joylashtiriladi, uning har bir elementi 3
qismdan iborat bo‘ladi: 
1) so‘zning tartib raqami; 
2) so‘z;  3) kod.
«So‘zning   tartib   raqami»   (ya’ni   uning   adresi).   So‘zlarning
tarjimasi, si-nonimlari va antonimlarini ko‘rsatish ularning birinchi
harflarini ko-dirovkadagi tartib raqamlari bilan birgalikda keltirish
bilan amalga oshi riladi.
«So‘z» - mutanosib alfavit harflari bilan yozilgan oddiy so‘z.
«Kod» - raqam va harflar ketma-ketligi boiib, unda so‘z barcha
zaruriy   morfologik,   sintaktik,   leksik   xususiyatlari   hamda   ushbu
so‘zning   qaysi   so‘zga   tegishliligi   haqidagi   ma’lumotlar   jamlangan
bo‘ladi: grammatik ma’lumot, adreslar, tarjima, sinonim, antonim,
mutanosib sharhlar.
Kodlarni yaratish CREATE va CREATE 1 dasturlari orqali amalga
oshiriladi. Ular quyidagi tartibda ishlaydi:
So‘z kiritiladi.
Grammatik   ma’lumotlar   yaratiladi   -   kompyuter   so‘z   haqida
mor fologik va sintaktik ma’lumotlarni so‘raydi va ular darhol aniq
nisbat asosida shifrlanadi.
Tayyor shifr «Grammatik ma’lumotlar» bo‘limiga yozib qo‘yiladi.
3. Tarjimalar sinonimlar, antonimlar adreslari yaratiladi: 
a) tarjimasi bolishi mumkin bo‘lgan so‘z so‘raladi;
b) kiritilgan so‘z kodning mutanosib bo‘limiga yozib qo‘yiladi;
v)   kodlashning   oxirida   tarjimalar   (sinonimlar,   antonimlar)   kodi
topiladi   va   kiritilgan   so‘zlar   o‘rniga   ularning   birinchi   harflari   va
tartib   raqamlari   yoziladi   (masalan,   «katta»   so‘zi   o‘rniga   K0083), agar tarjimalar (sinonim, antonimlar) kodi topilmasa, u holda shu
so‘zga nisbatan kodlash operatsi-yasi amalga oshiriladi va bu bilan
bosqich tamomlanadi.
5. Mazkur so‘zga sharh kiritiladi:
matn kiritiladi;
maxsus   dastur   asosida   so‘z   va   unng   sharhi   orasidagi   moslik
belgilanadi,   so‘ngra   kiritilgan   matn   xotiraga   yoziladi,   ular
orasidagi moslik csa so‘z kodida o‘z ifodasini topadi.
Dastur   ishlay   boshlashi   bilan   ekranda   u   va   uni   ishlab
chiquvchilari   haqida   ma’Iumotlar   paydo   bo‘Iadi.   Ular   bilan
tanishilgandan   so‘ng   klavish   bosiladi   va   dastur   quyidagi
bosqichlarda o‘z ishini davom ettiradi:
1. Ekranga 6 rejimga ega oyna chiqdi.
I-rejim.   Only   translation   (faqat   tarjima)   -   podstrochnikda
foydalani-ladigan   tarjimalarni   va   mazkur   so‘zning   qaysi   sohaga
tegishliligi   haqidagi   ma’Iumotlarni   beradi.   Mazkur   rejimning
asosiy   funksiyasini   Only-tran   maxsus   protsedurasi   amalga
oshiradi.   Ushbu   protsedura,   avvalo,   mazkur   so‘z   l$pdining
adreslar   bo‘Iimidan   tarjimalar   adresini   izlab   topadi.   So‘ng   uni
qayta   ishlashni   boshlaydi:   tarjimaning   birinchi   harfini   olib,   tekst
faylini   ochadr   (shu   harf   bilan   nomlangan)   va   berilgan   tartib
raqamiga ko‘ra tarji-mani topib, uni ekranga chiqaradi.
Grammatical   information   (grammatik   ma’Iumotlar)   -   so‘zning
barcha   morfologik   va   sintaktik   xususiyatlari   va   undan foydalanishdagi   ayrim   noa-niqliklar   haqidagi   ma’Iumotlarni
beradi.   Gram   info   maxsus   protsedurasi   ishlaydi.   Grammatik
ma’Iumotlar   kodi   bo‘limidajamlangan   ma’Iumotlarni   rasshifrovka
qiladi.
List of synonyms (sinonimlar ro‘yxati).
List of antonyms (antonimlar ro‘yxati).
Ushbu   rejimlar   Syn-List   va   Ant-list   maxsus   protseduralar
yordamida   sinonimlar   va   antonimlar   ro‘yxatini   beradi.   Ular
quyidagi   tartibda   ishlay di:   sinonim   va   antonimlar   kiritilgan   so‘z
kodning «sinonimlar adresi» va «antonimlar adresi» bo‘Iimlaridan
topiladi hamda ekranga chiqariladi.
5. New word formation (yangi so‘zlarni qayta yasash) - mazkur
so‘z   bi   lan   bir   xil   o‘zakka   ega   bo‘igan   barcha   so‘zlarni   chiqarib
beradi. Asosiy ish NWF protsedurasi vositasida amalga oshiriladi:
so‘zning o‘zagi ajratiladi;
so‘z   haqidagi   barcha   ma’lumotJarga   ega   bo‘igan   holda   ushbu
o‘zakka old qo‘shimcha va boshqa qo‘shimchalarni qo‘shish orqali
o‘zgartirilishi niumkin bo‘lgan barcha so‘zlarni chiqarib beradi.
6.   Comments   (sharhlar)   -   o‘rganilayotgan   so‘z   tez   esda   qolishi
uchun   «aytib   berish»   (podskazka)   ko‘rinishidagi   sharhlarni
chiqarib beradi.
II.   Ish   uchun   zarur   bo‘lgan   rejim   tanlanganidan   so‘ng   so‘z
kiritiladi.   Ayrim   elektron   lug‘atlarda   leksikon   bazasi   ozligi   sababli
ayrim so‘zlarning xotirada kodi bo‘lmasligi ham mumkin. Shuning uchun   kirishdan   so‘ng   Find   Word   protsedurasi   ish   boshlaydi.
Uning   vazifasi   xotiradagi   so‘z   kodini   izlash-   dan   iborat.   Agar   u
topilsa,  maxsus   protseduralar  uzatiladi,  aks  holda  quyidagi  xabar
chiqadi   «Sorry,   I   do   not   know   (Uzr,   men   buni   bilmayman)   va
keyingi so‘z kiritiladi.
Topilgan   kod   tanlangan   rejimning   maxsus   dasturlari   bilan
qayta   ishlanadi,   buning   natijasida   talab   qilingan   ma’lumotlar
chiqariladi.
Tanlangan   rejimlarda   ishni   davom   ettirish   haqida   so‘raladi.
«Ha»   javobidan   so‘ng   dastur   ishi   ikkinchi   bosqichda   davom
ettiriladi. Aks holda keyingi bosqichga o‘tiladi.
V. Dastur ishini tamom qilish haqida so‘raladi.
Kompyuter   leksikografiyasi   bugungi   kunda   turli   qo‘shimcha
imkoniyatlar   asosida   rivojlanib   bormoqda.   Xususan,   dastlab
kompyuter lug‘atlari bir tilli, ikki tilli bo‘lgan, hozirda ko‘p tilli (uch,
to‘rt,   olti,   o‘n   tilli)   elektron   lug‘atlar   yaratilmoqda.   Shuningdek,
keyingi   paytlarda   muayyan   sohalarga   ixtisoslashgan   elektron
lug‘atlar   ham   yaratilmoqda.   Ya’ni   dastlab   kompyu ter   lug‘atlari
faqat   umumiy   leksikon   bilangina   cheklangan   edi,   hozirda   fanga
oid   bo‘lgan,   qurilish,   aviatsiya,   avtomobilsozlik,   harbiy,   diniy,
yuridik   so halarga   oid   so‘zlar   bazasi   ham   e’tiborga   olinmoqda.
Hatto   so‘zlarning   matnda   qo‘llanish   imkoniyatlari,   distributiv
holatlari, birikma holidagi ko‘rinishlari ham nazarda tutilgan holda lug‘atlar   yaratilmoqda.   Bu   ko‘rsatkichlar   komp yuter
leksikografiyasi sohasining taraqqiy etayotganidan darak beradi. Adabiy ot lar:
1. П ў латов   А.К.,   Муҳамедова   С.   Компьютер   лингвистикаси
(ўқув қўлланма). -   Тошкент, 2008
2. Пўлатов   А.   Компьютер   лингвистикаси.   -   Тошкент:
Академнашр, 2011.
3. Rahimov   A.   Kompyuter   lingvistikasi   asoslari .   –   Toshkent :
Akademnashr ,  2011 .
4. Шемакин   Ю.И.   Начало   компьютерной   лингвистики.   -   М.:
Высшая школа, 1992.
5. Нелюбин   Я.Я.   Компьютерная   лингвистика   и   машинный
перевод. -М.: ВЦП, 1991.
6. Баранов   А.Н.   Введение   в   прикладную   лингвистику.   -   М.:
Эдиториал УРСС, 2001.

KOMPY UTER LEKSIKOGRA FIY A SI Reja: 1. Kompyuter leksikografiyasi kompyuter lingvistikasining alohida yo‘nalishi sifatida 2. Kompyuter lug‘atlari va ularning ishlash tamoyili 3. Kompyuter leksikografiyasi sohasining rivojlanishi

Ma’lumki, leksikografiya tilshunoslik fanining amaliy sohalaridan biri hisoblanadi. U yunoncha «lexikos» - «so‘z», «lug‘at», «grapho» - yozaman degan ma’nolarni anglatadi. Leksikografiya bo‘limida lug‘atlar, ularni tu-zish yo‘llari va tamoyillari o‘rganiladi. Avtomatizatsiya ijtimoiy hayotning barcha jabhalariga kirib kelishi natijasida lug‘atlar ham elektron holatda yaratilish imkoniyati yuzaga keldi. Kompyuter yordamida lug‘atlar bilan ishlashning oplimallashuvi natijasida kompyuter leksikografiyasi yo‘nalishi shakllandi. Kompyuter leksikografiyasi amaliy tilshunoslikning muhim tarkibiy qismi bo‘lib, unda lingvistik va dasturiy ta’minot asosida ishlaydi-gan, kodlash va dekodlash prinsipi asosida yaratilgan kompyuter lug‘atlari, ularni tuzish dasturlari, algoritmlari o‘rganiladi. Mazkur sohaning rivojla-nishi natijasida turli nomlarda elektron lug‘atlar yaratilmoqda. Eng mash-hur elektron lug‘atlar sirasiga CONTEXT, ABBY LINGVO, MULTl-TRAN, POLYGLOSSTJM, MULTILEKS kabilar kiradi. Leksikografiya sohasiga kompyuter texnologiyalarining tatbiq etilishi lug‘at tuzish ishlarini ancha yengillashtiradi. Lug‘at tuzish jarayonining naqadar murakkabligini bir tilshunos olim hazilomuz tarzda quyidagicha izohlagan: «Agar biror kislii og ‘ ir jinoyat sodir qilsa, imi katorgaga surgun qilish shart emas. U lug‘at tuzsin, sliunda и katorganing barcha azoblarini, qiyinchiliklarini tortgan bo‘ladi». Axborot manbalarini yig‘ish bo‘yicha maxsus dasturlar (Database Software) lug‘at asosini tashkil etuvchi barcha ma’lumot va

misollarni jamlash va sistematik tarzda ishlov berishga qulaylik tug ‘ diradi. Bundan tashqari, boshqa maxsus dasturlar lug‘atni tahrir qi lish va chop etish borasidagi ancha mashaqqatli mehnatni bir qancha oson lashtiradi. Elektron lug ‘ atlar ham, o‘z navbatida, an’anaviy lug‘atlarga qaraganda birmuncha afzalliklarga ega. Bugungi kunda, masalan, ABBY LINGVO kompaniyasining lug ‘ at va tarjima dasturlari ulardan foydalanuvchi har bir xaridorga o‘z lug‘atini tuzish yoki mavjud lug‘at so‘z boyligini to‘ldirib borish imkonini beradi. Ochiq turdagi Internet lug‘atlari (on-line lug‘at lar) ham ko‘p hollarda barcha foydalanuvchilarga ushbu lug‘atlarni to‘ldirish imkonini beradi. Shuningdek, elektron lug‘atlarning hajm jihatidan ixchamligi, kompaktligi, boshqa manbalarga (Internet tarmog‘i orqali, giper-murojaatlar yordamida) ulanish imkoniyati, mavjud matnlar korpuslari yordamida illustrativ misollar tuza olish imkoniyati, multimediali misollar bilan boyitilganligi, so‘zlarning sinonimik variantlari, omonimlik xususiyatlari, grammatik ma’lumotlar bilan ta’minlanganligi va ularning tezlik bilan foydalanuvchiga havola etilishi kabi jihatlari elektron lug‘atlarning optimalligini ta’minlaydi. Kompyuter leksikografiyasini elektron matnlar korpusi yoki parallel matnlar korpuslarisiz tasavvur qilish mumkin emas. Mat nlar k orpusi (« cor pus» lot incha « t ana» degan ma’noni anglat adi) - bu elektron holda saqla- nadigan ma’lum til birliklari

bo‘lib, ular tilshunoslar uchun turli xil muam-molarni hal etish uchun tatbiq etishda va turli yo‘nalishdagi tadqiqotlar uchun zaruriyatga qarab turli shakllarda tuziladi. Bular fonema, grafema, morfefrfalardan tortib undan kattaroq birliklar - leksema, gap va matnlardan (badiiy yoki ilmiy asar, gazeta va jurnal matnlari) tashkil topishi mumkin. Ularning qay tarzda saqlanishiga qarab maxsus dasturlar yorda mida har bir kerakli so‘z yoki so‘z birikmasi uchun darhol uning qo‘llanishi bo‘yicha misollar topilishi, imlo bo‘yicha variantlari, sinonimik qatorlari topilishi mumkin. Matnlar korpusiga oid ilmiy tadqiqotlar salmog‘ining ko‘payishi natijasida tilshunoslikda k orpus lingv ist ik asi yo‘nalishi shakl-landi. Kompyuterda yaratilgan birinchi matnlar korpusi Braun korpusi (БК, inglizcha Brown Corpus, ВС) hisoblanadi, u 1961-yilda Braun universiteti-da yaratilgan, har biri 2000 so‘zli 500 ta matn fragmentini o‘z ichiga oladi. 1970-yillarda 1 mln so‘zni o‘z ichiga olgan matnlar korpusi asosida rus tilining chastotali lug‘ati yaratildi. 1980-yillarda Shvetsiyaning Upsala uni-versitetida ham rus tilida matnlar korpusi yaratildi. Keyinchalik kompyuter leksikografiyasining rivojlanishi natijasida katta hajmli matnlar korpusiga ehtiyoj tug‘ildi. Ya’ni 1 mln ta so‘z elektron lug‘atlar bazasi uchun yetarli emas. Shu asosda yirik hajmli matnlar korpusi yaratila boshlandi. Ko‘pgina mamlakatlarda XX asrning 80- yillaridan boshlab bunday korpuslar tuzila boshlandi. Ular turli maqsad va vazifalarga xizmat qiladi. Buyuk Britani-yada Ingliz tili

Banki (Bank of English) hamda Br it amy a MiUiy Korpusi (British National Corpus, BNC), Rossiyada Rus tilining mashina fundi фашинный фонд русского ячыка) hamda Rus tilining MiUiy Korpusi (Цаииоиальный корпус русского языка) loyihalari ishlab chiqildi.73 Masalan, Rus tilining milliy korpusi hajmi hozirgi kunda 149 mln so‘zdan iborat. Keyingi yillarda Internet tizimining rivojlanishi virtual matnlar kor pusi yuzaga kelishiga olib keldi. Ya’ni Internetdagi qidiriv saytlari, elek-tron kutubxonalar, virtual ensiklopediyalar korpus vazifasini bajarmoqda. Korpusning janri va tematik rang-barangligi Internetdan foydalanuvchi-ning qiziqishlariga bogiiq. Masalan, ilm-fan doirasida Wikipedia katta hajm-dagi matnlar korpusi sifatida foydalanilmoqda.74 Korpus lingvistikasida parallel matnlar korpusi ham muhim ahamiyat kasb etadi. Parallel matnlar korpusi esa, o‘z navbatida, badiiy asar, qo‘llanma, ommaviy axborot vositalari, turli xil hujjatlarning ikki yoki undan ko‘p tillardagi elektron holdagi ko‘rinishlaridir. Masalan, Yevropa Ittifoqi o‘zining barcha qonun va hujjatlarini ingliz, fransuz, nemis, ispan va ital-yan tillarida nashr qiladi hamda ular Internet tizimiga barchaga ochiq arxiv sifatida qo‘yiladi. Bunday korpuslarning afzalligi shundaki, ular yordami- da nafaqat biron bir so‘z yoki jumlaning, balki butun boshli matnlarning turli tillardagi variantlarini bilish imkoniyati mavjud. Xuddi mana shu im-koniyat tufayli maxsus konkordanser dasturlar ishlab chiqish orqali turli xil ixtisoslik lug‘atlari tuzish