logo

O‘ZBEK TILI MILLIY KORPUSIDA QUR’ONI KARIM MA’NOLARI TARJIMASINING LINGVISTIK TA’MINOTI (OLTINXON TO‘RA TAFSIRI ASOSIDA)

Yuklangan vaqt:

12.08.2023

Ko'chirishlar soni:

0

Hajmi:

2772.2939453125 KB
O‘ZBEK TILI MILLIY KORPUSIDA QUR’ONI KARIM MA’NOLARI
TARJIMASINING LINGVISTIK TA’MINOTI (OLTINXON TO‘RA
TAFSIRI ASOSIDA)
Mundarija
KIRISH…………………………………………………………………..……....3
I BOB. TILSHUNOSLIKDA KORPUS TUSHUNCHASI
1.1 Tilshunoslikda korpus lingvistikasi va milliy til korpuslari……….…..…8
1.2. Milliy korpus va mualliflik korpuslarining zamonaviy tilshunoslikdagi    
o‘rni…………………………………………………………………………..…19
I bob bo‘yicha xulosa..........................................................................................29
II BOB. “MUALLIFLIK KORPUSI” DASTURI USTIDA 
BAJARILADIGAN AMALLAR 
2.1. Dasturiy majmuaning tuzilishi va tavsifi…………………………….…..31
2.2. Dasturiy majmuadan foydalanish tartibi va ish natijalari......................45
II bob bo‘yicha xulosa…....................................................................................51
III BOB. “MUALLIFLIK KORPUSI” DASTURIDA “AL-QUR’ON AL-
KARIM” (tarjima va sharhlar) (Oltinxon To‘ra tarjima va tafsiri)NING 
LINGVISTIK TA’MINOTI 
3.1. “Al-Qur’on  Al-Karim” (Oltinxon To‘ra tarjima va tafsiri) ning tili va 
lug‘ati………………………………………………………………………..…52
3.2. “Al-Qur’on Al-Karim”dagi “Ko‘z” leksemasi bilan bog‘liq somatik 
frazemalarning semantik tahlili.......................................................................63
III bob bo‘yicha xulosa.....................................................................................74
UMUMIY XULOSALAR ……………………………………………………75
FOYDALANILGAN ADABIYOTLAR RO‘YXATI……………..…………78
0 Kirish
M avzuning   asoslanishi   va   uning   dolzarbligi.   Axborot   texnologiyalari
bugungi   kunda   har   bir   sohaga   asosiy   poydevor   sifatida   kirib   bormoqda.   Bugungi
kunimizni   kompyuter   va   Internetsiz   tasavvur   qilish   qiyin.   Qo‘limizdagi   mitti
telefon   bizni   dunyo   bilan   bog‘lay   oladi.   Undan   faqatgina   kundalik   ehtiyojlar
uchungina   foydalanib   qolmasdan,   badiiy   va   ilmiy   kitoblarni   ham   mutolaa
qilishimiz, matn yoki kitobni bir tildan ikkinchi bir tilga tarjima qilishimiz, turli xil
dasturlar yordamida so‘zning imlosini terkshirish, izohini bilishimiz ham mumkin
bo‘lyapti.
Kompuyuter   texnologiyalaridan   foydalanish   tilshunoslik   faniga   ham   kirib
kelib,   kompyuter   lingvistikasining   shakllanishiga   zamin   yaratdi.   Jahon
tilshunosligida   kompyuter   va   korpus   tilshunosligiga   oid   ilmiy   qarashlar   XX
asrning   40-yillarida   paydo   bo‘lib,   60-yillarida   jarayon   jadallashdi.   Natijada,   XXI
asr boshlarida millionlab so‘zlarni o‘zida aks ettiruvchi yuzlab til korpuslari paydo
bo‘ldi. Ayni damda bir-biridan nutq turi, matn tili, janri, kirish usuli kabilar bilan
farqlanuvchi   Britaniya   milliy   korpusi,   Amerika   milliy   koprusi,   rus   tili   milliy
korpuslari   yaratildi.   Dunyo   bilan   yuzlashayotgan   Vatanimizda   bugungi   kunda
hujjatlarni   qog‘oz   shaklidan   elektron   shaklga   ko‘chirish,   har   bir   sohani
raqamlashtirish   jarayoni   ketmoqda.   Axborot   texnologiyalarini   rivojlantirish
maqsadida   O‘zbekiston   Respublikasi   Prezidentining   2018-yil   19-fevraldagi   PF-
5349-sonli   “Axborot   texnologiyalari   va   kommunikatsiyalari   sohasini   yanada
takomillashtirish chora-tadbirlari to‘g‘risida”gi farmoni qabul qilingan. Bu farmon
ijrosi   nafaqat   axborot   texnologiyalari   bilan   ishlovchi   soha   vakillari   uchun,   balki
lingvistlar   uchun   ham   dasturulamaldir.   Professor   B.Mengliyev,   tillarning
tara q qiyoti   va   yashab   qolishini   kompyuter   texnologiyalari   sohasida,   I nternet
tizimida   qo‘llanilish   darajasi   bilan   bog‘laydi.   Biz   ona   tilimiz   –   o‘zbek   tilining
taraqqiy   etishini,   uning   o‘lik   tilga   aylanib   qolmasligini   istasak,   o‘zbek   milliy   tili
korpusini yaratishimiz bugungi globallashuv davrining muhim vazifasidir.
Prezidentimiz   Sh.Mirziyoyev   o‘zbek   tiliga   davlat   tili   maqomi
berilganligining   30   yilligiga   bag‘ishlangan   tantanali   marosimdagi   nutqida   o‘zbek
1 tilini   “xalqimiz   uchun   milliy   o‘zligimiz   va   mustaqil   davlatchiligimiz   timsoli,
bebaho ma’naviy boylik, buyuk qadriyatdir” 1
 deb e’tirof etish bilan birga “O‘zbek
tili Amerika Qo‘shma Shtatlari, Buyuk Britaniya, Germaniya, Fransiya, Shvetsiya,
Rossiya,  Ukraina, Xitoy, Yaponiya kabi  davlatlarning 60 ga yaqin universiteti  va
100   dan   ziyod   maktablarida   o‘rganilmoqda” 2
,   deb   ta’kidlab   o‘tgan.   Bu   ona
tilimizning   dunyoga   tanilib   borayotganiga   misol   bo‘la   oladi.   Bugungi   kun
tilshunosligining   dolzarb   vazifalaridan   biri   ona   tilimizni   boyitish   va   amaliy
foydalanish   samaradorligini   oshirish   barobarida   uning   zamonaviy   axborot-
kommunikatsiya   tizimida   keng   qo‘llanilishiga   erishishdir.   O‘zbekiston
Respublikasi   Prezidentining   2019-yil   21-oktabrdagi   “O‘zbek   tilining   davlat   tili
sifatidagi   nufuzi   va   mavqeyini   tubdan   oshirish   chora-tadbirlari   to‘g‘risida”gi
Farmonida   “davlat   tilining   axborot   va   kommunikatsiya   texnologiyalari,   xususan,
Internet   jahon   axborot   tarmog‘ida   munosib   o‘rin   egallashini   ta’minlash,   o‘zbek
tilining  kompyuter   dasturlarini   yaratish” 3
  vazifasini  belgilab  bergan  bo‘lib,  ushbu
vazifani bajarish bugungi kun tilshunoslari oldiga o‘zbek milliy korpusini yaratish,
mualliflik   korpuslarini   tuzishning   lingvistik   asoslarini   ishlab   chiqish,   lingvistik
modellarni tuzish kabi bir qator kechiktirib bo‘lmas vazifalarni qo‘ydi.
O‘zbekiston   Respublikasi   Prezidentining   2022-yil   28-yanvardagi   “2022-
2026-yillarga   mo‘ljallangan   Yangi   O‘zbekistonning   Taraqqiyot   strategiyasi
to‘g‘risida”gi   Farmoni   hamda   mazkur   faoliyatga   tegishli   boshqa   me’yoriy
hujjatlarda   belgilangan   vazifalarni   amalga   oshirishda   ushbu   dissertatsiya   ishi
muayyan darajada xizmat qiladi.
Tadqiqot   obyekti   va   predmeti.   Tadqiqot   obyektini   Qur’oni   karimning
Оltinxon   To‘ra   tomonidan   amalga   oshirilgan   tafsiri;   predmeti ni   til   korpusi,
mualliflik korpusi, korpusi interfeysi, lingvistik razmetka tashkil etadi.
1
  Президент   Шавкат   Мирзиёевнинг   ўзбек   тилига   давлат   тили   мақоми   берилганлигининг   ўттиз   йиллигига
бағишланган тантанали маросимдаги нутқи.  http://xs.uz/uz  – Тошкент, 2019. 
2
 O‘sha manba 
3
  Ўзбекистон Республикаси Президентининг “Ўзбек тилининг давлат тили сифатидаги нуфузи ва мавқеини
тубдан   ошириш   чора-тадбирлари   тўғрисида”ги   ПФ-5850-сон   Фармони .//   Халқ   сўзи,   2019,   22   октябрь.
№ 218(7448)
2 Magistrlik   ishining   maqsadi   va   vazifalari.   Qur’oni   karimning   Оltinxon
To‘ra   tomonidan   amalga   oshirilgan   tafsirining   korpusini   yaratish   tadqiqotning
maqsadi hisoblanadi. 
Dissertatsiyada ko‘zda tutilgan maqsadni amalga oshirish uchun quyidagilar
vazifalarga e’tibor qaratildi:
– mualliflik korpuslarining mushtarak va farqli jihatlari tadqiq etish;
–   А .P.Chexov   va   Abdulla   Qahhor   asarlari   korpusi   misolida   mualliflik
korpusi tajribasini o‘rganish;
– Oltinxon To‘ra korpusi interfeysining dizayn, qidiruv tizimi, ma’lumotlar
bazasi oynasi kabi xususiyatlarini tavsiflash;
–   Qur’oni   karimning   Oltinxon   To‘ra   tafsiri   misolida   so‘zshakllarning
chastotasini tuzish;
– Qur’oni karimning Oltinxon To‘ra tafsiri misolida “ko‘z” leksemasi bilan
bog‘liq somatik frazemalarni semantik tahlil qilish;
Tadqiqotning ilmiy yangiligi quyidagilardan iborat:
“Al-Qur’on   Al-Karim”   (Oltinxon   To‘ra   tarjima   va   tafsiri)ning   1994-yilda
nashrdan chiqqan birinchi nashri asosida kitobning elektron shakli yaratilgan;
Oltinxon   To‘ra   tafsirdagi   so‘zlar   asosida   konkordans   tuzish,   N-grammlar
hosil  qilish, chastotali  lug‘at  tuzishga mo‘ljallangan “Mualliflik korpusi” dasturiy
ta’minoti   ishlab   chiqilgan   va   unga   O‘zbekiston   Respublikasi   Adliya   Vazirligi
huzuridagi   Intellektual   mulk   agentligi   tomonidan   №   DGU   15257   raqamli
guvohnoma berilgan; 
tadqiqotda   “Ixlos”   surasining   Oltinxon   To‘ra   va   shayx   Abdulaziz   Mansur
tomonidan   qilingan   o‘zbekcha   tarjima   matnlari   qiyoslangan   va   morfologik
razmetkalangan; 
“Ko‘z” komponentli iboralar semantik jihatdan tahlil etilgan.  
Tadqiqotning   asosiy   masalalari   va   farazlari.   Korpus   yaratish   uch
bosqichda   taraqqiy   etgan.   Xususan,   birinchi   avlodi   elektron   kutubxona   shaklida,
ikkinchi   avlodi   matnni   qayta   ishlay   olish,   yangi   davrda   esa   hajman   katta,   ammo
sodda   tegli   korpuslar   yaratilgan.   Zamonaviy   rus,   ingliz,   turk,   tojik   tili
3 korpuslarining   umumiy   xususiyatlari   mushtarak   bo‘lib,   farqli   tomonlari   so‘z
miqdori  va lingvistik tahlil  imkoniyatida kuzatildi. Tadqiqotning asosiy  mazmuni
bo‘yicha   o‘tkazilgan   Respublika   miqyosidagi   ilmiy   konferensiya   to‘plamlarida   1
ta,   xalqaro   ilmiy-amaliy   konferensiya     materiallarida   2   ta   maqola   e’lon   qilindi.
“Mualliflik   korpusi”   dasturi   uchun   O‘zbekiston   Respublikasi   Adliya   vazirligi
huzuridagi Intellektual mulk agentligining №DGU 15257 raqamli guvohnomasiga
ega bo‘lgan.
Tadqiqot   mavzusi   bo‘yicha   adabiyotlar   sharhi   (tahlili) .   Jahon
tilshunosligida korpus lingvistikasi o‘tgan asrning 60-yillarida o‘rganish obyektiga
aylangan.   Dastlab,   R.G.Piatrovskiy   tomonidan   fikrlar   aytilgan   bo‘lsa   ham,   lekin
korpus sohasidagi maqsadli tadqiqotlar 40-yillarda Blumfild, Frays va Bondjerslar
tomonidan   boshlanganligini   aytib   o‘tish   joiz.   Braun   korpusi   (1961-1964),   1980-
yilda yaratilgan ingliz tili banki loyihalari e’tiborga molik ishlar hisoblanadi.
Rus   tilshunosligida   V.P.Zaxarov,   A.B.Kutuzov,   Ye.V.Nedoshivina,
V.V.Rikov, V.Plungyanlar korpus, uning turlari, o‘ziga xos xususiyati, korpusning
ijtimoiy   ahamiyati,   korpus   tuzish   tamoyillari   borasida   tadqiqot   olib   borganlar.
Mualliflik   korpuslari   O.V.Kukushkina,   A.A.Polikarpov,   Ye.V.Surovtsevalar
tomonidan tadqiq etilgan.
O‘zbek tilshunosligida kompyuter lingvistikasi, matnga leksikografik ishlov
berish   va   lingvostatistik   tahlil   etish   borasida   birmuncha   tadqiqotlar   amalga
oshirilgan.   А .Po‘latov,   H.Orziqulov,   S.Muhamedov,   M.Ayimbetov,
S.Muhamedova,   S.Karimov,   G.Jumanazarova,   A.Babanarov,   D.O‘rinbayeva,
N.Abdurahmonova,   A.Norov   va   boshqalarning   kuzatishlarini   ana   shunday   ishlar
sifatida   qayd   etamiz.   Bu   tadqiqotlar   matnni   innovatsion   yondashuv–kompyuter
lingvistikasi   yutuqlari   yordamida   leksikografik   va   lingvostatistik   tadqiq   etishning
zamonaviy usullarini tavsiya etganligi bilan dolzarblik kasb etgan.
Bundan   tashqari,   2018-yilda   Buxoro   davlat   universitetida   Sh .   Xamroyeva
“O‘zbek   tili   mualliflik   korpusini   tuzishning   lingvistik   asoslari”   PhD
dissertatsiyasini   himoya   qilgan.   Dissertatsiyada   korpus   lingvistikasining
shakllanishi, taraqqiyoti va nazariy asoslari haqida, mualliflik korpusini tuzishning
4 umumlingvistik   asoslari   haqida,   o‘zbek   tilida   mualliflik   korpusini   tuzishning
xususiy   lingvistik   asoslari   haqida   fikr   yuritilgan.   Shuningdek,   2019-yil   Termiz
davlat   universitetida   A.   Eshmuminov   “O‘zbek   tili   milliy   korpusining   sinonim
so‘zlar   bazasi”   nomli   PhD   dissertatsiyasini   himoya   qilgan.   Tadqiqotchi   jahon   va
milliy   korpus   taraqqiyotiga   munosabat   bildiradi.   O‘zbek   tili   milliy   korpusida
sinonim   so‘zlarni   teglash   va   uning   dasturiy   ta’minoti   haqida,   korpusda   sinonim
so‘zlarni teglash algoritmlari haqida atroflicha fikr yuritadi.
Tadqiqotda   qo‘llanilgan   metodikaning   tavsifi.   Та dqiqot   mavzusini
yoritishda   tasniflash,   tavsiflash,   qiyoslash,   statistik   tahlil   metodlaridan
foydalanildi. 
Tadqiqotning   nazariy   va   amaliy   ahamiyati.   Tadqiqot   amaliy   ahamiyati
shundki,   yaratilgan   “Mualliflik   korpusi”   dasturiy   ta’minot   faqat   “Al-Qur’on   Al-
Karim” uchun mo‘ljallanmagan, dastur yordamida lotin yozuvidagi  txt . formatdagi
har qanday matn ustida tadqiqot olib borish mumkin. Konkordanslar hosil qilishda,
statistik   ma’lumotlar   to‘plashda,   lug‘atlar   bilan   ishlashda,   klasterlar/N-grammlar
tuzishda   keng   foydalanish   mumkin.   Kelgusida   o‘zbek   tili   milliy   korpusini
shakllantirishda qo‘shimcha material bo‘lib xizmat qiladi. 
Amaliy   filologiya   bo‘limlaridan   biri   –   korpus   lingvistikasining   fan   sifatida
o‘qitilish   jarayonida   lingvistika,   komputer   lingvistikasi,   korpus   lingvistikasi,
zamonaviy   tilshunoslik,   uslubshunoslik   kabi   fanlarni   o‘qitishda   manba   vazifasini
o‘ta ydi.
Magistrlik   dissertatsiyasi   tuzilmasining   tavsifi.   Dissertatsiya   kirish,   uch
asosiy bob, umumiy xulosa lar va  foydalanilgan adabiyotlar ro‘yxatidan iborat.
5 I BOB. TILSHUNOSLIKDA KORPUS TUSHUNCHASI
1.1 Tilshunoslikda korpus lingvistikasi va milliy til korpuslari
Axborotlashgan   bugungi   dunyo   barcha   fan   sohalarida   kompyuter
texnikasidan   foydalanmoqda,   tilshunoslik   sohasining   kompyuter   bilan   kesishgan
nuqtasida kompyuter lingvistikasi fani shakllandi. Kompyuter lingvistikasi amaliy
tilshunoslikning   zamonaviy   yo‘nalishlaridan   bo‘lib,   u   orqali   tabiiy   tilni   qayta
ishlash, sun’iy intellekt orqali til birliklari ustida turli lingvistik amallarni bajarish,
sinxron   tarjimashunoslik,   elektron   lug‘atlar   yaratish   kabi   masalalariga   echim
topilmoqda. Bu sohaga bag‘ishlangan ishlar ko‘lami kengayib, uning ham o‘z ichki
yo‘nalishlari   paydo   bo‘ldi.   Korpus   lingvistikasi   kompyuter   lingvistikasining
keyingi yillarda shakllangan yo‘nalishi bo‘lsa-da, bu borada dunyo tilshunosligida
anchagina   ishlar   amalga   oshirildi.   Dunyo   tillari   bugungi   globallashuv   davrida
milliy va sof ko‘rinishini saqlab qolish maqsadida, tilning lug‘at sathini, shu tilda
yaratilgan barcha uslub va janrdagi asarlarni bir joyga to‘plashni boshladilar. Shu
bilan   birga   to‘plangan   matnlar   ustida   turli   xil   lingvistik   amallarni   ham   bajarib,
tilning ichki imkoniyatlarini ko‘rsatishni ham maqsad qilganlar. Bu elektron matn
ma’lumotlari va ular ustida bajarilgan amallarni shu tilda yaratilgan korpuslar o‘z
ichiga oladi. 
Korpus   lingvistikasining   taraqqiyot   tamoyillarini,   korpus   yaratishning
kompyuter   usullari,   matematik   modellarini   belgilash,   kompyuter   lug‘atlarining
ma’lumotlar bazasi  sifatidagi ahamiyatini  yoritish, tezauruslar, konkordanslarning
lingvistik   ta’minotini   izohlash,   korpus   turlarini   tahlil   qilish,   milliy   til
taraqqiyotidagi   o‘rnini   ko‘rsatish,   ijtimoiy   sohalar   rivojidagi,   ta’lim   jarayonidagi
samaradorligini aniqlash muhim ahamiyatga ega bo‘lmoqda. 
Kompyuter   lingvistikasi   fani   o‘z   muammo   hamda   yutuqlari   nuqtayi
nazaridan  o‘rganib  chiqilgan.   A.N.Baranov   o‘z   ishlarida   sun’iy  ong   muammosini
ochib berishga to‘xtalgan, B.Orexov semantik analiz, texnik tarjima va avtomatik
morfologiya tomonidan fanni o‘rganib chiqqan bo‘lsa, I.A.Chesebiyev kompyuter
lingvistikasining   metodlari   rivojlanish   tarixini   o‘rganib   chiqqan.   Shu   o‘rinda,
6 N.Xomskiy   (Chomsky)ning   sintaktik   strukturalar   va   universal   grammatika
nazariyasi   fan   rivojiga   katta   hissa   qo‘shgan.   Ch.Filmor   (Fillmore)   esa   ushbu
nazariyaga qo‘shimcha sifatida tillardagi predlog kabi noo‘xshashliklar va ularning
til   strukturasida   boshqa   tushunchalar   orqali   ifoda   etilishi   nuqtayi   nazardan
yondashgan. U.Vuds (Woods)  
fanga protsessual semantika g‘oyasini kiritdi.
Zamonaviy   tilshunoslikda   kompyuter   lingvistikasi   va   korpus   lingvistikasi
alohida xususiyatlariga ko‘ra farqlanadi. Har ikkala fanning o‘rganilish darajasi va
mazkur   sohalar   bo‘yicha   dunyo   olimlarining   izlanishlari   va   ilmiy   qarashlariga
tayangan   holda   kompyuter   lingvistikasi   va   korpus   lingvistikasi   quyidagi
xususiyatlariga ko‘ra keskin farqlanishi bo‘yicha xulosalar chiqarildi: 
1.Nomlanishidagi farq;
2.Mazkur ikki sohaning belgilangan maqsadlari jihatidan:
a)   kompyuter   lingvistikasi   tilga   oid   programmalarni   ishlab   chiqishni   o‘z
oldiga   asosiy   maqsad   qilib   qo‘yadi.   Ta’kidlash   joizki,   bu   bevosita   tilshunoslik
oldidagi muamolarni hal etishga qaratilmagan;
b)   korpus   lingvistikasi   esa,   fanning   maqsadi   sifatida   mavjud   tilning
korpusini   yaratish   va   uning   yordamida   tildagi   so‘zlar,   iboralar   hamda   boshqa
lisoniy   birliklarning   qo‘llanilish   chastotasini   aniqlashni   belgilab   qo‘ygan.   Bu   esa
korpus lingvistikasini aynan tilshunoslikka oid ekanligini ko‘rsatadi.
3.   Kompyuterning   barcha   fanlarda   foydalanish   o‘rni   va   ahamiyati
tomonidan:
a)   kompyuter   lingvistikasida   kompyuter   qurilmalari   asos   bo‘lib,   ushbu
fandagi   barcha   izlanishlar   kompyuterlar   va   ularning   afzalliklarini   oshirishga
qaratiladi;
b)   korpus   lingvistikasi   esa   kompyuter   qurilmalaridan   faqatgina   vosita
sifatida   foydalanadi,   bunda   matnlarni   yig‘ish   va   saralash   amaliyotlarini   bevosita
ular yordamida amalga oshiradi.
Har qanday yuksalayotgan fan o‘z amaliyotida kompyuterlar taraqqiyotining
yutuqlaridan   foydalanadi,   lekin   ushbu   fanlar   (korpus   lingvistikasi,   kompyuter
lingvistikasi,   kompyuter   matematikasi,   kompyuter   fizikasi)
7 kompyutershunoslikning bir qismi sifatida qabul qilinishi joiz emas. Mazkur fanlar
tahlil obyektini tadqiq etishda kompyuterdan vosita sifatida foydalanadi, xolos.
Kompyuter   lingvistikasi   taraqqiyotini   ta’minlovchi   asosiy   lingvistik   omil
elektron   matnlar   korpusidir.   Korpus   (korpus)   lotincha   so‘z   bo‘lib,   “tana”   degan
ma’noni   bildiradi.   “Korpus   so‘z,   so‘z   birikmasi,   grammatik   shakllarni,   so‘z
ma’nosini   muayyan   qidiruv   tizimi   orqali   topishni   anglatuvchi   elektron
ko‘rinishdagi   matnlar   jamlanmasidir” 4
.   Kompyuter   lingvistikasida   “korpus”
tushunchasida “matnlar korpusi” termini keng qo‘llanadi.
Korpus   lingvistikasi   zamonaviy   kompyuter   texnologiyalaridan   foydalangan
holda   lingvistik   korpus   (matn   korpuslari)   tuzishning   umumiy   tamoyillarini
belgilaydi,   yozma   va   og‘zaki   matnlarning   haqiqiy   lingvistik   hodisalarini   to‘plash
metodologiyasini,   shuningdek,   ularni   saqlash   va   tahlil   qilish   usullarini   ishlab
chiqadi.   Matnli   korpuslar   bilan   ishlash   tadqiqotchini   subyektivlikdan   ma’lum
darajada  mavhumlashtirishga   va  tilni   obyektiv   o‘rganishga   imkon   beradi.   Tilning
har   qanday   qatlamini   o‘rganish,   shu   jumladan,   ko‘p   jildli   lug‘atlarni   tuzish,
grammatik   tadqiqotlar   loyiha   doirasida   hal   qilinadi.   Tilshunos   keng   matnlar
massivi  bilan ishlaydi. Bu nafaqat  intellektual  kuchni, balki  ko‘p vaqtni, ayniqsa,
tayyorgarlik bosqichlarida talab etiladigan juda mashaqqatli jarayonni talab qiladi.
Shuning   uchun   material   yig‘ishning   yangi   usullariga   o‘tish,   uni   tahlil   qilish   va
lingvistik   manbalarning   yangi   shakllari   zarur,   bu   nafaqat   mehnat   unumdorligini
sezirarli   darajada   oshirishga,   balki   turkiy   tillarni   o‘rganishning   yangi   usullari   va
sohalariga yo‘l ochib beradi.  Ushbu muammoning tahlili tilning elektron korpusini
yaratish, uni hal qilishda muhim ahamiyatga ega ekanligini ko‘rsatadi. 
Tadqiqotlarda  korpusga  har   xil   ta’rif  berilgan, korpus  turlicha  tavsiflangan.
V.V.R i kov   korpusni   mantiqiy   fikr,   mantiqiy   analiz   sifatida   o‘rganadi.   E.Finegan:
“Korpus  –  bu  odatda,  kompyuter   o‘qiy  oladigan   formatda  bo‘lgan   va  bizga  matn
ishlab   chiqilgan   vaziyat,   informatsiya   beruvchi,   muallif,   adresat   yoki   auditoriya
haqidagi ma’lumotni o‘z ichiga olgan matnlar to‘plamidir”, – deydi 5
. T.Mkeneri va
4
  http://rusorpora.ru .  
5
 Finegan E. LANGUAGE: its structure and use. – N.Y.: Harcourt Brace College Publishers, 2004
8 E.Vilson   “Korpus   aniq   til   mezonlariga   muvofiq   tanlangan,   til   namunasi   sifatida
foydalanish   mumkin   bo‘lgan   tilshunoslik   sohasidir”,   –   deya   e’tirof   etadi 6
.
V.P.Zaxarov   “Matnlarning   lingvistik   korpusi   katta,   elektron   ko‘rinishda   taqdim
etilgan,   birlashtirilgan,   tuzilgan   tagged,   muayyan   lingvistik   muammolarni   hal
qilish uchun mo‘ljallangan til ma’lumotlarining filologik jihatdan vakolatli qatori”
deb ta’riflaydi 7
. 
Korpus   lingvistikasining   nazariy   va   amaliy   jihatlari   chet   el   tilshunoslari
tomonidan   o‘rganilgan   bo‘lib,   quyidagi   olimlarning   izlanishlarini   alohida
ta’kidlash   mumkin:   korpus   lingvistikasiga   oid   terminlarning   ishlatilishi
yuzasidan   o‘z   qarashlarini   olima   I.F.Ganiyeva   ifoda   etgan   bo‘lsa,   korpus
lingvistikasidan   foydalanishning   ahamiyatli   tomonlarini   J.Sinkliyer   muhokama
qilgan. Korpus lingvistikasining til o‘rganishdagi  o‘rnini D.Biber, S.Konrad va
R.Reppenlar   tadqiq   qilishgan,   mazkur   muammoni   turlicha   yondashuv   asosida
H.Lindkvist,   N.Lich,  N.S.Dash,   F.Meyer,   T.Grays,   F.Karen,   S.Hunston,   T.Mk.
Eneriy, Z.Xiao, Yu.Tono, A.Vilson va boshqalar o‘rganishgan. Bugungi kunda
ushbu sohada o‘zbek tilshunosligida tadqiqotlar olib borilmoqda.
Korpus   –   ma’lum   maqsadda   yig‘ilgan   matnlar   majmuini   tashkil   etuvchi
til   birliklari   yig‘indisi,   tabiiy   tildagi   elektron   shaklda   saqlanadigan
yozma   yoki   og‘zaki,   kompyuterlashtirilgan   qidiruv   tizimiga   dasturiy
ta’minot   asosida   joylashtirilgan   on-line   yoki   off-line   tizimda   ishlaydigan
matnlar   jamlanmasi.   Lingvistik   tadqiqot   va   amaliy   topshiriqlar   echimi
uchun   til   korpuslari   zamonaviy   tilshunoslikning   inkor   etib   bo‘lmas   ish
quroli.
“Matnlar korpusi – elektron holda saqlanadigan ma’lum til birliklari bo‘lib,
ular   tilshunoslar   uchun   har   xil   muammolarni   hal   etish   maqsadida   va   turli
yo‘nalishdagi   tadqiqotlar   uchun   zaruriyatga   qarab   bir   necha   shakllarda   tuziladi.
Bular  fonema,  grafema, morfemalardan tortib undan kattaroq birliklar  – leksema,
6
 McEnery T, Wilson A. Corpus Linguistics. Edinburgh: Edinburgh University Press, 2nd edition, 2001.
7
 Захаров В.П. Корпусная лингвистика. Учебно-методическое пособие. – Санкт-Петербург, 2005. – С.3.
9 gap va matnlar (badiiy yoki ilmiy asar, gazeta va jurnal matnlari)dan tashkil topishi
mumkin 8
. 
Lingvistik korpus yoki matnli korpus ostida o‘ziga xos til muammolarini hal
qilish   uchun   yaratilgan   katta   hajmdagi   mashinada   o‘qiladigan,   birlashtirilgan,
yorliqlangan,   formatlangan   filologik   jihatdan   barkamol   til   ma’lumotlari   to‘plami
tushuniladi. Korpus tilshunosligi atamasi birinchi marta 1977-yilda ishlatilgan, bu
esa   korpus   tilshunosligini   juda   yosh   ilmiy   yo‘nalish   deb   atashga   imkon   beradi.
Ammo   shu   qisqa   vaqt   ichida   korpus   tilshunosligi   hisoblash   tilshunosligining
yondashuvlaridan   biri   sifatida   zamonaviy   tilshunoslikning   yetakchi
yo‘nalishlaridan biriga aylandi. Rossiyada bu atama ingliz tilining xalqaro korpusi
asoschilaridan biri Sidney Grinbaumning ma’ruzalari tufayli faqat 1996-yilga kelib
ma’lum bo‘ldi. 
Korpus   oddiy   elektron   kutubxonadan   farqlanadi.   Elektron   kutubxona
xalqning   ijtimoiy-siyosiy,   ma’naviy,   iqtisodiy   hayotini   aks   ettiruvchi
badiiy   va   publitsistik   asarlarni   nisbatan   to‘liq   qamrab   olishni   maqsad
qilgan   bo‘ladi.   Elektron   kutubxona   matnlari   tilshunoslik   nuqtai
nazaridan   leksik,   morfologik,   grammatik,   semantik   belgilar   asosida   ishlov
berilmaganligi   sababli   lingvistik   tadqiqot   uchun   noqulaylik   tug‘diradi.
Chunki   elektron   kutubxona   ilmiy   tadqiqot   materiali   bazasini   tayyorlash
maqsadida   tuzilmaydi,   balki   milliy-ma’naviy   merosni   to‘plashni   maqsad
qilgan   bo‘ladi.   Til   korpusi   esa   elektron   kutubxonadan   farqli   o‘laroq,
tilni   o‘rganish   uchun   zaruriy ,   foydali   va   qiziqarli   matnlarni   to‘plashni
nazarda   tutadi.   Korpusni   elektron   kutubxonadan   ajratib   turuvchi   birinchi
omil   undagi   matnning   xususiyati   va   qo‘shimcha   ma’lumot   bilan
boyitilganligi   hisoblanadi   hamda   bu   belgi   korpusning   alohida   qismi   –
korpus   birliklariga   yozilgan   izohni   tashkil   etadi.
Foydalanuvchiga   biror   so‘z   kerak   bo‘lsa,   buni   odatiy   matn   muharriri
ham   topib   beradi.   Lekin   so‘zning   grammatik   ma’nosi   va   tuzilishini
“tushunadigan”   matn   bilan   ishlash   juda   ko‘p   afzallik   va   qulaylikka   ega.
8
  Баранов   А.Н.   Введение   в   прикладную   лингвистику.   –     М.:   Эдиториал   УРСС,   2001.-С.61;   Rahimov   A.
Kompyuter lingvistikasi asoslari. – Toshkent: Akademnashr, 2011
10 So‘zshaklni   qidirish   kerak   bo‘lsa,   bunday   dasturiy   ta’minot,   ya’ni   korpus
tadqiqotchi   yoki   foydalanuvchiga   juda   katta   yordam   berishi   mumkin.   Agar
tadqiqotchi   o‘z   ishi   uchun   misolni   topish,   ularni   kartotekaga   ko‘chirish
(kompyuter   texnologiyalari   rivojlanishidan   oldingi   davrda)ga   oylab,
ba’zan   yillab   vaqt   sarflagan   bo‘lsa,   bugun   dunyo   til   korpuslari   yordamida
sanoqli   daqiqada   yuzlab   misolni   topishga,   ular   ustida   ishlash   imkoniga   ega
bo‘ldi.   Maxsus   qidiruv   korpusdan   ma’lumot   olishga   mo‘ljallangan   bir
qancha   dasturdan   iborat,   statistik   axborot   va   qidiruv   natijasini
foydalanuvchiga   qulay   shaklda   taqdim   etadi.   Tilda   qanday   jarayon
kechayotganligini   aniq   tasavvur   qilish   uchun   korpus   qamrovini   yanada
kengaytirish,   nafaqat   yozma   nutq,   balki   og‘zaki   nutq   materialidan
foydalanish   ham   maqsadga   muvofiq.   Bunday   korpus   yordamida   til   taraqqiyoti
natijasida   unda   sodir   bo‘lgan   va   kutilayotgan   o‘zgarish   haqida   aniq   xulosa
chiqarish mumkin.
Korpus   lingvistikasi   –   tilshunoslikning   korpus ,   uning   turlari,   tarixi,
taraqqiyoti,   bugungi   holati,   korpus   tuzish   tamoyillarini   o‘rganuvchi   bo‘limi.
Korpus   lingvistikasi   kompyuter   lingvistikasining   juda   tez   rivojlan a yotgan   sohasi;
ushbu   fan   jahonning   y etakchi   oliy   ta’lim   muassasalarida   o‘qitiladi.   Bu   soha
predmeti   korpus   yaratish   nazariyasi   va   amaliyoti   bo‘lsa,   fan   sifatida   korpusning
o‘ziga   xosligi,   dasturlash   masalalari   o‘qitiladi.   Korpus   lingvistikasi   kompyuter
lingvistikasining   tarkibiy   qismi;   til   korpusini   yaratish,   kompyuter   texnologiyasi
yordamida   ulardan   foydalanishning   umumiy   nazariyasi   va   amaliyoti   bilan
shug‘ullanadi. 
Hozirgi   vaqtda   korpus   tilshunosligining   samaradorligi   va   ahamiyatliligi
kompyuter   lingvistikasining   rivojlanishi   bilan   chambarchas   bog‘liq.   Har   qanday
matn   tarkibini   yaratish   tamoyillari   uning   amaliy   maqsadiga   bevosita   bog‘liq.
Mutaxassislar   izohlanish   (teglanish)   darajasiga   ko‘ra   korpusning   turli
ko‘rinishlarini farqlashadi: 
1.   Ixtisoslashgan   korpus   −   ma’lum   bir   turdagi   matnlar   to‘plami:   gazeta
matni, ilmiy maqolalar. 
11 2. Umumiy korpus – turli  xil  matnlarni  o‘z ichiga oladi, matn mazmuni va
janriga alohida talab qo‘yilmaydi. 
3.   Qiyosiy   korpus   –   turli   tillarning   ikki   yoki   undan   ko‘p   kichik   qismlari,
masalan,   rus   hamda   nemis   tili   yoxud   bitta   tilning   variantidan   iborat.   Masalan,
Avstriya va Shveytsariya nemis tili versiyalari. 
4. Parallel korpus – turli tillardagi o‘xshash matnlarni o‘z ichiga olgan ichki
korpusdan iborat. Birinchi korpusdan asliyatdagi matn, ikkinchisidan tarjima matn
o‘rin oladi. 
5.   Ta’limiy   korpus   −   bu   chet   tilini   o‘rganayotgan   shaxs   uchun   ona   tilida
so‘zlashuvchilar tomonidan yozilgan matnlar to‘plami. 
6.   Didaktik   korpus   –   chet   tilini   o‘qitish   jarayonida   foydalaniladigan   til
ma’lumotlaridan iborat. 9
«Olim   V.A.Plungyan   o‘z   vaqtida   to‘g‘ri   baho   berganidek,   endi   tilni
o‘rganish   uchun   odamga   ikkita   emas,   uchta   narsa   kerak   bo‘ladi:   lug‘at,
grammatika   va   ma’lum   tildagi   matnlarning   korpusi.   U   lug‘at   ham,   grammatika
ham, umuman olganda, ushbu yashash maydonidan tashqarida foydasizdir, chunki
til aslida ishlaydi, deb ta’kidlaydi». 10
 
Korpus vaqt talab qiluvchi jarayonni   qisqartirishga yordam beradi , chunki u
lingvistik   hodisalardan   foydalanishni   konsentratsiya   qiladi.   Leksik,   grammatik
birliklarning   xatti-harakatlarini   kuzatish   davomida   talaba   bir   vaqtning   o‘zida
ko‘plab matnlarni o‘qiyotganga o‘xshaydi, bu yodlash, so‘zning shakli, ma’nosi va
maqsadini   o‘zlashtirishga   yordam   beradi.   Talaba   turli   xil   kontekstlarda   til
birliklarining   takrorlanishi   va   o‘zgarishi   shartlarini   kuzatish   imkoniyatiga   ega ,
korpus   misollari   ko‘p   so‘zli   leksik-grammatik   zanjirlarni   aniqroq   tahlil   qilishga
imkon beradi.
“Til korpuslari – til bo‘yicha tadqiqot va amaliy topshiriqlar yechimi uchun
inkor etib bo‘lmas ish quroli. Tilni o‘rganish va tadqiq qilish uchun zarur, foydali
9
file:///C:/Users/1012-   %D0%A2%D0%B5%D0%BA   
%D1%81%D1%82%20%D1%81%D1%82%D0%B0%D1%82%D1%8C%D0%B8-2377-1-10-
20210405%20(2).pdf  
10
  https://uzjournals.edu.uz/buxdu/vol4/iss4/9?utm_source=uzjournals.edu.uz%2Fbuxdu
%2Fvol4%2Fiss4%2F9&utm_medium=PDF&utm_campaign=PDFCoverPages  
12 va   qiziqarli   matnlarni   to‘plashni   nazarda   tutadi”   –   deydi   olim.   Til   korpusida
tadqiqotchi   uchun   quyidagi   imkoniyatlar   borligini   aytib   o‘tadi:   1)   belgilangan   til
birligining   turli   qo‘llanishlardagi   barcha   shaklli   ko‘rinishini;   2)   tilning   lug‘at
tarkibidagi   o‘rni   va   variantlarini;   3)   belgilangan   so‘z   bilan   birikish   imkoniyatiga
ega so‘zlar ro‘yxatini; 4) u yoki bu muallifning ayni so‘zdan foydalanish chastotasi
yoki statistikasini; 5) so‘zning o‘z va ko‘chma ma’nolarini; 6) so‘z qo‘llanishining
yashirin   modeli   (imkoniyati)ni;   7)   til   taraqqiyotining   turli   davrida   qo‘llanish
holatini;  8) til taraqqiyotining turli davrida qo‘llanish holatini 11
.
Korpus   lingvistikasining   mohiyati,   maqsadi,   nazariy   masalalari,   korpus
tuzish   tamoyillariga   doir   izlanishlar   XX   asrning   60   yillariga   to‘g‘ri   keladi.   Bu
davrda   kompyuter   lingvistikasi   avtomatik   tarjima   yo‘nalishi   negizida   shakllandi.
AQShda avtomatik tarjima masalalariga bag‘ishlangan seminarlar, konferensiyalar
tashkil   qilindi.   Jon   Sinklerning   ingliz   tili   bankini   shakllantirishdagi   izlanishlari
korpus   lingvistikasi   asoslarini   takomillashtirishga   xizmat   qildi 12
.   “Kompyuter
lingvistikasi”ga   bag‘ishlangan   maqolalar   seriyasida   korpus   masalalariga   ham
to‘xtalib   o‘tilgan 13
.   Rus   tilshunosligida   A.N.Baranov 14
  V.P.Zaxarov 15
,
A.B.Kutuzov 16
,     E.V.Nedoshivina 17
,   V.V.Rikov 18
,   V.Plungyan 19
,   K.Boyarskiylar 20
korpusning nazariy asoslarini yoritishgan. 
  “ Lingvistlar,   dastavval,   1960 - yillarda   kompyuterlashtirilgan   matnlar
korpusini   to‘pladilar.   Kompyuterda   yaratilgan   birinchi   matnlar   korpusi   Braun
korpusi   (BK,   inglizcha   Brown   sorpus,   VS)   hisoblanadi,   u   1961-yilda   Braun
11
  http://marifat.uz/marifat/ruknlar/fan/1241.htm
12
Синклер  Д.  Предисловие  к  книге  «Как  использовать  корпуса  в преподавании иностранного языка»/
 Д. Синклер [Электронный ресурс]. – Режим доступа: http://www/ruscorpora.ru/corpora-infro.html, свободный.
13
  Новое в зарубежной лингвистик е.  В ы п :  XXIV . Комп ь ютерная лингвистика,1989 .    
14
  Баранов А.Н. Введение в прикладную лингвистику. - М.: Эдиториал УРСС, 2001.
15
Захаров В.П. Корпусная лингвистика. Учебно-методическое пособие. – Санкт-Петербург, 2005. – 48 с ;
16
Қар., Курс  “ Корпусная лингвистика ”  (А.Б. Кутузов) Лицензия Creative commons Attribution Share-Alike 3.0
Unported  ( Электрон ресурс )  - //lab314.brsu.by/kmp-lite/kmp-video/CL/CorporeLingva.pdf .
17
Недошивина   Е.В.   Программы   для   работы   с   корпусами   текстов:   обзор   основных   корпусных   менеджеров.
Учебно-методическое пособие. – Санкт-Петербург. − 2006. 26 с.
18
Рыков В.В. Курс лекций по корпусной лингвистике.  URL: http://rykov-cl.narod.ru/c.html
19
Плунгян   В.   Зачем мы  делаем  Национальный  корпус  русского языка?   « Отечественные  записки»   2005, №2 .
http://magazines.russ.ru/oz/2005/2/2005_2_20-pr.html
20
  Боярский К.  Введение  в компьютерную лингвистику.  –    Санкт-Петурбург, 2013.
13 universitetida   yaratilgan,   har   biri   2000   so‘zli   500   ta   matn   fragmentini   o‘z   ichiga
oladi. 
Keyinchalik yevropalik tadqiqotchilar shu prinsip asosida 1961-yilda Buyuk
Britaniyada   birinchi   marta   e’lon   qilingan   matnlar   korpusini   tuzishdi:   15   xil   janr
(registr),   2000   so‘zli   (so‘zshaklli)   5000   ta   matndan   iborat.   U   ingliz   tilining
britaniya variantiga oid 1 mln. so‘zni qamrab oldi, uni Britaniya hamda Norvegiya
universitetlari   nomi   bilan   “Lankaster-Oslo-Bergen”   yoki   qisqacha   LOB   korpusi
(The Lancaster-Oslo-Bergen Corpus) deb atashdi”.  21
1963 - yilda   AQSHda   Braun   universiteti   (Brown   University)da   The   Brown
Standard Corpus of American English korpusi yaratildi. Mazkur korpus lingvistika
sohasida yaratilgan bo‘lib, lingvistik tavsif va tahlillarga xizmat qiladi.
1970 - yillarda   1   mln.   so‘zni   o‘z   ichiga   olgan   matnlar   korpusi   asosida   rus
tilining   chastotali   lug‘ati   yaratildi.   1980-yillarda   Shvetsiyaning   Upsala
universitetida   ham   rus   tilidagi   matnlar   korpusi   yaratildi.   Keyinchalik   kompyuter
leksikografiyasining   rivojlanishi   natijasida   katta   hajmli   matnlar   korpusiga   ehtiyoj
tug‘ildi. Ya’ni 1 mln . ta so‘z elektron lug‘atlar bazasi uchun yetarli bo‘lmay qoldi.
Shu asosda yirik hajmli matnlar korpusi yaratila boshladi. Ko‘pgina mamlakatlarda
bunday   korpuslar   XX   asrning   80-yillaridan   boshlab   tuzila   boshladi.   Ular   turli
maqsad va vazifalarga xizmat qiladi. Buyuk Britaniyada Ingliz tili Banki (Bank of
English) hamda Britaniya Milliy Korpusi (British National   s orpus BN), Rossiyada
Rus tilining mashina fondi (Mashinniy fond russkogo yazika) hamda Rus tilining
Milliy Korpusi (Natsionalniy korpus russkogo yazika) loyihalari ishlab chiqildi 22
 .
“Kompyuter   imkoniyatlarining   kengayishi   korpuslar   sonining   ko‘payishi,
hajmining   oshishini   ta’minladi.   Bir   vaqtning   o‘zida   bir   necha   tillarda   korpuslar
yuzaga   keldi.   “ 1990-yilga   kelib   600   dan   ortiq   kompyuter   korpuslari   qayd   etildi.
Ularni   yillar   kesimida   quyidagicha   taqsimlash   mumkin:   1965-yilda   10   ta   korpus
yaratilgan bo‘lsa, 1966-1970-yillarga kelib 20 ta, 1971-1975-yillarda 30 ta, 1976-
1980-yillarda 80 ta, 1981-1985-yillarda 160 ta, 1986-1990-yillarda   320 ta korpus
21
  Рахманова А .  Ўзбек тили миллий корпусини   яратишда компьютер усуллари .  Филол .  фан.   ф .  д . (PhD)  дисс.
– Toshkent , 2021. – 18  b .
22
  http : www . с orpus .
14 yaratilgan 23
”.   Ko‘rinib   turibdiki,   1986-1990-yillarda   korpuslar   tuzish   ko‘rsatkichi
keskin   ravishda   oshgan.   Bu   holatni   tillarning   rivojlanishi,   funksional   doirasining
kengayishi, ijtimoiy-iqtisodiy taraqqiyot bilan ham izohlash mumkin”. 24
Hozirgi   kunda   dunyo   miqyosida   mashhur   bo‘lgan   rus,   britan   korpusi,
sloveniya,   vengr   tili,   ispan   tili,   italyan,   xitoy,   nemis   tili   korpuslari   haqida   keng
ma’lumot berilgan.
Korpus lingvistikasida to‘rt xil tahlil usulini farqlash mumkin:
1.Kalit   so‘zlar   tahlili   (Analysis   of   key   words).   Bu   A   va   B   korpuslarini
solishtirganda   uchraydigan   so‘zlar   tahlili.   Bu   miqdoriy   analiz   usuli   bo‘lib,   u   til
korpusida berilgan nutq birliklarini topish yoki topa olmaslik ehtimolini o‘rganadi.
Bu   metod   korpuslardagi   birliklarning   statistikasi,   uchrash   chastotasi   miqdorini
beradi;
2.Birikmalarni   tahlil   qilish   (Analysis   of   collocations).   Birikmalar     so‘zlar‒
oralig‘ida   topilgan   so‘zlardir   ( /+   so‘zlar   chap   va   o‘ng   tomonga).   Ushbu   tahlil	
‒
berilgan   korpusdagi   kontekstda   so‘zni   topish   ehtimolini   tekshiradigan   statistik
testlarga asoslangan;
3.Kollektiv   tahlil   (Colligation   analysis).   Bunga   so‘z,   so‘zlar   qatori   boshqa
so‘zlar   bilan   qo‘shilib   ketishga   moyil   bo‘lgan   sintagmatik   qoliplarni   tahlil   qilish
kiradi.   Qoliplashtirish   leksik   element   va   grammatik   kontekst   orasidagi   aloqaga,
uning   fraza   va   gaplardagi   sintaktik   vazifasi,   joylashuviga   urg‘u   beradi.   Ehtimol,
har bir so‘z o‘ziga xos kollektiv tahlilni taqdim etadi;
4.N-gramm.   N-gramm   tahlili   hisoblash   usuliga   tayanadi,   unda   so‘zlarning
satrlari 2,3,4,5 yoki 6 so‘zdan iborat guruhlarga guruhlangan va ularning chastotasi
ko‘rib chiqilgan 25
. O‘zbek tili korpusini qurish jarayonida yuqorida sanab o‘tilgan
4   usul   olingan   natijalarda   namoyon   bo‘lishini   kuzatdik.   Mazkur   usullarni   korpus
lingvistikasidagi eng oddiy va muhim bo‘lgan usullar sifatida baholash mumkin. 26
23
  Захаров В.П., Богданова С.Ю.   Корпусная лингвистика.  – Иркутск: ИГЛУ, 2011.  –  С.16-17.
24
  Рахманова А .  Ўзбек тили миллий корпусини   яратишда компьютер усуллари .  Филол .  фан.   ф .  д . (PhD)  дисс.
–  Тошкент , 2021. – 20  б .
25
 Using corpus linguistics: research methods.  http://www.perezparedes.es/research-methods-corpus-linguistics .
26
 Abdullayeva   О .  O‘zbek tilining internet axborot matnlari korpusini shakllantirishning nazariy va amaliy asoslari .
Filol.fan.f.d. (PhD) diss…avtoref. – Andijon, 2022. –13 b.
15 Korpusning tuzilishi va tarkibi tilning xususiyatlari, ijtimoiy talab va boshqa
jihatlarga   ko‘ra   turlicha   bo‘lishi   mumkin.   Korpuslar   uchun   yagona   va   o‘zgarmas
andoza belgilanmaydi. 
16 1.2.  Milliy korpus va mualliflik korpuslarining zamonaviy
tilshunoslikdagi o‘rni
Har bir tilning mavqei axborot-kommunikatsiyadagi o‘rni bilan belgilanadi.
Tilning   axborot   almashuv   funk s iyasini   ta’minlashda   kompyuter   lingvistikasi,
korpus   lingvistikasining   ahamiyati   katta.   Korpuslar   muayyan   tilning
xususiyatlarini   yoritishda,   imkoniyatlarini   aks   ettirishda,   tilshunoslik   sohalarini,
xususan,   kompyuter   leksikografiyasini   takomillashtirishda,   ijtimoiy   soha
tushunchalarini ommalashtirishda amaliy ahamiyat kasb etadi.
O‘zbek   tili   turkiy   tillar   guruhi   ichida   so‘zlashuvchilar   nisbatiga   ko‘ra
ikkinchi o‘rinda turadi, birinchi o‘rinda turk tili va uchinchi o‘rinda ozarbayjon tili.
Milliy   korpuslar   ona   tilini   asrab   qolish,   takomillashtirish   uchun   zaruriy   vosita
sifatida ham qaralishi kerak. Chunki kompyuter, internet tilning o‘z kommunikativ
doirasidan   kengroq   arenaga   chiqishini,   muloqot   vositasi   sifatida   o‘zlashtirilishini
ta’minlaydi.   YUNESKO   ma’lumotlariga   qaraganda,   hozirda   mavjud   6   mingga
yaqin   tilning   qariyb   yarmi     iste’moldan   chiqishi   mumkin.   Mazkur   tillarni   saqlab
qolish insoniyat oldidagi muhim vazifalardan hisoblanadi 27
.
O‘zbek tilshunosligida shu kunga qadar amaliy lingvistika borasida tadqiqot
olib   borilmagan   yoki   ilmiy   izlanishlar   yaratilmagan,   degan   fikrdan   yiroqmiz.
O‘zbek   tilshunosligida   kompyuter   lingvistikasi,   tabiiy  tilni   qayta   ishlash,   statistik
tahlil   masalalariga   doir   izlanishlarda   korpus   lingvistikasiga   ham   to‘xtalib
o‘tilgan 28
.
O‘zbek   tili   grammatikasidagi   modellashtirish   namunalari,   grammatik
qoidalarni jadvallar orqali tushuntirishga qaratilgan qo‘llanmalar amaliy lingvistika
tamoyillariga   ko‘ra   yaratilgan.   Hozirgi   davr   amaliy   lingvistikaning   alohida   soha
sifatida rivojlanishini taqozo qilmoqda. 
XXI   asrning   birinchi   o‘n   yilligida   o‘zbek   tilshunosligida   kompyuter
lingvistikasi   yuzasidan   monografik   tadqiqotlar   yuzaga   keldi.   N.Abdurahmonova
27
 Mengliyev B. va boshqalar.  O‘zbek tilining milliy korpusi//Ma’rifat,  –  Toshkent, 2018.
28
  A.Po‘latov,   S.Muhamedova.   Kompyuter   lingvistikasi.-Т.,2008;   B.Yo ‘ ldoshev.   Kompyuter   lingvistikasi.   –
Тoshkent,   2009;   A.Po‘latov.   Kompyuter   lingvistikasi.   –Тoshkent,   2011;     A.Rahimov.   Kompyuter   lingvistikasi
asoslari.   –Тoshkent,2011;     F.Qurbonova.     Kompyuter   lug‘atlari:   tezaurus.   –Тoshkent,2014;   L.Abduhamidova.
Tilshunoslikning yangi  yo‘nalishi: kompyuter lingvistikasi. –Тoshkent, 2015. 
17 inglizcha   matnlarni   o‘zbek   tiliga   tarjima   qilish   dasturining   lingvistik   ta’minotiga
bag‘ishlangan tadqiqotini amalga oshirdi. 29
  M.Hakimov rahbarligida “Tarjimon L-
MX”   tizimi   uchun   bajarilgan   tadqiqot   ishlarida     o‘zbek   va   rus   tillarining   leksik-
sintaktik   tahlili   yoritilgan   va   bu   tadqiqotlar   parallel   matnlar   korpusi   uchun
lingvistik ta’minot vazifasini bajaradi 30
.
M.Abjalova   o‘zbek   tilidagi   matnlarni   tahrir   va   tahlil   qiluvchi   dasturning
lingvistik modullarini ishlab chiqdi. 31
 
O‘zbek   tili   axborot   uslubini   shakllantirishga   oid   bir   qator   ilmiy   maqolalar
e’lon   qilingan.   O‘zbek   tili   sintaksisini   modellashtirish   tizimi   ishlab   chiqilgan 32
.
Korpus   diskursni   tashkil   qiluvchi   asosiy   ma’lumotlar   bazasi   sifatida   talqin
qilingan 33
.
Korpus   lingvistikasi   masalalari   keyingi   yillarda   monografik   planda   tadqiq
etila   boshlandi 34
.   Sh.Xamroyeva   “O‘zbek   tili   mualliflik   korpusini   tuzishning
lingvistik asoslari” mavzusida izlanish olib bordi.
Tadqiqotda  korpus,   uning  tuzilishi,   tarkibi,  nazariy  asoslari,   til   korpusining
lingvistik   tadqiqotlardagi   ahamiyati,   ta’lim   jarayonidagi   o‘rni   tahlil   qilingan.
Korpus   lingvistikasi   shakllanishi   va   taraqqiyoti,   birinchi   va   keyingi   avlod
korpuslarining   o‘ziga   xosligi,   zamonaviy   rus,   ingliz,   turk,   tojik   tili   korpuslari
xususiyatlari,   ularning   mushtarak   va   farqli   tomonlari   qiyoslangan,   korpus   turlari
tasniflangan. 35
29
 Aбдураҳмонова Н. Инглизча матнларни ўзбек тилига таржима қилиш дастурининг лингвистик таъминоти.
Филол. фан... (PhD) diss.-Toshkent, 2018.
30
Хакимов   М.Х.   Расширяемый   входной   язык   математического   моделирования   естественного   языка   для
многоязычной ситуaции машинного перевода // ЎзМУ хабарлари .  –Тошкент,  2009. № 1. – С.75-80.
31
  Aбжалова   М.   Ўзбек   тилидаги   матнларни   таҳрир   ва   таҳлил   қилувчи   дастурнинг   лингвистик   модуллари
(расмий   ва   илмий   услубдаги   матнлар   таҳрири   дастури   учун).   Филол.   фан.   фалс.(PhD)...   дисс.   – Тошкент,
2019.
32
  Арипов   М.,   Норов   А.М.   Разработка   онтологической     модели   синтаксических   правил   узбекского   языка.
“Амалий   математика   ва   информацион   технологияларнинг   долзарб   муаммолари”.   Халқаро   анжуман
тезислари   тўплами.   Of   the   international   scientific   conference   “Actual   problems   of   applied   mathematics   and
information technologies”.  – Тошкент, 2019 йил 14-15 ноябрь.  –  В.279-280.
33
  Садуллаева Н.А.,Абдурашитова Э.Т.Relevance of corpus to discourse.  “Амалий математика ва информацион
технологияларнинг долзарб муаммолари”. Халқаро анжуман тезислари тўплами.  Of the international scientific
conference   “Actual   problems  of  applied  mathematics   and  information  technologies”.   – Тошкент,  2019  йил  14-15
ноябрь.  – В.177
34
  Xамроева   Ш.М.   Корпус   лингвистикаси   атамаларининг   қисқача   изоҳли   луғати.   –   Тошкент:   «Камалак»
нашриёти. – 47 б.; А.Эшмуминов.Ўзбек тили миллий корпусининг синоним сўзлар базаси.  – Қарши, 2019 б.
35
  Захаров В.П., Богданова С.Ю. Корпусная лингвистика.-Иркутск: ИГЛУ, 2011.  – С.5.
18 A.Eshmo‘minov   o‘zbek   tili   milliy   korpusining   sinonim   so‘zlar   bazasini
shakllantirish tamoyillarini yaratdi. Ma’nodosh so‘zlar bazasini tuzishda semantik
razmetkadan   foydalanish   usullarini   tahlil   qildi.   O‘zbek   tilining   lisoniy
sinonimlarini   teglash   algoritmini   ishlab   chiqdi 36
.   Korpus   lingvistikasining
ma’lumotlar bazasi, lingvistik ta’minotiga doir tadqiqotlar amalga oshirilmoqda. 
Milliy korpus til taraqqiyotining ma’lum bir davridagi xususiyatlari, hududiy
va ijtimoiy variantlari – barcha jihatlarini qamragan holda namoyon etishdir. 37
O‘zbek   tilshunosligida   yaratilgan   konkordans   lug‘atlar   milliy   korpusni
shakllantirishdagi   muhim   bosqichdir 38
.   Ayniqsa,   mumtoz   manbalar
konkordanslarining  yaratilayotgani  kompyuter  leksikografiyasini  takomillashtirish
bilan   bir   qatorda   ajdodlarimiz   ma’naviyati,   ma’rifiy-axloqiy   qarashlarining
bugungi   avlodga   etkazilishida,   o‘zbek   tili   tarixiy   asoslarini,   tarixiy   so‘zlar,
arxaizmlar   fondini   shakllantirishda     muhim   ahamiyat   kasb   etadi 39
.   Milliy   korpus
axborot   manbai   sifatida   quyidagi   qulayliklarni   yaratadi:   og‘zaki   va   yozma
manbalar   matni   internet   tizimiga   joylashtiriladi;   qidiruv   tizimiga   razmetkalangan
ko‘rinishda   dasturlashtiriladi;   elektron   kutubxonalarni   shakllantirishga   asos
bo‘ladi, lug‘at, grammatikaga oid adabiyotlar uchun manba sifatida xizmat qiladi;
tilning   taraxiy   taraqqiyoti   jarayonidagi   o‘zgarishlarni   o‘zida   aks   ettiradi;   turli
ma’lumotlar   matn   ko‘rinishida   tizimlanadi;   til   tadqiqida   keng   imkoniyatga   ega
bo‘lgan dasturlashtirilgan tizim sifatida namoyon bo‘ladi 40
.
Milliy til korpusi adabiy til korpusidan farqlanadi. Milliy korpuslar shu tilda
tadqiqot   olib   borishni   ta’minlash,   til   taraqqiyotidagi   o‘zgarishlarni   kuzatish
imkonini beradi. Tilning shakllanish, taraqqiyot bosqichlari, turli davrlardagi ifoda
imkoniyatlari, turli nutq uslubidagi matnlar, dialektlar, sotsiolektlar, argo, jargonlar
o‘z   ifodasini   topadi.   Adabiy   til   korpusi   adabiy   til   taraqqiyoti   va   adabiy   nutq
uslublari   xususiyatlari   bilan   bog‘liq   tadqiqotlar   uchun   material   vazifasini   o‘taydi.
36
  А.Эшмуминов. Ўзбек тили миллий корпусининг синоним сўзлар базаси.  –  Қарши, 2019.
37
  Рахманова А .  Ўзбек тили миллий корпусини   яратишда компьютер усуллари .  Филол .  фан.   ф .  д . (PhD)  дисс.
– Toshkent , 2021. – 46  b .
38
 Алишер Навоийнинг “Ҳайрат ул-аброр” достони конкорданси. -Тошкент, ТДШИ,2012.
39
    Умаров Э.  Алишер Навоийнинг  “Хамса” достонлари конкорданслари. –Т ошкент , 2011.-Б.4.
40
  X амроева   Ш .   М .   У ̆збек   тили   муаллифлик   корпусини   тузишнинг   лингвистик   асослари :   Филол .   фан.   ф .   д .
(PhD)  дисс.   автореф . –  Қарши , 2018. – Б . 8
19 Adabiy til korpuslari umumiste’mol so‘zlarni aks ettirgani bois turli yo‘nalishdagi
lug‘atlar: elektron shakldagi o‘zlashma so‘zlar lug‘ati, morfem lug‘at, sinonimlar,
omonimlar,   antonimlar,   frazeologik   birliklar   lug‘ati,   etimologik   lug‘at,   o‘quv
lug‘atlarini yaratishda manba vazifasini o‘taydi. 41
Milliy   korpuslar   mualliflik   korpuslarini   shakllantirish   uchun   ham   material
sifatida   xizmat   qiladi.   O‘zbek   tilshunosligida   kompyuter   lingvistikasiga   doir
tadqiqotlarning   yo‘lga   qo‘yilishi,   korpus   lingvistikasi   asoslarining   shakllanishi
natijasida   mualliflik   korpuslari   yaratilmoqda.   Mualliflik   korpuslari   o‘zbek   adabiy
tilining   badiiy   uslubi   namunasi   bo‘lgan   ma’lumotlar   bazasi,   shu   bilan   qatorda
ijodkorning   so‘z   qo‘llash   qobiliyati   va   tildan   foydalanish   mahoratini   yorituvchi
manba sifatida ham xizmat qiladi.
“Mualliflik   korpuslari   muayyan   ijodkorning   so‘z   qo‘llash   hamda   badiiy
mahorati,   asarlarining   janrlari   va   kontenti   haqida   ma’lumot   bersa,   dinamik
korpuslar   til   taraqqiyotining   muhim   bosqichlarini   aks   ettirishi   bilan   e’tiborga
molikdir”. 42
Tilshunosligimiz   tarixida   alohida   muallif   asari   til   xususiyatini   o‘rganishga
bag‘ishlangan   maxsus   tadqiqotlar   talaygina   bo‘lib,   ularda   muallif   tili   leksikasi
atroflicha   tavsiflangan.   Bunday   tadqiqotlar   tilning   rivojlanish   jarayoni,
o‘zgarishlarni:   ma’no   torayishi,     kengayishi,   istorizm,   arxaizm,   neologizmlar
harakatini kuzatish uchun qulay sharoit yaratadi. Mana shunday  xususiyat  har bir
muallif,     davr   tili   uchun   tadqiq   etilgan   bo‘lsa-da,   ular   alohida-alohida
monografiyalarda, tadqiqot ishlarida mavjud. Agar bu tadqiqotlar Milliy korpusda
yaxlit   bir   tizim   asosida   o‘z   aksini   topsa,   istalgan   leksemaning   tarixiy   taraqqiyot
jarayonini   turli   muallif   tili   misolida   yorqin   tasavvur   qilish   imkoniyati   paydo
bo‘ladi.
41
  Рахманова А .  Ўзбек тили миллий корпусини   яратишда компьютер усуллари .  Филол .  фан.   ф .  д . (PhD)  дисс.
– Toshkent , 2021. – 53 b .
42
  Рахманова А .  Ўзбек тили миллий корпусини   яратишда компьютер усуллари .  Филол .  фан.   ф .  д . (PhD)  дисс.
– Toshkent , 2021. –  25  b .
20 “Tilshunosligimiz oldida turgan endigi vazifa shu tadqiqotlarni birlashtirish
asosida korpus yaratishdan iborat. Bu vazifani amalga oshirish ikki bosqichni  o‘z
ichiga oladi: 
1.Tilimiz tarixiy taraqqiyoti  davrida til xususiyatlari  tadqiq qilingan adiblar
ijodiy merosi, tadqiqot natijasini korpus sifatida shakllantirish;
2.Shu paytgacha til xususiyati o‘rganilmagan yozuvchi, shoirlarning asarlari
korpusini tuzish”. 43
Jahon tilshunosligida korpus lingvistikasi ancha yutuqlarga erishgan bo‘lsa-
da, mualliflik korpusi tuzish tajribasi oxirgi 5 yil ichidagina to‘laroq shakllandi, bu
borada ancha natijalarga erisha oldi. Bunday korpus tuzish ma’lum davr adabiy tili,
xususan, leksik tarkibi, uslubiy xususiyatini tadqiq etish uchun material vazifasini
o‘tashdek qimmatli vazifani ado etadi. 
Milliy   korpusi   mavjud   tillarning   mualliflik   korpusini   tuzish   hech   qanday
qiyinchilik   tug‘dirmaydi.   Chunki   matn   (muallif   asari)   elektron   shaklda   Internet
saytida   yoki   korpus   tarkibida   mavjud.   Mualliflik   huquqi   asosida   bu   asarlar
tarmoqda   mavjudligi   sababli   ularni   korpusga   xom   ashyo   sifatida   olishga   monelik
yo‘q.   Milliy   korpusi   mavjud   bo‘lmagan   tillarda   korpus   yaratishda   esa   bu   borada
biroz muammoga duch kelish tabiiy hol. O‘zbek tili milliy korpusi bo‘lmasa ham,
ZiyoNET   tarmo g‘ida   mumtoz   hamda   zamonaviy   shoir,   yozuvchilarimiz
asarlarining   anchasi   elektron   shaklda   joylashtirilgan.   Shunga   asosan,   mualliflik
korpusi tuzishda ikki manbaga asoslanish mumkin:
-har bir muallifning nashr etilgan mukammal asarlari to‘plami.
-Internet tarmog‘idagi elektron fayllar. 44
Birinchi   manbani   elektron   shaklga   aylantirish   (skanerlash,   matnni   sun’iy
intellekt   tushunadigan   formatga   keltirish)   orqali   material   sifatida   ishlatsak,
ikkinchi   manbadan   nisbatan   tayyor   holda   foydalanishimiz   mumkin.   Ikkala   holda
ham   matnning   elektron   shakli   olingach,   uni   texnik   qayta   ishlash   –   tokenizatsiya,
lemmatizatsiya,   sintaktik  razmetkalash   ehtiyoji  tug‘iladi.  Texnik  ishlov   berishdan
43
  Ҳамроева   Ш .   М .   У ̆збек   тили   муаллифлик   корпусини   тузишнинг   лингвистик   асослари :   Филол .   фан.   ф .   д .
(PhD)  дисс.   –  Қарши . 2018, 82- б .
44
  Ҳамроева   Ш .   М .   У ̆збек   тили   муаллифлик   корпусини   тузишнинг   лингвистик   асослари :   Филол .   фан.   ф .   д .
(PhD)  дисс.   –  Қарши . 2018, 83- б .
21 oldin   matn   korpus   uchun   tayyorlanadi,   chunki   unda   nolingvistik   birlik   ham
uchraydi.   Korpus   matnining   asosiy   belgisi   unda   nolingvistik   birlikning   (jadval,
rasm,   grafik   chizma)   bo‘lmasligid a .   Shundan   so‘nggina   razmetkalash   bosqichiga
o‘tish   mumkin.   Razmetkalash   avtomatik,     yarimavtomatik   rejimda   bajariladi.
Muallif   qo‘llagan   neologizm,   boshqa   alifboda   yozilgan   so‘zshakl
lemmatizatsiyasiga  alohida e’tibor  qaratiladi. Korpus tayyor  holga kelgach, tabiiy
ravishda   muallif   asarlari   chastotali   lug‘ati   yuzaga   keladi.   Chunki   lemmatizatsiya
jarayonida so‘zshakl hamda leksema (lemma) miqdori aniqlanadi.
Jahon   tilshunosligida   yaratilgan   mualliflik   korpuslarini   tarixini   o‘rganar
ekanmiz,   dastlabki   mualliflik   korpusi   2001-yilda   Erik   M.Jonson   tomonidan
tuzilgan   bo‘lib,   u   Shekspirning   1864-yilda   nashr   qilingan   to‘liq   asarlari   asosida
tuzilgan. 
Rus   tilshunosligida   bu   sohaga   keyingi   yillarda   qo‘l   urilgan   bo‘lsa-da,
anchagina ishlar amalga oshirilgan:  “A.S.Pushkin tili lug‘ati”,  “A.P.Chexov badiiy
asarlari   tili lug‘ati”,   “Krilov masallari tili lug‘ati”, “Griboyedov komediyalari tili
lug‘ati”,   “Gogolning   “Revizor”   komediyasi   tili   lug‘ati”,   “Fonvizin   komediyalari
tili”   “ A.N.Ostrovskiy asarlari tili lug‘ati”, “M.V.Lomonosov asarlari tili lug‘ati”,
“M.Kuzmin   she’rlari   konkordansi”,   “A.Mitskevichning   “Pan   Tadeush”   poemasi
tili ideografik lug‘ati” kabi ishlar shular jumlasidandir 45
.
Dunyo   tillari   korpusidagi   ayrim   mualliflik   korpuslari   haqida   to‘xtalib
o‘tmoqchimiz. 
Rudaykiy   korpusi   tojik   tili   milliy   korpusi   tarkibida   joylashgan.   Rudakiy
asarlarining   maxsus   qidiruv   tizimiga   bo‘ysundirilgan   elektron   yig‘indisi.   Bu
korpusga shoir tavalludining 1150 yilligiga tayyorgarlik jarayonida asos solingan.
Korpus   asosini   shoirning   asarlari   matni   tashkil   etgan.   Zamonaviy   axborot
texnologiyalari   yordamida   Rudakiy   g‘azallari   matni   bo‘yicha   bir   nechta   lug‘at
tuzilgan. Chastotali lug‘at, kamayish, ortib borish alifbo chastotali lug‘ati, Rudakiy
ijodi   matnlari   ters   lug‘atlari   shular   jumlasidan.   Korpus   tarkibidan   Rudakiy   ijodiy
merosining   barcha   namunalari,   bibliografiyasi,   Rudakiy   hayoti,   ijodiga
45
  Хамроева   Ш.   «Ўзбек   тили   муаллифлик   корпусини   тузишнинг   лингвистик   асослари»   филол.фан.бўйича
фалсафа доктори (PhD)…дисс. –Қарши. 2018.
22 bag‘ishlangan   asarlar,   shoir   ijodi   turli   aspektlari   tadqiqi   natijalari   o‘rin   olgan.
Rudakiy she’rlari, ular asosidagi qo‘shiqlarning audio, video yozuvlari  to‘plangan;
korpus doim to‘ldirib boriladi. Ushbu korpus elektron kutubxona shaklida faoliyat
ko‘rsatadi.   Ammo   Rudakiy   asarlari   matniga   grammatik   ishlov   berilmagan,   ya’ni
razmetkalanmagan.   Korpus   razmetka   qilinmaganligi   uchun   subkorpus   deyiladi.
Shunday   bo‘lsa-da,   ayni   bir   ijodkor   merosi,   shu   sohadagi   ilmiy   tadqiqotlarni
o‘rganish   maqsadida   foydalanish   uchun   juda   qulay   axborot   manbayi.   Boshqacha
aytganimizda bu korpusdan elektron kutubxona sifatida foydalanish mumkin.
A.P.Chexov   asarlari   korpusi .   A.P.Chexovning   barcha   asarlari   Rus   tili
Milliy   Korpusida   [NCRL]   taqdim   etilmaganligi   sababli,   uning   nashr   etilgan
asarlari skanerdan o tkazilgan va turli internet saytlarida to plangan.ʻ ʻ
Hozirgi   vaqtda   Korpusga   A.P.Chexovning   barcha   nasriy   asarlari   va
pyesalari,   shuningdek,   masalan,   jurnalistikaga   tegishli   bo‘lishi   mumkin   bo‘lgan
asarlar kiritilgan. “Saxalin oroli”, ammo to‘liq asarlar  to‘plamida [Chexov, 1977]
va boshqa manbalarda nashr etilgan xatlar, kundaliklar va boshqalar matnlari hali
kiritilmagan.
Chexov juda sermahsul muallif sifatida turli xil matn turlarini, ya’ni qissalar,
romanlar,   dramatik   asarlar,   publitsistik   va   tanqidiy   maqolalarni   yaratdi.   Afsuski,
bir   nechta   imlo   islohotlari   va   turli   yillardagi   muharrirlarning   ishi   tufayli   korpus
matnlarining tili muallifning tiliga to‘liq mos kelmaydi.
Korpus   A.P.Chexovning   barcha   badiiy   asarlarini   qamrab   oladi:   hikoyalar,
romanlar   va   dramalar.   Korpus   va   lug‘at   Internetda   mavjud
( http://www.philol.msu.ru/~serge/Chekhov/index1.html )   va   ikkita   paketli   fayl
sifatida taqdim etiladi:
storyChekh.zip  da Chexov asarlarining matn fayllari mavjud;
wordsChekhov.zip   korpusning   o‘zi   va   lug‘atni   o‘z   ichiga   oladi.   Korpus   va
lug‘atdan foydalanish uchun ikkala faylni ham mos katalogga yuklab olishingiz va
ochishingiz kerak.
A.S.Pushkin   asarlari   korpusi   “A.S.Pushkin   she’riyati   va   dramaturgiyasi”
matnlar   korpusi   deb   nomlangan.   Ushbu   korpusga   A.S.Pushkinning   barcha   nashr
23 etilgan she’riy va dramatik asarlari kiritilgan. (Pushkin. To‘liq asarlar. –M.: Fanlar
akademiyasining nashriyoti, 1937).
Korpus   matnlari   «Putevoditel   po   Pushkinu»   nomli   lug‘at   bazasi   bilan
bog‘langan   va   Pushkinning   eslatmalari   va   mualliflar   haqidagi   ma’lumotlarni   o‘z
ichiga oladi.
Bundan tashqari korpusga adabiyotshunoslar uchun ham, tilshunoslar uchun
ham qiziqarli bo‘lgan 15 turdagi ma’lumotlar  kiritilgan. 
Dostoyevskiy   korpusi   haqida .   F.Dostoyevskiy   tegishli   davrning   yozma
diskursiv amaliyotini ifodalovchi matnlar korpusi fonida har xil turdagi so‘zlar va
frazeologik   birliklarni   qo‘llagan.   “Dostoyevskiy   idiostilining   lingvistik   modeli”
nomli   asar   “Dostoyevskiy   idiostilining   lingvistik   modeli:   adabiy   matnni
o‘rganishda   korpus   texnologiyalari”   loyihasining   natijasi   hisoblanadi.   Loyiha
ustida   ishlash   jarayonida   Rossiya   Fanlar   akademiyasining   tizimli   dasturlash
instituti mutaxassislari hisoblash uchun maxsus internet platformasini yaratganlar.
Platforma   https://ruslang.at.ispras.ru   manzilida   joylashgan;   bu   platformaga   so‘z
chastotalari   va   turli   matn   korpuslarida   idiomalarni   qidirish   vazifasi   yuklatilgan.
Dasturga   matn   yuklangan   keyin   u   3   ta   vazifani   bajargan:   berilgan   leksemaning
korpusdagi   chastotasini   hisoblash,   korpusdagi   leksemalarning   chastotalar
ro yxatini tuzish va korpusdagi iboralarni qidirish. ʻ
Griboyedov   komediyalari   tili   lug‘ati   (korpusi)   haqida .   Bu   korpus   rus
yozuvchisi   A.S.Griboyedov   tilining   birinchi   to ‘ liq   leksikografik   tavsifi   sanaladi.
Lug‘at   Griboyedovning   barcha   nashr   etilgan   matnlarida   eng   nufuzli   manbalardan
olingan barcha so‘zlarni o‘z ichiga oladi.
Lug‘atning   asosiy   qismini   grammatik   ma’lumotlar   bilan   ta’minlangan
Griboyedov   matnlarining   alifbo-chastota   konkordansi   tashkil   etadi.   Konkordans
12000   dan   ortiq   yozuvlarni   o‘z   ichiga   oladi,   ular   birgalikda   150   000   dan   ortiq
so‘zlardan   foydalanishni   tavsiflaydi.   Lug‘at   yozuviga   leksema   (bosh   so‘z),   uning
grammatik   belgilari   (nutq   qismi,   turi,   jinsi,   animatsiyasi),   barcha   matnlar   uchun
umumiy   chastota,   kerak   bo‘lsa,   qisqacha   izoh   ham   kiradi.   So‘z   qo‘llanishi
grammatik   shaklga   (son,   hol,   mayl,   zamon)   ko‘ra   guruhlanadi.   Har   bir   so‘z
24 qo‘llanilishi   manba   kodini   va   uning   bo‘lagini   (qism,   bob,   harakat,   hodisa   va
boshqalar) o‘z ichiga olgan batafsil kontekst va manzilni o‘z ichiga oladi.
Konkordansdan tashqari, lug‘at bir qator yordamchi lug‘atlar va indekslarni
qamrab oladi, xususan:
- “Aqldan voy” matnining alifbo ko‘rsatkichi;
- chastota lug‘ati;
- prozaik va she’riy nutqning chastotali lug‘atlari;
- teskari alifbo lug‘ati;
- grammatika lug‘ati.
Yordamchi   lug‘atlar   asosiy   lug‘atning   turli   mezonlar   bo‘yicha
tartiblangandir.   Ular   faqat   leksemalarni   o‘z   ichiga   oladi   va   alohida   so‘z
qo‘llanishlarini o‘z ichiga olmaydi.
Ushbu   lug‘ati   Griboyedov   ijodi,   rus   adabiyoti   va   rus   adabiy   tili   tarixini
o‘rganish   bilan   shug‘ullanadigan   barcha   filologlarga   mo‘ljallangan.   Lug‘at   leksik
materialni  to‘liq qamrab olish va batafsil  tahlil  qilish nuqtai  nazaridan o‘ziga xos
bo‘lib,   undan   keng   ko‘lamli   filologik   muammolarni   hal   qilishda   foydalanish
imkonini   beradi,   jumladan:   ma’lum   bir   muallif   yoki   tarixiy   davrning   uslub
xususiyatlarini   o‘rganish,   turli   xalqlarning   tilini   solishtirish.   asar   turlari   va   nutq
turlari   (nasr   va   she’riy),   rus   adabiy   tili   tarixida   ma’lum   so‘zlar   yoki   grammatik
shakllarning qo‘llanilishini o‘rganish va boshqalar.
Gogolning   “Revizor”   komediyasi   tili   lug‘ati   Moskva   universitetining
filologiya   fakulteti   olimlari   tomonidan   nashr   etilgan.   Gogol   frazeologiyasi   va
leksikografiyasi   hali   olimlarning   e’tiborini   tortmagan,   deyish   mumkin   emas.   Bu
mavzuda   maxsus   tadqiqotlar   va   dissertatsiyalar   yozilgan.   Va   shunga   qaramay,
yozuvchining   ijodiy   merosini   o‘rganishning   ushbu   sohasi,   til   islohotchisi,   juda
ko‘p noma’lum narsalar bilan to‘la. Bundan tashqari, Gogolning o‘zi ham birinchi
mahalliy leksikograflardan biri bo‘lib, u uchun materiallar to‘plagan. 
Lug‘atda   28000   so‘zdan   foydalanishni   tavsiflovchi   4000   ta   yozuv   mavjud.
Har   bir   so‘zning   chastotasi,   uning   grammatik   va   semantik   xususiyatlari
25 ko‘rsatilgan,   matndan   misollar   so‘zning   ishlatilishini   ko‘rsatadi.   Ayrim   so‘zlarga
tarixiy-madaniy sharh berilgan. 
Krilov   masallari   tili   lug‘ati da     adibning   198   ta   ertakgining   lug‘ati   va
frazeologiyasining   to‘liq   tavsifini   berilgan.   Unda   6000   dan   ortiq   lug‘at   yozuvlari
mavjud   bo‘lib,   har   bir   so‘zning   chastotasi,   uning   grammatik   va   semantik
xususiyatlari,   har   bir   so‘zning   ishlatilishi   ertaklardan   olingan   misollar   bilan
ko‘rsatilgan. Kitobga I.A. Krilovning eng mashhur ertaklari ham kiritilgan. 
Abdulla   Qahhor   asarlari   korpusi.   Korpus   interfeysi   “Abdulla   Qahhor
hayot yo‘li”, “Abdulla Qahhor ijodi”, “Abdulla Qahhor haqida xotiralar”, “Qidiruv
(so‘z kiritish maydonchasi)”, “Konkordans”, “Kengaytirilgan qidiruv” kabi asosiy
oynalardan iborat bo‘ladi. Abdulla Qahhor korpusi uning hayoti, ijodi bilan bog‘liq
turli   janrdagi   matnlarni   (korpus   birliklari)   qamrab   olishi   lozim,   chunki   korpus
matnlari   faqat   badiiy   adabiyot   namunalaridan   iborat   bo‘lolmaydi.   Shuning   uchun
yozuvchi   hayoti,   ijodi   bilan   bog‘liq   ilmiy-ommabop,   publitsistik   maqolalar,
yozuvchi   haqida   yaratilgan   xotiralar   (memuar),   eng   asosiysi,   Abdulla   Qahhor
asarlarining barchasini qamrab olishi lozim. 
O‘zbek   tilida   korpus   lingvistikasiga   doir   tadqiqotlar   endi   shakllanmoqda.
Korpus lingvistikasiga doir tadqiqotlar ko‘lamini kengaytirish, semantik, sintaktik
razmetkalar   asosidagi   keng   ma’lumotlar   bazasini   shakllantirish,   o‘zbek   tili   lug‘at
qatlamini,   istorizm,   arxaizm   kabi   tarixiy   asoslarini,   argo,   jargon   tipidagi   ijtimoiy
ko‘rinishlarini qamrab olish va tadqiq etish dolzarb ahamiyat kasb etadi.
26 Bob bo‘yicha xulosa
1. Globallashuv davrida jahon tilshunosligining jadal rivojlanayotgan sohasi
korpus lingvistikasi bo‘lib, uning ish quroli til korpusidir.
2.   Korpus   –   matn   asosida   ma’lum   vazifani   bajaruvchi   dastur.   Korpus
yordamida belgilangan so‘zning turli kontekstdagi barcha shakldagi ko‘rinishlarini,
tilning   lug‘at   tarkibidagi   o‘rni   va   variantlarini,   belgilangan   so‘z   bilan   birikish
imkoniyatiga  ega   so‘zlar   ro‘yxatini,  u   yoki   bu  so‘zning   ayni   so‘zdan   foydalanish
chastotasini yoki statistikasini aniqlash kabi turli amallarni bajarish mumkin.
3.   Tilni   o‘rganishda   lug‘at   boyligining   kattaligini   ko‘rsata   olish,   so‘z
qo‘llanilish   imkoniyatini   u   yoki   bu   grammatik   konstruksiya   orqali   tushuntirish
uchun   misollar   massivini   ko‘rsatishda   korpus   qo‘l   keladi.   Korpusda   mavjud
matnlarni saralash imkoni bor, misolni barcha matnlardan emas, balki tadqiqotchi
– o‘quvchi uchun qiziqarli va kerakli bo‘lgan matnlardan ajratib olish mumkin.
4.   Korpusning   ijtimoiy   ahamiyati   keng   qamrovli   bo‘lib,   undan   lingvistik,
etnopsixolingvistik   tadqiqotlarda,   ona   tili,   adabiyot,   xorijiy   til   ta’limida,   matnga
ishlov berish, tarjima dasturlarini tuzishda foydalanish mumkin.   Korpus ish quroli
so‘z bo‘lgan har qanday kishi uchun zamonaviy axborot vositasidir.
5. Korpusning paydo bo‘lishi, rivojlanishi ikki bosqichdan iborat.
1-bosqich.   Kompyuter   asrigacha   bo‘lgan   davr.   Bu   davr   korpusi   –
kartotekalar to‘plamidan iborat, garchi bugungi korpus ko‘rinishida bo‘lmasa ham
lingvistik   tadqiqot   uchun   material   vazifasini   o‘tagan.   2-bosqish.   Kompyuter   asri
korpuslari   davri.   Kompyuter   asri   korpuslari   davrida   ular   elektron   shaklga   kirdi,
dasturlashdi.
6.   O‘zbek   tilining   milliy   korpusini   yaratish   bilan   bir   qatorda   mualliflik
korpuslarini   yartish   –   bugungi   kunda   amaliy   tilshunosligimiz   oldida   turgan   eng
muhim masalalardan biri.
7.   Adabiy   til   rivojiga   salmoqli   hissa   qo‘shgan   buyuk   yozuvchilar
asarlarining   leksikasini   asrab   qolish,   butun   ko‘lami   bilan   tavsiflash,   til   egalari
uchun   namuna   vazifasini   o‘taydigan   model   shakliga   keltirish   adabiy   tilni   asrash,
27 rivojlantirish   omili   bo‘lib   xizmat   qilishini   hisobga   olgan   holda   mualliflik
korpuslarini tuzish bugungi kun korpus lingvistikasining dolzarb vazifasidir.
8.  Milliy korpuslar mualliflik korpuslarini shakllantirish uchun ham material
sifatida   xizmat   qiladi.   O‘zbek   tilshunosligida   kompyuter   lingvistikasiga   doir
tadqiqotlarning   yo‘lga   qo‘yilishi,   korpus   lingvistikasi   asoslarining   shakllanishi
natijasida   mualliflik   korpuslari   yaratilmoqda.   Mualliflik   korpuslari   o‘zbek   adabiy
tilining   badiiy   uslubi   namunasi   bo‘lgan   ma’lumotlar   bazasi,   shu   bilan   qatorda
ijodkorning   so‘z   qo‘llash   qobiliyati   va   tildan   foydalanish   mahoratini   yorituvchi
manba sifatida ham xizmat qiladi.
28 II  BOB. “MUALLIFLIK KORPUSI” DASTURI USTIDA
BAJARILADIGAN AMALLAR
2.1.Dasturiy majmuaning tuzilishi va tavsifi
Bugun gi   globallashuv   davrida   aniq   va   tabiiy   fanlar   bilan   bir   qatorda
tilshunoslik sohasida  ham kompyuterdan samarali  foydalanish  hajmi tobora oshib
bormoqda.   Matematik   lingvistika   tadqiq   etayotgan   masalalar   doirasida   endi
«kompyuter lingvistikasi» atamasi kirib keldi. Ushbu atama bilan bir vaqtda uning
tizimida «korpus lingvistikasi» atamasi ham faol ishlatila boshlandi.
Kompyuter   texnologiyalarining   rivoji   natijasida   zamonaviy   tilshunoslikda
korpus va kompyuter lingvistikasi terminlarini semantik tahlil, korpus lingvistikasi
(BNC), kritik diskurs tahlil (CDA), shuningdek, deskriptiv, qiyosiy va komponent
tahlil metodlari asosida tadqiq etish tobora dolzarb ahamiyat kasb etib bormoqda.
Kompyuter   lingvistikasining   paydo   bo‘lishi   bugungi   kunda   tilshunoslik   fanining
bir   qancha   muammolariga   yechim   topish   imkoniyatini   beradi.   Kompyuter
texnologiyalarini tilshunoslikning ilmiy-nazariy, falsafiy muammolari: til va nutq,
sistema   va   struktura,   semiotika,   sintagmatika   va   paradigmatika,   tipologiya,
lug‘atshunoslik   kabi   muhim   hamda   murakkab   masalalari   bo‘yicha   olib
borilayotgan   ilmiy   tadqiqotlarda   qo‘llashning   ijobiy   tomonlariga   tayangan   holda
korpus lingvistikasi sohasi yaratildi.
“Kompyuter va korpus lingvistikasi bir-biriga o‘xshash va ba’zi hollarda bir
xil degan noto‘g‘ri qarashlar uchrab turadi. XX asrning 90-yillari birinchi yarmida
korpus tilshunosligi til to‘g‘risidagi fanning alohida qismi sifatida shakllandi. Shu
bilan   birga,   u   kompyuter   tilshunosligi   bilan   yaqindan   hamkorlik   qiladi,   uning
yutuqlaridan foydalanadi va, o‘z navbatida, uni boyitadi”. 46
Korpus  lingvistikasi   kompyuter   lingvistikasining   bo‘limi   bo‘lib, kompyuter
texnologiyalari yordamida lingvistik korpus (matnli korpus)ning qurilishi va undan
foydalanishning   umumiy   tamoyillarini   ishlab   chiqish   bilan   shug‘ullanadi.
Lingvistik korpus yoki matnli korpus ostida o‘ziga xos til muammolarini hal qilish
46
  Атабоев   Н.   Корпус   ва   компьютер   лингвистикасининг   фарқли   жиҳатлари.   /   Хорижий   филология.
http://samxorfil.uz/maqola/korpus lingvistikasining asosiy xususiyatlari
29 uchun   yaratilgan   katta   hajmdagi   mashinada   o‘qiladigan,   birlashtirilgan,
yorliqlangan,   formatlangan   filologik   jihatdan   barkamol   til   ma’lumotlari   to‘plami
tushuniladi. Korpus tilshunosligi atamasi birinchi marta 1977-yilda ishlatilgan, bu
esa   korpus   tilshunosligini   juda   yosh   ilmiy   yo‘nalish   deb   atashga   imkon   beradi.
Ammo   shu   qisqa   vaqt   ichida   korpus   tilshunosligi   hisoblash   tilshunosligining
yondashuvlaridan   biri   sifatida   zamonaviy   tilshunoslikning   yetakchi
yo‘nalishlaridan biriga aylandi. Rossiyada bu atama ingliz tilining xalqaro korpusi
asoschilaridan   biri   Sidney   Grinbaumning   ma’ruzalari   orqali   1996-yilga   kelib
ma’lum bo‘ldi.
Kompyuter   tilshunosligi   korpus   tilshunosligi   uchun   vositalarni   (ya’ni
dasturlarni) yaratadi. Shu ma’noda ular bir-birini to‘ldiradilar. Masalan, korpus
tilshunoslari   korpusda   so‘zlarni   avtomatik   tarzda   belgilash   uchun   maxsus
vositalarga   muhtoj.   Agar   yuz   milliondan   ortiq   foydalanadigan   matn   birligi
mavjud bo‘lib, har bir so‘z uchun nutqning bir qismini belgilash kerak bo‘lsa, bu
jarayonni to‘laligicha qo‘lda amalga oshirib bo‘lmaydi, shu bois tizimli dasturiy
ta’minot talab qilinadi.
XX   asrning   60-70-yillaridagi   jahon   tilshunosligining   taraqqiyoti
eksperimental   fonetika,   fonologiya,   poetik   nutq   nazariyasi,   areal   lingvistika,
nutq   statistikasi,   kompyuter   lingvistikasi,   korpus   lingvistikasi   kabi   qator   yangi
ilmiy yo‘nalishlar paydo bo‘lganligi bilan xarakterlanadi. Chunonchi, mana shu
davrda yuzaga kelgan va jadal rivojlanishga yuz tutgan ilmiy izlanishlardan biri
– til va nutq birliklarini kvantitativ usullar va kompyuter yordamida tadqiq etish,
ya’ni   kompyuter   tilshunosligi   hisoblanadi.   Tilshunoslikka   statistik   usulning
kirib   kelishi,   unga   bo‘lgan   qiziqish:   1)   til   va   nutq   hodisalarini   chuqurroq
tushunish;   2)   har   bir   tilning   ma’lumotlar   bazasini   yaratish   orqali   qiyosiy
lingvistikani   rivojlantirish;   3)tabiiy   tillar   grammatikasiga   optimallashuv
mezonlari   asosida   yondashish;   4)   ilmiy   ishlarda   aniqlik   va   obyektivlikni
ta’minlash;   5)   matnni   avtomatik   qayta   ishlash   (avtomatik   tarjima,   avtomatik
tahrir, lingvostatistika) kabi muammolarni hal qilish; 6) o‘quv jarayoni(o‘qitish,
bilimlarni baholash)ni kompyuterlashitirish; 7) o‘zbek mashina fondini yaratish
30 orqali   tabiiy   tillarning   jahon   axborot   uslubini   rivojlantirish   kabi   muammolarni
yechishda yordam berdi. 47
Har   qanday   yuksalayotgan   fan   o‘z   amaliyotida   kompyuter   taraqqiyotining
yutuqlaridan   foydalanadi,   lekin   ushbu   fanlar   (korpus   lingvistikasi,   kompyuter
lingvistikasi,   kompyuter   matematikasi,   kompyuter   fizikasi)
kompyutershunoslikning   bir   qismi   sifatida   qabul   qilinishi   joiz   emas.   Bu   fanlar
tahlil obyektini tadqiq etishda kompyuterdan vosita sifatida foydalanadi.
Korpus   lingvistikasi   ham   kompyuterlardan   vosita   sifatida   foydalanadi.
Tan   olish   kerakki,   agar   kompyuterlar   bo‘lmaganida   u   hozirdagi   faoliyatini
amalga   oshira   olmas   edi.   Fanlarning   taraqqiyoti   natijasida   korpus   lingvistikasi
barcha   fanlarda   tatbiq   etiladi,   lekin   bu   orqali   ushbu   fanlar   kompyuter   sohasi
(computer science)ning bir qismi bo‘lib qolmaydi.
XIX   asr   oxiri   XX   asrning   boshlarida   korpuslar   lingvistik   tadqiqotlar
o‘tkazish  uchun yoki  ko‘pincha amaliy muammolarni yechish uchun (masalan,
til   birliklarining   chastotasini   hisoblash   uchun)   yaratila   boshlandi.   Korpus
tilshunosligi uchun kompyuterlarning ixtiro qilinishi va keng qo‘llanilishi bilan
rivojlanishning yangi bosqichi boshlanadi – yaratilgan korpuslar mavjudlaridan
nafaqat saqlash formatida, balki hajmlarida ham farq qiladi.
Foydalanuvchi   yoki   kuzatuvchi   nuqtayi   nazaridan   ishlab   chiqarilayotgan
mahsulotning   harakatiga   loyiha lash   deyiladi.   Har   qanday     dasturiy   ta’minotni
loyihalash   uning   tuzilmasini,   ya’ni   uning   tarkibiy   qismlari   va   ular   orasidagi
bog‘lanishlarni   aniqlashdan   boshlanadi.   Tuzilmani   aniqlash   natijasi   tuzilmaviy
yoki   funksional   sxema   va   komponentlar   (tarkibiy   qismlar)   tavsifi   sifatida
tasvirlanishi   mumkin.   Dasturning   tuzilmaviy   sxemasi   deganda,   uning   tarkibini
va   qismlarni   boshqarishdagi   o‘zaro   ta’sirlarni   aks   ettiruvchi   sxemani
tushunamiz. Biz loyihalayotgan dasturda tuzilmaviy komponentlar faqat qismiy
dasturlardan   iborat.   Umuman   olganda,   dasturning   komponentlari,   qismiy
dasturlar,   ma’lumotlar   bazalari,   resurslar   bibliotekasi   va   hokazolardan   iborat
bo‘lishi   mumkin.   Axborot   texnologiyalar i   sohasida   kompyuterda   biron-bir
47
  O‘rinbayeva   D.   Xalq   og‘zaki   ijodi:   janriy-lisoniy   va   lingvostatistik   tadqiq   muammolari:fil.fan.   doktori   (DSc).–
Samarqand, 2019. 19-bet
31 masalani ng   yechilishini   ta’minlaydigan   ishdir.   Qo‘yilgan   maqsadni   amalga
oshirish   uchun   kerakli   ma’lumotlar   tarkibi,   tuzilishi,   ifodalanishi   aniqlangan
bo‘lib,   ular   orasidagi   bog‘lanishlar   aniq   ifodalangan   bo‘lsa,   masala   qo‘yilgan
deb hisoblanadi.
Yaratilgan   dasturiy   mahsulotdan   tilshunoslik   sohasidagi     ilmiy   tadqiqotlar
faoliyatida   foydalanish   nazarda   tutiladi.   Ushbu   magistrlik   dissertatsiyasida
kompyuter   yordamida   o‘zbek   tilining   mualliflik   korpusini   hosil   qilish,   dasturiy
majmua   yaratilishi   nazarda   tutilgan.   Shuning   uchun   qaralayotgan   masala   dolzarb
ahamiyatga   ega.   Shunday   qilib,   yaratiladigan   dasturning   vazifasi   o‘zbek   tili
matnini   dasturga   kiritish   va   o‘rganilayotgan   so‘z   bo‘yicha   konkordanslar   tuzish,
matn bo‘ylab joylashuv o‘rnini ko‘rish, o‘rganilayotgan so‘z bo‘yicha n-grammali
lug‘atlar hosil qilish va matnning chastotali lug‘atini yaratish hamda statistikalarini
olish   jarayonlari   nazarda   tutilgan.   Hisobotlarni   Excel   dasturiga   eksport   qilib,
faylga saqlab borish kerak.
Dasturiy ta’minotga quyidagi talablar qo‘yilgan:
I. Funksional talablar.
Dastur quyidagi funksiyalarni bajara olishi zarur:
 Boshlang‘ich qiymatlarni (matnni) kiritish;
 O‘rganilayotgan so‘zni matndan qidirish;
 Konkordans tuzish;
 So‘zning joylashuv o‘rnini aniqlash;
 N-grammalar hosil qilish;
 Chastotali lug‘at yaratish.
Natijalar:
 Hisobotlarni faylga kiritish;
 Statistik tahlillarni aniqlash.
II. Ishonchlilikka qo‘yiladigan talablar:
 Dasturda   kiritilgan   matnni   so‘zlarga   ajratib   olmasdan   so‘zlar
ro‘yxatini yaratib bo‘lmaydi.
32  Foydalanuvchining   dastur   bilan   ishlayotganda   foydalanuvchiga
ko‘rinmaydigan har bir harakat haqida ma’lumot beradi.
III. Axborot va dasturiy moslashuvga talablar.
Dastur   Windows   oilasiga   mansub   operatsion   tizimlarda   (Windows   95,
Windows 98, Windows 2000, Windows XP va h.k.) ishlaydi.
Dasturning   tuzilmasini   aniqlashni   qadamma-qadam   detallashtirib   borish
usuli   asosida   bajaramiz.   Qadamma-qadam   detallashtirish   –   dastur   yaratishning
“ quyiga   borish ”   yondashuvini   amalga   oshirib,   strukturali   dasturlashning   asosiy
kostruksiyalarini   ishlatishga   tayanadi.   Bu   usulda   algoritmni   ishlab   chiqish
qadamma-qadam   ketma-ketlikda   bajariladi.   Har   bir   qadamda   vazifalar   qismiy
vazifalarga   bo‘linadi.   Birinchi   qadamda   qo‘yilgan   masala   yechimi   tavsiflanib,
qismiy   masalalar   ajratilsa,   navbatdagi   qadamda   qismiy   masalalar   yechimi
tavsiflanib,   bir   darajaga   quyi   bo‘lgan   qismiy   masalalar   aniqlanadi.   Har   bir
qadamda   loyihalanayotgan   dasturiy   ta’minot   funksiyalari   aniqlashtirilib   boriladi.
Bu   jarayon   algoritmi   eng   sodda   qismiy   masalalar   hosil   bo‘lgunga   qadar   davom
ettiriladi.
Ush bu   magistrlik dissertatsiyasi   ish i   uchun qo‘yilgan masala o‘zbek tilining
elektron   lug‘atini   hosil   qilish ,   dasturiy   ma h sulot   yaratishdan   iborat.   Magistrlik
dissertatsiyasi da   elektron   lug‘at   yaratish   dasturi   masalasining   qo‘yilishi   quyidagi
shartlarga asoslangan:
 Matnni dasturga kiritish;
O‘rganilayotgan so‘zni matndan qidirish;
So‘z bo‘yicha konkordans tuzish;
So‘zning matndagi joylashuv o‘rnini ko‘rish;
So‘z bo‘yicha n-grammali lug‘atlar hosil qilish;
Matnning chastotali lug‘atini hosil qilish;
Har bir funksiyadagi statistik tahllillarni ko‘rish;
Hisobotlarni faylga saqlash.
33 Til  korpuslarida ham  interfeys asosiy ma’lumot beruvchi  qism  hisoblanadi.
Korpusdan turli toifadagi kishilar foydalanganligi sababli hamma uchun tushunarli,
mavzuga   mos   dizaynda   ishlangan,   zamonaviy   va   an’anaviy   bezaklar   orqali
milliylikni   aks   ettiruvchi   ko‘rinishda   bo‘lsa   yanada   yaxshi.   Albatta   bunda   loyiha
muallifidan katta mas’uliyat talab etiladi.
Mualliflik   korpuslari   interfeysi   haqida   gap   ketganda,   albatta,   u   muallif
asarlarining   janriy   tarkibi   haqida   ma’lumot   berishi   kerak.   Shu   bilan   birga
ijodkorning,   nashr   etilgan   asarlarining   suratlari   bilan   bezatilgan   bo‘lsa   maqsadga
muvofiq   bo‘ladi.   Korpus   intefeysida   uning   nimaga   mo‘ljallanganligini
ko‘rsatuvchi   annotatsiya,   qanday   materiallarni   qamrab   olganligi   ifodalovchi
bo‘limlar,   ma’lumotlar   qaysi   tillarda   berilishi   haqidagi   axborotlardan   tashkil
topadi.   Dastur   muallifi   o‘z   istagiga   ko‘ra   interfeysga   boshqa   ma’lumotlarni   ham
joylashtirishi   mumkin:   mundarija,   telefon   raqamlar,   elektron   pochta,   muloqot
o‘rnatish uchun chat va boshqalar.
Konkordans ga   “qidirilayotgan   birlikning   kontekstdagi   leksik   bog‘lanish
holatidagi   manbaga   ilova   qilingan   kontektlar   ro‘yxati” 48
  deb   izoh   berilgan.
Korkondans qidiruvi ga esa  korpus interfeysidagi  so‘z qidiruvi oynasi;  korpusda
mavjud   so‘zlar   chastotasini   ko‘rsatadi,   ularning   qo‘llanilish   kontekstiga   ishora
qiladi, 49
 deb ta’rif berilgan.
  Korpus   matnlariga   kirish   va   ularni   o‘rganish   “Konkordans”   rejimi   orqali
amalga   oshiriladi.   Ushbu   rejimda   tizimdan   asarlar   matnlarini   oddiy   o‘qish   uchun
ham   foydalanish   mumkin.   Buni   amalga   oshirish   uchun   “Asarlar”   ma’lumot   turi
tanlanadi va “Matn” yorlig‘iga o‘tiladi.
Matnlarni   o‘rganishda   konkordanslar   asosiy   vosita   bo‘lib   xizmat   qiladi.
“Konkordans” – bu maxsus turdagi lug‘at bo‘lib, unda lug‘atning har bir elementi
o‘zi   ishlatilgan   matnlar   bilan   bog‘lanadi.   “Konkordans”ning   tarkibiy   qismlari
lug‘at va matnlar bo‘lib, ular turli oynalarda joylashgan. Lug‘at va matn bir-biriga
bog‘langan.   Lug‘at   bo‘yicha   harakatlanganda   matnlar   to‘plami   o‘zgarib   boradi.
48
 Xamroyeva Sh.M. Korpus lingvistikasi atamalarining qisqacha izohli lug‘ati. Toshkent -2018. – 30-bet
49
 Xamroyeva Sh.M. Korpus lingvistikasi atamalarining qisqacha izohli lug‘ati. Toshkent -2018. – 30-bet
34 Matn   oynasining   har   bir   satri   tanlangan   birlikdan   foydalanishning   muayyan
holatini  ko‘rsatadigan   maxsus  matndir. Matn  uzunligini   xohlagancha  ko‘paytirish
va kamaytirish mumkin.
Konkordansda matndagi yoki korpusdagi so‘zni  va uni   o ‘rab turgan so‘zlar
bilan birga ro‘yxati keltirilgan. Biz korpus tilshunosligidagi kelishuvlar to‘g‘risida
gaplashganimizda,   odatda   “Kontekstdagi   kalit   so‘zlar”   (KWIC)   ning   oddiy
muvofiqligi   tushuniladi   va   misol.   (2.1-rasmda   keltirilgan).   Konkordensiyalar
asosan ma’lumotlarni vizuallashtirish usuli  hisoblanadi. Qidiruv atamasi  va uning
qo‘shma matni, matn muhitini baholash va qidiruv atamasi atrofidagi belgilarning
kelishuvlarini   (va   so‘z   ro‘yxatlarini)   matnning   o‘zgarishi   deb   ta’riflaydi   va
tahlilchiga matnga nisbatan turli xil qarashlarni ko‘rish imkoniyatini beradi.
2.1-rasm. Konkordans
Zamonaviy   korpus   tilshunosligida   konkordans   ma’lumotlaridan
foydalanishning   asosiy   motivi   -   bu   tilning   tuzilishi   va   ishlatilishi   to‘g‘risida
qiziqarli   ma’lumotni   haqiqiy   matnlardagi   so‘zlarni   ko‘rib   chiqish   va   leksika,
grammatika   va   ma’no   ularni   o‘rab   turganini   ko‘rish   orqali   olish   mumkinligiga
ishonishdir.   Konkordanslarni   o‘qish   foydalanuvchiga   korpusda   nima   sodir
bo‘lishini   tekshirishga,   matnlarda   qanday   ma’no   yaratilganligini,   so‘zlarning
qanday   paydo   bo‘lishini   va   mazmunli   belgilar   bilan   birlashtirilganligini,   bu
birliklarning   nima   ekanligi   to‘g‘risida   aniq   tasavvurga   ega   bo‘lmagan   holda
ko‘rish imkoniyatini beradi.
Biroq   qiziqarli   natijalar   korpus   dasturiy   ta’minotga   o‘rnatilishi   bilanoq
paydo   bo‘lmaydi.   Uyg‘unlikni   yaratish   uchun   foydalanuvchi   nimani   qidirishni
35 tanlashi   kerak  va   bu  korpusga   qaysi   so‘zlar   (yoki   boshqa   xususiyatlar)   ga  qarash
qiziqarli bo‘lishi  haqida ba’zi oldindan tasavvurlar bilan yaqinlashishni  anglatadi.
Ushbu   noto‘g‘ri   fikrlardan   qochishning   bir   usuli   –   ba’zi   dasturlar   matn   yoki
korpusning   to‘liq   muvofiqligini   ta’minlashi   kerak   bo‘lgan   funksiyadan
foydalanish.   Bu   matn   uchun   foydali   bo‘lishi   mumkin   va   bu   kompyuter   davriga
qadar   adabiy   yoki   diniy   asarlarni   o‘rganish   uchun   kelishuvlarni   yaratishning
an’anaviy usuli edi. Biroq korpusning to‘liq muvofiqligi, odatda, inson analitiklari
uddalay   oladigan   ma’lumotlardan   ko‘proq   ma’lumot   beradi.   Hatto   yirik
leksikografik   loyihalar   ham   qaysi   so‘zlarni   qidirish   va   katta   korpusda   qancha
misollarni   ko‘rib   chiqish   bilan   tanlangan   bo‘lishi   mumkin.   Quyida   tavsiflangan
boshqa   funksiyalar   mavjud,   masalan,   so‘zlashuvlar   ro‘yxati,   so‘z   birikmalari   va
kalit so‘zlarni yaratish, bu korpusga izlash va tadqiq qilish uchun narsalarni taklif
qilishga imkon beradigan boshlang‘ich nuqtalar sifatida ishlatilishi mumkin.
Korpusni   tahlil   qilish   vositalari   korpusni   matnli   fayllar   to‘plami   sifatida
qidiradi   yoki   korpuslar   oldindan   indekslangan   bo‘lishi   mumkin,   bu   esa   tezroq
qidirish   va   yanada   kuchli   so‘rovlarga   imkon   beradi.   Ba’zi   vositalar   korpuslarni
alohida formatlarda bo‘lishini  talab qiladi (masalan, oddiy matn, XML yoki ba’zi
bir   nostandart   format).   Belgilar   va   matnlarni   kodlashning   alohida   shakllari,   fayl
formati   va   ma’lumotlari   dastur   tomonidan   oqilona   talqin   qilinishini   ta’minlash
uchun   ehtiyot   bo‘lish   kerak.   Agar   korpusning   o‘zi   yetarlicha   standart   tarzda
qurilgan bo‘lsa va korpus dizayni va kodlanishi yaxshi hujjatlashtirilgan bo‘lsa, bu
yanada aniqroq bo‘ladi.
Konkordanslar   odatda   ekranda   namoyish   qilish   uchun   dastur   tomonidan
ishlab   chiqariladi,   ammo   ularni   qayta   ishlatish   uchun   yoki   boshqacha   tarzda
saqlash   muhim   bo‘lishi   mumkin.   Xuddi   shu   so‘rovni   bir   xil   korpusga   yuborish
orqali   ko‘pincha   osonlik   bilan   kelishuv   hosil   bo‘lishi   mumkin,   ammo   ba’zi
hollarda   bu   mumkin   emas.   Agar   qatorlarni   saralash,   toifalash   yoki   ingichkalash
kabi  bir  qator   qayta ishlash   bosqichlari  amalga  oshirilgan  bo‘lsa,  unda  natijalarni
ko‘paytirish   qiyin   bo‘lishi   mumkin.   Ushbu   qayta   ishlashning   bir   qismini   qo‘lda
36 tanlash yoki izohlash yo‘li bilan bajarish kerak bo‘lishi mumkin va keyin bu ishni
saqlash kerak. Konkordanslarni saqlab qolish uchun boshqa sabablar ham mavjud:
-asboblarga yoki korpusga kirish vaqtinchalik bo‘lishi mumkin;
-korpus rivojlanish bosqichida bo‘lishi va o‘zgarishi mumkin;
-vositalar   yangilanishi   va   ularning   funksiyalarini   nozik   usullar   bilan
o‘zgartirishi mumkin.
Bundan   tashqari,   konkordansni   keltirib   chiqaradigan   dasturdan   tashqarida
hamjihatlikni boshqa vositalar yordamida qayta ishlash yoki o‘qitishda veb-saytda
yoki nashrda foydalanish uchun foydalanish zarur bo‘lishi mumkin. Shuning uchun
konkordansni   ba’zi   bir   ko‘chma   formatda,   masalan,   HTML   da   saqlash   kerak
bo‘ladi.   Birlashtiruvchi   dasturni   tanlashda   (yoki   ishlab   chiqishda)   foydalanuvchi
ushbu funksiyalar mavjudligini yoki zarurligini ko‘rib chiqishi kerak.
Dasturda   konkordans   tuzishda   quyidagi   algoritmdan   foydalanildi:   bunda
matndan   ajratib   oladi   va   shu   so‘z   o‘rganilayotgan   so‘z   bilan   taqqoslanadi.   Agar
ikkalasi bir-biriga teng bo‘lsa, o‘rganilayotgan so‘zni chap tomondan 7 ta so‘zni va
o‘ng tomondan 7 ta so‘zni oladi hamda o‘rganilayotgan so‘zning o‘zini ko‘k rang
bilan   ajratib   konkordans   ro‘yxatiga   qo‘shadi.   Matndan   ajratilib   olingan   so‘z,
o‘rganilayotgan so‘zga teng bo‘lmasa matnning keyingi so‘zini tekshirishga o‘tadi.
Bu jarayon matnning oxiriga borgunga qadar davom etadi.
So‘zning   matn   bo‘ylab   joylashuvini   aniqlash   –   foydalanuvchi
o‘rganilayotgan   so‘zning   natijalari   ekranida   qidiruv   so‘zini   bosganda,   fayldan
ko‘rishdan   qidiruv   so‘zini   asl   faylda   ko‘rsatish   uchun   foydalaniladi.   Shu   bilan
birga,   Fayllarni   ko‘rish   vositasi   foydalanuvchiga   juda   kuchli   matnli   qidiruv
tizimini   taklif   qilib,   maqsadli   faylda   har   qanday   substringni,   so‘zni,   iborani   yoki
oddiy iborani izlash uchun mustaqil ravishda ishlatilishi mumkin.
37 2.2.-rasm. Fayldan ko‘rish funksiyasi
Natijada   paydo   bo‘lgan   barcha   xitlar   foydalanuvchi   tomonidan
belgilanadigan   ajratilgan   rangda   ko‘rsatiladi   va   tugmalar   va   klaviatura   yorliqlari
yordamida   faylning   istalgan   joyida   belgilangan   xitga   o‘tish   mumkin.   Agar
foydalanuvchi   ajratilgan   qidiruv   so‘zlaridan   birini   bosgan   bo‘lsa,   atamaga
asoslangan   barcha   o‘rganiayotgan   so‘z   satrlari   konkordans   vositasi   yordamida
avtomatik ravishda ko‘rsatiladi.
Dasturda   fayldan   ko‘rish   funksiyasi   bilan   ishlayotganda,   o‘rganilayotgan
so‘zni   topish   va   ajratib   ko‘rsatishda   quyidagi   algoritmdan   foydalaniladi:   bunda
matndan   ajratib   oladi   va   shu   so‘z   o‘rganilayotgan   so‘z   bilan   taqqoslanadi.   Agar
ikkalasi   bir-biriga   teng   bo‘lsa,   o‘rganilayotgan   so‘zning   o‘zini   ko‘k   rang   bilan
ajratib   konkordans   ro‘yxatiga   qo‘shadi.   Matndan   ajratilib   olingan   so‘z,
o‘rganilayotgan so‘zga teng bo‘lmasa matnning keyingi so‘zini tekshirishga o‘tadi.
Bu jarayon matnning oxiriga borgunga qadar davom etadi.
N-grammli lug‘at hosil qilish  - Statistik til modellari, o‘z mohiyatiga ko‘ra,
so‘zlarning ketma-ketligiga ehtimolliklarni belgilaydigan modellarning turi. Ushbu
bo‘limda   n-gramm   jumlalar   va   so‘zlar   ketma-ketligiga   ehtimolliklarni
belgilaydigan eng oddiy model ko‘rsatilgan.
N   grammni   N   so‘zlarning   ketma-ketligi   deb   o‘ylash   mumkin,   bu
tushunchaga   ko‘ra,   2   gramm   (yoki   bigram)   -   bu   “Kitobni   o‘qing”,   “Daftarga
yozing” yoki “Kompyuteringizga qarang” kabi ikki so‘zli so‘zlar ketma-ketligi, va
3   gramm   (yoki   trigram)   –   bu   “iltimos,   kitobni   o‘qing”   yoki   “iltimos,   daftarga
yozing”   kabi   uch   so‘zli   so‘zlar   ketma-ketligi.   N   gramm   bo‘lishi   uchun   n   ta   so‘z
ketma-ketligi olinishi lozim.
38 Tadqiqot  shuni  ko‘rsatdiki, so‘z birikmalari va boshqa ko‘p so‘zli  birliklar,
masalan,   frazemali   fe’llar   va   iboralar   o‘quvchilarga   ayniqsa   qiyin   bo‘ladi.   Agar
o‘quvchi   yuqori   texnik   yoki   ilmiy   sohadagi   matnlar   bilan   ishlayotgan   bo‘lsa,
ularning ahamiyati yanada kattaroq bo‘ladi, chunki leksik birlik bir so‘zdan ko‘ra
ancha   uzunroq.   Ajablanarlisi   shundaki,   lingvistik   dasturlarining   aksariyatida
kollokatsiyalarga   va   shunga   o‘xshash   narsalarga   unchalik   ahamiyat   berilmagan,
ehtimol   ularni   o‘quvchi   uchun   tizimli   ravishda   aniqlash   va   buyurtma   qilish
qiyinligi sababli bo‘lishi mumkin.
Dasturda,   ko‘p   so‘zli   birliklarni   n-grammali   funksiya   yordamida   tekshirish
mumkin   (2.3-rasm).   Ushbu   vosita   qidiruv   so‘ziga   asoslangan   so‘zlarning
klasterlarini   namoyish   etadi   va   ularni   alfavit   bo‘yicha   yoki   chastota   bo‘yicha
buyurtma   qiladi.   Qidiruv   atamalari   so‘z,   ibora   yoki   oddiy   ibora   sifatida
ko‘rsatilishi mumkin va qidiruv so‘zining o‘ng tomonidagi qo‘shimcha so‘zlar soni
ham   ko‘rsatilishi   mumkin.   Yaratilgan   n-grammlar   uchun   minimal   va   maksimal
chastota chegarasini belgilash ham mumkin.
Ko‘p   so‘zli   ketma-ketlikni   izlashning   muqobil   usuli   bu   n-grammga   teng
bo‘lgan leksik to‘plamlarni topishdir, bu yerda n odatda ikki va beshta so‘z orasida
o‘zgarib turadi. Ushbu funksiyani korpusni tahlil qilish uchun ozgina dastur taklif
qiladi,   ammo   Uzbekconc   so‘zlar   to‘plamiga   qo‘shimcha   sifatida   leksik   to‘plamni
qidirishni   o‘z   ichiga   oladi.   Albatta,   ma’lum   bir   mezon   uchun   barcha   leksik
to‘plamlarni hisoblash juda ko‘p vaqt talab qilishi mumkin.
2.3-rasm. N-grammlar tuzish
39 Dasturda   N-grammli   ro‘yxat   yaratish   funksiyasi   bilan   ishlayotganda,
o‘rganilayotgan   so‘zni   topish   va   ajratib   ko‘rsatishda   quyidagi   algoritmdan
foydalaniladi: bunda matndan ajratib oladi va shu so‘z o‘rganilayotgan so‘z bilan
taqqoslanadi.   Agar   ikkalasi   bir-biriga   teng   bo‘lsa,   o‘rganilayotgan   so‘zni   chap
tomondan n-grammaning minimum va maksimum qiymatining oralig‘ida kontekst
tuzadi   va   so‘zning   o‘zini   ko‘k   rang   bilan   ajratib   ro‘yxatiga   qo‘shadi.   Matndan
ajratilib   olingan   so‘z,   o‘rganilayotgan   so‘zga   teng   bo‘lmasa   matnning   keyingi
so‘zini   tekshirishga   o‘tadi.   Bu   jarayon   matnning   oxiriga   borgunga   qadar   davom
etadi.
Chastotali   lug‘atni   hosil   qilish   –   Chastotali   lug‘at   –   interfeysdagi
korpusdagi  so‘zlarning chastotasiga  ishora qiluvchi  oyna 50
  hisoblanadi. Chastotali
lug atʻ   so zlarning  (so z  shakllari,   so z   birikmalarining)   nutqda   qo llanish   miqdori	ʻ ʻ ʻ ʻ
haqida   ma lumot   beruvchi   lug at.   Chastotali   lug at   tilda   u   yoki   bu   grammatik	
ʼ ʻ ʻ
konstruksiya qaysi chastota bilan qo llanganligini hisoblash imkonini beradi.	
ʻ
Chastotali   lug‘at   (yoki   so‘z   chastotasi   kitobi)   -   bu   har   bir   lemmani   har   xil
turdagi statistik ma’lumotlar bilan ta’minlaydigan so‘zlar ro‘yxati. Odatda kamida
ikkita yozuvlar ro‘yxati mavjud:
-har   bir   yozuv   bo‘yicha   statistik   ma’lumotlarni   taqdim   etadigan   alfavit
ro‘yxati.
-ma’lumotlar   statistik   qiymatga   ko‘ra   buyurtma   qilingan   chastota   ro‘yxati,
odatda ularning korpusdagi chastotasi.
Metodik   jihatdan   so‘zlarning   chastotali   kitobi   boshqa   barcha   turdagi
lug‘atlardan   farq   qiladi,   chunki   u   majburiy   va   faqat   korpusga   asoslangan.
Lemmatizatsiyadan tashqari, uning ko‘pgina funksiyalari avtomatik.
Ilgari   lug‘at   kompilyatsiyasini   avtomatlashtirish   istagi   tufayli   chastotali
lug‘atlarda   birlashtirilgan   shakllarning   alohida   ko‘rinishi   shubhasiz   edi.   Hozirgi
kunda   leksemalashtirishning   turli   xil   shakllarini   birma-bir   kiritilgan   holda,
individual   va   bir   martalik   chastotalar   bilan   birlashtiradigan   juda   kuchli
lemmatizatsiya dasturlari mavjud.
50
 Xamroyeva Sh.M. Korpus lingvistikasi atamalarining qisqacha izohli lug‘ati. Toshkent -2018. – 78-bet
40 2. 4 -rasm.  Chastotali lug‘at tuzish oynasi
Boshqa   turdagi   lug‘atlarni   ishlab   chiqishda   chastotali   lug‘atlar   ma’lum   rol
o‘ynaydi:   Lemma   tanlovi   qisman   chastotadan   kelib   chiqadi   va   so‘zlardan
foydalanish   tavsifi,   masalan.   sezgi,   kollokatsiya,   konstruktsiyalar,   shuningdek,
asosan,   tez-tez   ishlatilishi   bilan   cheklangan.   Va   nihoyat,   lingvistik   element
ehtimoli   uning   ma’nosi   bilan   qiziqarli   aloqada   bo‘lgan   axborot   qiymatini
hisoblashning asosidir.
Chastotali   lug‘at  yaratish   uchun  mavjud  lug‘atdan  eng   katta  chastotali  so‘z
topiladi va shu chastotali so‘zlar jadvalni ng  birinchi satriga yoziladi. Undan kichik
chastota   topilib   u   ham   jadvalga   qo‘shib   boriladi.   Toki   chastota   birga   teng
bo‘lguncha tartiblash amalga oshiriladi. Shu tariqa chastotali lug‘at yaratiladi.
“ Mualliflik korpusi ”  bo‘yicha olingan tahlillarni faylga saqlash
Konkordansni saqlash:  Faylga ko‘chirish tugmasi bosilganda, Excel faylga
ma’lumotlarni   eksport   qilishdan   oldin   faylning   nomi   va   manzili   ko‘rsatiladi.
So‘ngra dasturdagi ma’lumotlar Excel faylga eksport qilinadi. Faylning ko‘rinishi
2.5.-rasmda   ko‘rsatilgan.   Fayl   tarkibida   matn   nomi,   o‘rganilayotgan   so‘z   nomi,
o‘rganilayotgan so‘zni miqdori va konkordans aks ettirilgan.
41 2.5.-rasm. Konkordansning  Excelga eksport qilinganlik holati
N-grammalarni   saqlash:   Faylga   ko‘chirish   tugmasi   bosilganda,   excel
faylga   ma’lumotlarni   eksport   qilishdan   oldin,   faylning   nomi   va   manzili
ko‘rsatiladi.   So‘ngra   dasturdagi   ma’lumotlar   Excel   faylga   eksport   qilinadi.
Faylning   ko‘rinishi   2.6-rasmda   ko‘rsatilgan.   Fayl   tarkibida   matn   nomi,
o‘rganilayotgan   so‘z   nomi,   o‘rganilayotgan   so‘zning   miqdori   va   grammaning
minimum va maksimum qiymatlari hamda gramma ro‘yxati aks ettirilgan.
2.6.-rasm. N-grammlarning Excelga eksport qilinganlik holati
Chastotali   lug‘atni   saqlash:   Faylga   ko‘chirish   tugmasi   bosilganda,   Excel
faylga   ma’lumotlarni   eksport   qilishdan   oldin,   faylning   nomi   va   manzili
42 ko‘rsatiladi.   So‘ngra   dasturdagi   ma’lumotlar   Excel   faylga   eksport   qilinadi.
Faylning ko‘rinishi  2.6-rasmda  ko‘rsatilgan.  Fayl  tarkibida matn nomi, so‘zlar  va
ularning  matnda  ishtirok  etish  miqdori   (chastotasi)   ko‘rsatilgan  holda ro‘yxat  aks
ettirilgan.
2.7-rasm. Chastotali lug‘atning Excelga eksport qilinganlik holati
2.2. Dasturiy majmuadan foydalanish tartibi va ish natijalari
“Mualliflik korpusi” dasturining  interfeysi  quyidagi oynalardan iborat:
1. Fayl nomi
2. Konkordans
3. Fayldan ko‘rish 
4. Klasterlar/N-grammlar
5. So‘zlar ro‘yxati
6. Umumiy fayllar soni
7. Qidirilayotgan so‘z
8. Faylga ko‘chirish
9. Start
2.8-rasm. “Mualliflik korpusi” dasturining interfeysi
43 Fayl   nomi   ishchi   dasturiga   lingvistik   tadqiqot   bajariladigan   matn   kiritiladi.
Masalan,   Qur’oni   karimning   Oltinxon   To‘ra   tomonidan   tarjima   qilingan   “Al-
Qur’on Al-Karim” (tarjima va sharhlar)asari matni.
Konkordans   –   bu   matndagi   yoki   korpusdagi   so‘zni   va   uni   o ‘rab   turgan
so‘zlar   bilan   birga   ro‘yxati   keltirilgan.   Odamlar   korpus   tilshunosligidagi
kelishuvlar to‘g‘risida gaplashganda, odatda “Kontekstdagi  kalit so‘zlar” (KWIC)
ning   oddiy   muvofiqligi   tushuniladi.   Konkordensiyalar   asosan   ma’lumotlarni
vizuallashtirish usuli  hisoblanadi. Qidiruv atamasi  va uning qo‘shma matni, matn
muhitini baholash va qidiruv atamasi atrofidagi belgilarning kelishuvlarini (va so‘z
ro‘yxatlarini)   matnning   o‘zgarishi   deb   ta’riflaydi   va   tahlilchiga   matnga   nisbatan
turli   xil   qarashlarni   ko‘rish   imkoniyatini   beradi.   Misol   uchun,   Qur’oni   karimning
Oltinxon   To‘ra   tomonidan   tarjima   qilingan   “Al-Qur’on   Al-karim”   (tarjima   va
sharhlar) matnidagi “ko‘z” leksemasini qidirilayotgan so‘z degan joyiga kiritilsa va
Start   tugmasi   bosilsa,   asarda   ko‘z   leksemasining   konkordans   kombinatsiyasi   soni
kontekstlar   bilan   ishchi   dasturda   ko‘rinadi.   Dasturning   ish   natijasiga   ko‘ra   ko‘z
leksemasi bilan bog‘liq 224 ta kombi natsiya ishchi oynasida ko‘rinadi.
2.9-rasm. Konkordans ishchi oynasining ko‘rinishi
Ishchi   oynada   ko‘ringan   natijalar   faylga   ko‘chirish   tugmasi   bosilganda
Excelga ko‘chiriladi.
44 2.10-Konkordansning Excelga ko‘chirilgan ko‘rinishi
Fayldan   ko‘rish   oynasida   qidirilayotgan   so‘zga   ko‘z   leksemasi   kiritilsa,
butun   matndan   shu   so‘z   ajratib   olinadi   va   shu   so‘z   o‘rganilayotgan   so‘z   bilan
taqqoslanadi,   so‘zning   o‘zini   ko‘k   rang   bilan   ajratib   konkordans   ro‘yxatiga
qo‘shadi.   Misol   uchun,   Qur’oni   karimning   Oltinxon   To‘ra   tomonidan   tarjima
qilingan “Al-Qur’on Al-Karim” (tarjima va sharhlar) matnidagi “ko‘z” leksemasini
qidirilayotgan   so‘z   degan   joyiga   kiritilsa   va   Start   tugmasi   bosilsa,   asarda   ko‘z
leksemasi butun matn ichida ajratib ko‘rsatiladi.
2.11-rasm. Fayldan ko‘rish ishchi dasturining tasviri.
Klasterlar/N-grammlar   oynasida   o‘rganilayotgan   so‘zni   chap   tomondan   n-
grammning   minimum   va   maksimum   qiymatining   oralig‘ida   kontekst   tuzadi   va
so‘zning o‘zini ko‘k rang bilan ajratib ro‘yxatiga qo‘shadi. Masalan, qidirilayotgan
so‘z qismiga  ko‘z  so‘zi kiritiladi, min qismiga 2 soni, max qismiga 4 soni kiritilsa,
matn   ichida   ko‘z   leksemasining,   ikkita,   uchta,   to‘rttagacha   bo‘lgan   leksemalar
bilan birgalikda birikish holati  ko‘rsatiladi.   Masalan,  Qur’oni  karimning Oltinxon
45 To‘ra   tomonidan   tarjima   qilingan   “Al-Qur’on   Al-Karim”   (tarjima   va   sharhlar)
matnidagi   “ko‘z”   leksemasini   qidirilayotgan   so‘z   degan   joyiga   kiritilsa   va   Start
tugmasi bosilsa,  matnda  ko‘z  leksemasining  eng kichik 2 ta va eng katta 4 tagacha
bo‘lgan leksemalar bilan yonma-yon kelish holatini ko‘rsatib beradi.
2.12-rasm. Klasterlar/N-grammlar ishchi dasturining ko‘ rinishi
Ishchi   oynada   ko‘ringan   natijalar   faylga   ko‘chirish   tugmasi   bosilganda
Excelga ko‘chiriladi.
2.13-Klasterlar/ N-grammlarning Excelga ko‘chirilgan ko‘rinishi
So‘zlar ro‘yxati oynasida chastotali lug atʻ   - so zlarning (so z shakllari, so z	ʻ ʻ ʻ
birikmalarining)   nutqda   qo llanish   miqdori   haqida   ma lumot   beruvchi   lug at	
ʻ ʼ ʻ
yaratiladi.   O‘rganilayotgan   matnning   lemmalar   miqdori   haqida   ma’lumot   beradi.
Masalan,   Qur’oni   karimning   Oltinxon   To‘ra   tomonidan   tarjima   qilingan   “Al   -
Qur’on   Al-Karim”   (tarjima   va   sharhlar)   matnining   chastotali   lug‘atini   yaratish
mumkin bo‘ladi.
46 2.14-rasm.  So‘zlar ro‘yxati   ishchi oynasining ko‘rinishi
Ishchi   oynada   ko‘ringan   natijalar   faylga   ko‘chirish   tugmasi   bosilganda
Excelga ko‘chiriladi.
2.15 -rasm.   So‘zlar ro‘yxatining Excelga ko‘chirilgan ko‘rinishi
47 Bob bo‘yicha xulosalar
1.   “ Mualliflik   korpusi ”   dasturi ning   tarkibiy   qismi   –   interfeysdir.   Interfeys
foydalanuvchi   uchun   tushunarlilik   va   ishlashni   qulaylashtiruvchi   omildir.
“Mualliflik korpusi” dasturining interfeysi:
a) konkordans
b) fayldan ko‘rish
c) Klasterlar/N-grammlar
d) so‘zlar ro‘yxati  dan iborat.
2.   Konkordans   ishchi   oynasida   o‘rganilayotgan   leksema   tanlangan   asarda
nechta bo‘lsa, miqdori va konteksti ko‘rsatiladi.
3. Fayldan ko‘rish ishchi oynasida o‘rganilayotgan leksema tanlangan asarda
ko‘k rangda ajratib ko‘rsatiladi.
4.   Klasterlar/N-grammlar   ishchi   oynasida   o‘rganilayotgan   leksema   bilan
minimum va maxsimum kiritilgan leksema ketma-ketligi namoyon bo‘ladi.
5.   So‘zlar   ro‘yxati   ishchi   oynasida   tadqiq   etilayotgan   matndagi   so‘zlarning
chastotasi aniqlanadi.
6.   O‘zbek   tili   milliy   korpusini   yaratish   bugungi   kun   tilshunosligining   eng
muhim vazifalaridan biri hisoblanadi. “Mualliflik korpusi” dasturi har qanday matn
ustida lingvistik tadqiqot o‘tkazish uchun mo‘ljallangan.
7.   Oltinxon   To‘raning   “Al-Qur’on   Al-Karim”   asari   1947   Kb   hajmli   *.txt
formatdagi   fayl   bo‘lib,   unda   “ko‘z”   so‘zi   o‘rganilganda   224ta   ro‘yxatdan   iborat
konkordans tuzildi. 
8.   “Ko‘z”   so‘z   bo‘yicha   uni   grammasining   minimum   qiymati   2   va
maksimum   qiymati   4   bo‘lgan   n-gramm   672   ta   kontekstdan   iborat   ro‘yxat   hosil
bo‘ldi.
9.   Chastotali   lu‘gat   hosil   qilinganda,   37   000   dan   ortiqroq   so‘zshakllar
aniqlanib,   asarda   eng   ko‘p   “va”   leksemasi     ishlatilgan   va   12   451   marta
foydalanilgan.
48 III.BOB. “MUALLIFLIK KORPUSI” DASTURIDA  “ AL-QUR’ON
AL- KARIM” (OLTINXON TO‘RA TAFSIRI ASOSIDA)NING
LINGVISTIK TA’MINOTI
3.1.“Al-Qur’on Al-Karim” (Oltinxon To‘ra tarjima va tafsiri) ning tili va
lug‘ati
Diniy   adabiyotlardan   ma’lumki,   Qur’oni   karim   Alloh   tomonidan
Payg‘ambarimiz   Muhammad   alayhissalomga   sura   va   oyatlar   shaklida   23   yil
davomida elchi farishta – Jabroil alayhissalom vositasida ilohiy vahiy sifatida nozil
qilingan.   Qur’oni   karim   og‘zaki     shaklda,   arab   tilida   nozil   bo‘lgan.   U   Islom
dinining asosiy muqaddas kitobi, ibodat manbayi, diniy, huquqiy, falsafiy, tarixiy,
adabiy   yodgorlik   hisoblanib,   hamma   musulmonlar   uchun   yagona   qonun,   dastur
vazifasini o‘tab kelmoqda.
Qur’oni karimning ko‘p suralari saj bilan yozilgan, uning tiliga nafaqat arab
bo‘lmagan   xalqlar,   balki   arablarning     o‘zlari   ham   tushunishlari   mushkul   bo‘lgan.
Shu   sababdan   Sharqning   aksariyat   olimlari   Qur’onga   ko‘plab   tafsir   (sharhlar)
yozishgan   va   shu   asosda   “Ilmi   tafsir”   rivojlangan.   Bu   sohada   yuzaga   kelgan
kitoblarda Qur’onning paydo bo‘lishi, oyatlarning tushish sabablari, undagi tarixiy
voqea-hodisalarni,   uning   ilohiy   xususiyatlarini,   mo‘jizalarini   tushuntirib,   so‘z   va
tushunchalarga   izohlar   berilgan.   Tafsir   haqidagi   fanga   janobi   rasulullohning
amakivachchalari   Abdulloh  ibn   Abbos   asos   solgan.   Tafsir   ilmi   asosan   VIII   asrda
va   undan   keyin   taraqqiy   etdi.   Xalq   orasida   Kalomullo   deb   nom   olgan   Islom
dinining   eng   muqaddas   kitobi   Qur’oni   karimni   o‘rganish,   uning   ma’nolarini
anglashga bo‘lgan ishtiyoq ham oshib borgan. Ba’zi ilmiy adabiyotlarda, Qur’oni
karim   XVII-XVIII   asrlarda   o‘zbek   tiliga   tarjima   va   tafsir   qilinganligi,   yagona
nusxasi Qarshi shahridan topilganligi, muallifi noma’lumligi, qo‘lyozmaning boshi
yo‘qolganligi, tarjima va tafsir “Qahf” surasidan boshlanib, Qur’onning oxirigacha
davom   etganligi   bayon   etilgan. 51
  Qur’oni   karimning   mukammal   va   to‘liq   turkiy
(eski   o‘zbek   tilidagi)   tarjimasi   1956-yili   Saudiya   Arabistonidagi   vatandoshimiz
Sayyid   Mahmud   ibn   Sayyid   Nazir   Taroziy   (Oltinxon   To‘ra)   tomonidan   amalga
51
 Ал-Қуръон ал-Карим. Таржималар ва шарҳлар. – Тошкент: Фан, 2002, 5-bet
49 oshirilib, dunyo musulmon olamida keng tarqaldi. Oltinxon To‘ra Markaziy Osiyo
musulmonlari orasida ilk bor Qur’oni karim ma’nolarini o‘zbek tiliga o‘girgan va
qisqa   izohi   bilan   eski   o‘zbek   tilida   chop   ettirgan.   Hoji   Ismatulloh   Abdullohning
yozishicha,   Sayyid     Mahmud   ibn   Sayyid   Nazir   –   Oltinxon   To‘ra   vatandosh
turkistonliklar iltimosiga ko‘ra o‘zbek tiliga Qur’oni karimni ilk bor keng tafsir va
sharhi   bilan   tarjima   qilib,   1975-yilda   Pokistonda   chop   ettirgan.   Tarjima   va   tafsir
xorijda   yashovchi   hamma   turkistonliklarga   mo‘ljallanganligi   uchun   mutarjim   uni
“turkistonliklar tilig‘a tarjima” deb ataydi. Qur’on oyatlarining har bir satri tagiga
Qur’ondagi   jumla   tuzilishi   qandoq   bo‘lsa,   shu   tartibda   yozilgan,   ya’ni   gap
bo‘laklari   hozirgi   o‘zbek   tilimizda   qabul   qilingan   ega,   kesim,   gapning   ikkinchi
darajali bo‘laklari  o‘rni almashinib ketgan. 52
Quyida Makkada nozil bo‘lgan, 4 oyatdan iborat, mo‘minlarga Alloh taoloni
tanishni   va   U   Zotga   qanday   ixlos-e’tiqod   qilishni   o‘rgatadigan   “Ixlos”   -   “xolis
qilish”,   “(imonni)   poklash”   surasining   Oltinxon   To‘ra   tafsir   va   tarjima   matnini
keltiramiz:
Ixlos (Qul huvallohu) surasi
Makkada nozil bo‘lg‘ondur va ul 4 oyatdur
Ibtido qilinur behad mehribon,
nihoyatda rahmlik Alloh nomi ila
1. Ayt, (ey, habib:) “Ul Alloh birdur,
2. Alloh beniyozdur (hamma Undan madad so‘rar),
3. U tug‘madi, (tug‘dirmadi) va tug‘ilmadi
4. va emas Ang‘a barobar hech kim”. 53
Shayx  Abdulaziz  Mansurda  “Ixlos”  surasining  ma’nolar  tarjimasi  va   tafsiri
quyidagicha:
Ixlos surasi
Makkada nozil qilingan. 4 oyat.
Mehribon va Rahmli Alloh nomi bilan (boshlayman).
52
  Ал-Қуръон ал-Карим. Таржималар ва шарҳлар. – Тошкент: Фан, 2002. 7-8-bet
53
 Ал-Қуръон ал-Карим. Таржималар ва шарҳлар. Тошкент: Фан, 2002, 653-bet
50 1. (Ey Muhammad!) Ayting: “U Alloh yagonadir.
2. Alloh Samad (ehtiyojsiz, hojatbaror)dir.
3. U tug‘magan va tug‘ilmagan ham.
4. Shuningdek, Uning hech bir tengi yo‘qdir”. 54
“Ixlos”   surasining   ikki   olim   tomonidan   tarjimasini   qiyoslab   o‘rganish
davomida   gap   bo‘laklarining   tartibidagi   va   til   xususiyatidagi   farqlarni   ko‘rish
mumkin.   Masalan,   -dir   kesimni   egaga   moslashtiruvchi   bog‘lama   Oltinxon   To‘ra
tilida   -dur   shaklida,   Shayx   Abdulaziz   Mansurda   -dir   shaklida   qo‘llangan.   U   III
shaxs   birlikka   ishora   qiluvchi   kishilik   olmoshi   Oltinxon   To‘rada   Ul   tarzida   va
Ang‘a   shaklida   ham   ishlatilgan.   Yuqoridagi   ikki   tafsir   namunasini   korpus
lingvistikasini   shakllantirish   uchun   yaratilayotgan   dasturlarga   joylab,   morfologik
razmetkasini quyidagicha teglash mumkin:
54
  Қуръони   карим   маъноларининг   таржима   ва   тафсири.Тошкент.   Ўзбекистон   Республикаси   Президенти
Администрацияси ҳузуридаги Ахборот ва оммавий коммуникациялар агентлиги “O‘zbekiston” НМИУ ДУК,
2021. 604-b
51 3.1-jadval
“Ixlos”   surasining   morfologik   razmetkasi   (Oltinxon   To‘raning   tarjima   va
tafsiri)
Leksema So‘z
turkumi O‘zak Lemma
ayt (1) fe’l ayt aytmoq
ey (1) undov so‘z ey ey
habib (1) ot habib habib
ul (1) olmosh ul ul
alloh (2) ot Alloh Alloh
birdur (1) son bir bir
beniyozdur (1) sifat beniyoz beniyoz
hamma (1) olmosh hamma hamma
undan (1) olmosh u u
madad (1) ot madad madad
so‘rar (1) fe’l so‘ra so‘ramoq
u (1) olmosh u u
tug‘madi (1) fe’l tug‘ tug‘moq
tug‘dirmadi (1) fe’l tug‘ tug‘moq
va (2) bog‘lovchi va va
tug‘ilmadi (1) fe’l tug‘ tug‘moq
emas (1) fe’l emas emas
ang‘a (1) olmosh u u
barobar (1) sifat barobar barobar
hech (1) olmosh hech hech
kim (1) olmosh kim kim
Suraning   ma’nolar   tarjimasida   jami   23   ta   so‘zshakl   borligini   ko‘rsatdi.
Shundan   “Alloh”   hamda   “va”   so‘zlari   ikki   marta,   qolgan   so‘z   shakllar   esa   bir
martadan qo‘llangan.
52 3.2-jadval
“Ixlos” surasining morfologik  razmetkasi
(Shayx Abdulaziz Mansur tarjima va tafsiri)
Leksema So‘z
turkumi O‘zak Lemma
ey (1) Undov  ey ey
Muhammad (1) ot Muhammad Muhammad
ayting (1) fe’l ayt aytmoq
u (2)  olmosh u u
alloh(2) ot Alloh Alloh
yagonadir (1) sifat yagona yagona
samad  (1) ot Samad Samad
ehtijojsiz (1) sifat ehtiyojsiz ehtiyojsiz
hojatbarordir (1) sifat hojatbaror hojatbaror
tug‘magan (1) fe’l tug‘ tug‘moq
va(1) bog‘lovchi va va
tug‘ilmagan  (1) fe’l tug‘ tug‘moq
ham (1) yuklama ham ham
shuningdek (1) modal shuningdek shuningdek
uning  (1) olmosh u u
hech (1) olmosh hech hech
bir (1) son bir bir
tengi (1) sifat teng teng
yo‘qdir (1) modal yo‘q yo‘q
Shayx   Abdulaziz   Mansur   ma’nolar   tarjimasida   sura   21   ta   so‘z   shakldan
iborat.   Shundan  “Alloh”   hamda   “U”   so‘zlari   ikki   marta,   qolgan  so‘z   shakllar   esa
bir martadan qo‘llangan.
Leksikografiya   tilshunoslikning   bir   bo‘limi   hisoblanib,   lug‘atchilikka
yo‘naltirilgan. Lug‘at tuzish tamoyillari, asoslari  bundan ancha yillar avval ishlab
chiqilgan.   Adabiyotlardan   Mahmud   Qoshg‘ariyning   “Devonu   lug‘otut-turk”
asarini   lug‘atshunoslikka   asoslangan   ilk   asar   sifatida   bilamiz.   O‘tgan   davr
mobaynida   bir   qancha   lug‘at   turlari   yaratildi:   imlo   lug‘ati,   izohli   lug‘at,   tarjima
lug‘at va hokazo. Lug‘atlar ichida chastotali lug‘at turi ham mavjud bo‘lib, u bizga
ilmiy tadqiqotlarda statistik ma’lumotlarni olishda qo‘l keladi.
53 Chastotali lug‘at (yoki so‘z chastotasi kitobi) har bir lemmani har xil turdagi
statistik   ma’lumotlar   bilan   ta’minlaydigan   so‘zlar   ro‘yxati   to‘plamidir.   U   odatda
kamida ikkita ro‘yxatni o‘z ichiga oladi:
-   har   bir   yozuv   bo‘yicha   statistik   ma’lumotlarni   taqdim   etadigan   alifbo
tartibidagi ro‘yxat;
-  chastotalar ro‘yxati – unda elementlar statistik qiymatga ko‘ra tartiblanadi,
odatda, ularning korpusdagi chastotasi.
Uslubiy jihatdan so‘z chastotasi kitobi boshqa turdagi lug‘atlardan majburiy
va   faqat   korpusga   asoslanganligi   bilan   farq   qiladi.   Yana   bir   farqi   lemmalarning
tabiatidir.   Matn   belgilarini   lug‘at   lemmasi   bilan   bog‘lash   jarayoni   turli   xil
abstraksiya bosqichlaridan iborat. Ularning eng quyi turlaridan biri so‘zshakl (yoki
flektiv   shakl)dir.   Chastotali   lug‘atlar   boshqa   turdagi   lug‘atlarni   ishlab   chiqishda
ahamiyatlidir.
“Mualliflik   korpusi”   dasturiga   “Al-Qur’on   Al-Karim”   asari   kiritiladi.
Dasturdagi   So‘zlar     ro‘yxati   oynasi ga   o‘tilib,   Start   tugmasi   bosiladi.   Dastur
chastotali   lug atʻ   -   so zlarning   (so z   shakllari,   so z   birikmalarining)   nutqda	ʻ ʻ ʻ
qo llanish   miqdori   haqida   ma lumot   beruvchi   lug at   yaratadi.   O‘rganilayotgan	
ʻ ʼ ʻ
matnning lemmalar miqdori haqida ma’lumot beradi.
3.1-rasm.  So‘zlar ro‘yxati   ishchi oynasining ko‘rinishi
So‘zlar   ro‘yxati   oynasida   so‘zlar   turi   37507   ekanligi   ma’lum   bo‘ldi.   Unda
so‘z  turining  darajasi,   soni  ko‘rinadi.  Eng  ko‘p  miqdordan  eng  past   miqdorgacha
so‘zshakllar   aniqlanadi.   Ishchi   oynada   ko‘ringan   natijalarni   saqlash   uchun   faylga
ko‘chirish tugmasi bosiladi. Dasturda aniqlangan ma’lumotlarni Excelga ko‘chirib,
saqlab qo‘yish mumkin.
54 3.2-So‘zlar ro‘yxatining Excelga ko‘chirilgan ko‘rinishi
Tadqiqot   ishida   eng   ko‘p   qo‘llangan   10   ta   so‘z   turining   izohini   berishni
ma’qul ko‘rdik.
1. va  12451 marta
2. bir  3408 marta
3. ul  3027 marta
4. va  2462 marta
5. uchun  2192 marta
6. ila  2071 marta
7. alar  2020 marta
8. Alloh  1999 marta
9. bu  1923 marta
10. ham  1881 marta
Aniqlangan so‘zshakllar  haqida to‘liqroq ma’lumot  olish uchun “Mualliflik
korpusi”   dasturida   “Klasterlar/N-grammlar”   oynasiga   o‘tib,   yuqorida   keltirilgan
so‘zshakllar   qaysi   so‘zshakllar   bilan   birgalikda   qo‘llanganligini   aniqlaymiz.
Namuna sifatida min qismiga 2, max qismiga 3 sonini kiritib, N-grammlarni hosil
qilamiz.
55 3.3-rasm.  va  so‘z shakli bilan aniqlangan N-grammlar
3.4-rasm.  bir  so‘z shakli bilan aniqlangan N-grammlar
3.5-rasm.  ul  so‘zshakli bilan aniqlangan N-grammlar
3.6-rasm.  va  so‘zshakli bilan aniqlangan N-grammlar
56 3.7-rasm.  uchun  so‘z shakli bilan aniqlangan N-grammlar
3.8-rasm.  alar  so‘z shakli bilan aniqlangan N-grammlar
3.9-rasm.  Alloh  so‘z shakli bilan aniqlangan N-grammlar
3.10-rasm.  bu  so‘z shakli bilan aniqlangan N-grammlar
57 3.11-rasm.  ham  so‘z shakli bilan aniqlangan N-grammlar
So‘zlar   ro‘yxati   oynasi   bilan   Klasterlar/N-grammlar   oynasi   natijalariga
qarab quyidagicha xulosa qilish mumkin:
a)   So‘zlar   ro‘yxatida   asarning   kirish   qismidan   to   mundarijasigacha
raqamlardan tortib belgilargacha bo‘lgan har qanday shaklning chastotasini beradi;
b) so‘zshakllar eng ko‘p ishlatilgan shakldan eng kam ishlatilgan shaklgacha
yuqoridan quyiga tomon joylashtiriladi;
d) so‘z turlari  sonini tezda avtomatik hisoblab chiqadi;
Tilshunos   olim,   professor   S.Karimov   Abdulla   Qahhor   asarlari   lug‘atini
kompyuter   yordamida   yaratish   bo‘yicha   ilmiy   ishida   yutuq   va   kamchiliklarni
ko‘rsatib   o‘tadi.   “Lug‘at   shaklida   amalga   oshirilayotgan   ishning   filologik
tadqiqotlar   olib   borishdagi,   shoir   va   yozuvchilar   tili   va   uslubini   o‘rganishdagi
afzalliklari   va   kamchiliklarini   aniq   tasavvur   qilish   mimkin.   Uning   ijodkor   tili   va
uslubini   o‘rganishda   va   belgilashdagi   beqiyos   ahamiyatini   qayd   etish   bilan
birgalikda,   uning   o‘z   zimmasiga   ololmagan   jihatlarini   ham   ko‘ra   bilish   kerak.
Jumladan, kompyuter yordamida ishlash  jarayonida quyidagi  kamchiliklar  ko‘zga
tashlandi:
-   lug‘atda   ayrim   so‘zlar,   masalan,   asarlarning   nomlari   qo‘shtirnoq   ichida
keltirilgan.   Kompyuter   qo‘shtirnoq   ichidagi   har   bir   so‘zni   alohida   o‘qimoqda.
Masalan,   “Qo‘shchinor   chiroqlari”dagi   yoki   “Mushtum”ni   deb   yozilgan   bo‘lsa,
uning tarkibidagi  dagi  va  ni  ni ham alohida o‘qimoqda;
-lug‘atda ayrim harfiy ifodalar ham bir so‘z sifatida joy olgan. Masalan, n, l,
p,   r   va   hokazo.   Ular   matndagi   qaysidir   bir   ism   va   familiya   tarkibidagi   ismning
qisqargan shaklidir:  A.P.Chexov  kabi;
58 -ikki   so‘z   birikuvining   qo‘shma   so‘z   ekanligi   faqat   inson   fikri   orqaligina
anglashiladi.   Shuning   uchun   hozircha   qo‘shma   so‘zlarning   lug‘atda   aks   etishi
muammoligicha qolmoqda;
-kompyuter matndagi raqamlarni qayd etmagan. Masalan, matnda   8ta, 10ta
yoki   8   tasi,   10   tasi   deb   yozilgan   bo‘lsa,   ta   yoki   tasi   ni   alohida   so‘z   sifatida
ko‘rsatgan;
-qandaydir   bir   harf   boshqa   shriftda   yozilib   qolgan   bo‘lsa-yu,   umumiy
matndagi shriftlarga mos kelmasa ham kompyutar so ‘zni o ‘qimaydi yoki lug‘atda
uni alohida qayd etadi. 55
Magistrlik   dissertatsiyasini   tayyorlash   davomida   biz   ham   shunday
chalkashliklarga duch keldik:
-asar   kirill   alifbosidan   dastur   tadqiqotiga   moslashtirilgan   lotin   yozuviga
o‘tkazilganda   қ,   ҳ,   ғ,   ў ,   е,   ё,   ю,   я     harflari       almashinuvida     chalkashliklar   yuz
berdi;
- nozil bo‘lmoq, qabul qilmoq    kabi qo‘shma so‘zlar alohida so‘z kabi ajratib
berildi;
-ko‘z   tashlamoq,   ko‘z   yummoq   kabi   bir   butun   frazeologik   birliklar   ham
alohida qismlarga ajratib ko‘rsatildi;
-yuqorida   birinchi   10   talikdagi   yuqori   chastotali   so‘z   turlari   ajratilib,
ularning N-grammlarini   yaratmoqchi bo‘lganimizda   va, ul, bir, ham  kabi shakllar
yolg‘iz   so‘z   shakl   holida   emas,   so‘z   tarkibidagi   qism   bo‘lganlarini     (masalan,   bu
ning N-grammlarida  bundan, Abu Bakr, qabul  kabi ) ham belgilab berdi;
55
 Каримов С., Қаршиев А., Исроилова Г. Абдулла Қаҳҳор асарлари тилининг луғати.  Алфавитли луғат. – Т:
«Ўзбекистон миллий энцеклопедияси» Давлат илмий нашриёти, 2007. – 10-bet.
59 3.2. “Al-Qur’on Al-Karim” dagi “Ko‘z” leksemasi bilan bog‘liq somatik
frazemalarning semantik tahlili
Frazeologiya   va   uning   o‘rganish   obyekti   bo‘lgan   ibora   atamasiga   “O‘zbek
tilining   izohli   lug‘ati”da   quyidagicha   izoh   berilgan:   Frazeoligiya[grek]   –   1)
tilshunoslikning biror tilga xos barqaror so‘z birikmalari va iboralarini o‘rganuvchi
bo‘lim; 2) biror tildagi barcha barqaror so‘z birikmalari va iboralar majmuyi.  Ibora
[a]   1.biror   tushuncha   yoki   fikr   ifodalovchi   so‘zlar   birikmasi;   ta’bir.   Frazeologik
ibora   ma’no   jihatidan   yaxlit   bir   butunlikni   tashkil   etuvchi   bir   necha   so‘zlardan
iborat birikma. 56
Frazeologizmlarga   turli   adabiyotlarda   olimlarimiz   ta’rif   berishgan.
Jumladan,   Sh.Rahmatullayev   “Bittadan   ortiq   leksik   negizdan   tarkib   topgan,
tuzilishi   jihatidan   birikmaga,   gapga   teng,   mazmunan   so‘zga   ekvivalent,
yaxlitligicha   ustama   ko‘chma   ma’no   anglatuvchi   lug‘aviy   birlikka   frazeologizm
(frazeologik   birlik)   deyiladi” 57
  deb   ta’rif   bergan   bo‘lsa,   A.Mamatov   “Ikki   yoki
undan ortiq so‘zdan tarkib topgan va yaxlit bir ma’no ifodalaydigan, grammatik va
semantik jihatdan bo‘linmaydigan va odatda so‘z ekvivalenti bo‘lgan   til birligi –
frazeologik   birlik   yoki   frazeologizm   deyiladi” 58
  deb   ta’riflaydi.   A.Xojiyev
“Lingvistik   terminlarning   izohli   lug‘ati”da   frazeologizmlarga   shunday   ta’rif
beradi:   “Tuzilishi   jihatidan   so‘z   birikmasiga,   gapga   teng,   semantik   jihatdan   bir
butun,   umumlashgan   ma’no   anglatadigan,   nutq   protsessida   yaratilmay,   balki
nutqqa   tayyor   holda   kiritiladigan   lug‘aviy   birlik.   Turg‘un   birikmalarning   obrazli,
ko‘chma ma’noga ega turi”. 59
Yuqoridagi  ta’riflardan ma’lum bo‘ladiki, frazeologizm  ikki  va undan ortiq
so‘zlarning   ko‘chma   ma’noda   qo‘llanilib,   ma’nosi   jihatdan   so‘z   yoki   so‘z
birikmasiga   teng   butunlik.   Frazeologizm   tarkibida   frazeologik   ma’no   hosil   qilish
funksiyasini   bajaradigan   komponent   mazmuniy   markaz   sanaladi.   Mazmuniy
markaz   vazifasini,   asosan,   mustaqil   so‘zlar   bajaradi.   Bunday   markaz   barcha
56
 Ўзбек тилининг изоҳли луғати. -Москва. 1981.307-bet.
57
 Раҳматуллаев Ш. Ўзбек тилининг изоҳли фразеологик луғати. – Тошкент:Ўқитувчи, 1978.56-bet
58
 Маматов А. Ўзбек тилида фразеологизмларнинг шаклланиш масалалари.-Тошкент: ЎТА.2001.3-сон.56-bet
59
 Хожиев А. Лингвистик терминларнинг изоҳли луғати. – Тошкент: Ўқитувчи, 1985.
60 frazeologizmlar   uchun   xos   bo‘lib,   u   erkin   qo‘llangan   so‘z   bilan   mos   kelishi
belgilangan.   Frazeologizmning mazmuniy markazi deganda u uchun tayanch so‘z
tushuniladi.   Bunday   so‘z   vazifasini   ko‘proq   somatizmlar   (soma-tana   a’zosi)
bajaradi.   A.Rafiyev   frazeologik   birliklarning   tayanch   komponenti   sifatida   uning
shakliy-sintagmatik  asosi  bo‘lgan  so‘zni  e’tiborga   oladi.   Somatik  frazema  har   bir
millat tilida alohida o‘rin tutadigan xazina va til jozibasini namoyon etadigan eng
muhim qadriyatlardan biri sanaladi. Ularda lisoniy ma’rifat qadimiy ildizlar – so‘z,
tushuncha, shakl va konstruksiyalarga qorishib ketadi. Aynan shu atama til jozibasi
hamda   uning   qayta   ishlanganlik   darajasini   namoyon   etadi.   To‘g‘rirog‘i,   “belgi
ichida   belgi”-semiologik   markaz   yaxlitligini   modellashtirish   mazkur   tushuncha
mag‘zini tashkil etadi. 60
O‘zbek tilida inson tana a’zolari bilan   bog ‘liq frazeologizmlar juda ko‘plab
uchraydi. Masalan, ko‘z, qo‘l, yurak, bosh   komponentli somatik  iboralar tilimizda
ko‘pchilkni   tashkil   qiladi.   Quyida   Qur’oni   karimning   Oltinxon   To‘ra   tafsiri
matni ni ng “Ko‘z” bilan bog‘liq somatik frazemalarning semantik tahliliga to‘xtalib
o‘tamiz.
“Mualliflik   korpusi”   dasturining   ishchi   oynasidagi   Fayl   nomiga   Oltinxon
To‘raning   “Al-Qur’on   Al-Karim”   asari   kiritilib,   konkordans   oynasi   o‘tiladi.
Qidirilayotgan   so‘z   qatoriga   ko‘z   so‘zi     kiritilib,   Start   berilgach,   dastur
tadqiqotchiga   shu   asardagi   ko‘z   komponentli   birliklarni   ajratib   beradi.
Konkordands   kombinatsiyasi   ko‘z   komponenti   mavjud   bo‘lgan   kontekstlarni
aniqlab,   ko‘z   leksemasini   ko‘k   rangda   ajratib   beradi.   Tadqiqotchi   aniqlangan
kombinatsiyalardan ko‘z leksemasi bilan bog‘liq somatik frazemalarni tezda ajratib
olishi mumkin. Bu jarayon tadqiqotchining butun asarni o‘qib, qo‘l mehnati bilan
izlashga   sarflanadigan   vaqtini   tejaydi.   Dasturning   ish   natijasi   o‘laroq   ko‘z
komponenti bilan bog‘liq 224 ta kombinatsiya aniqlandi.
60
43
  Абдуллаев Д. Айрим соматик фраземалар// Мулоқот. 1997-йил 5-сон. 105-106-betlar
61 3.12-rasm.   “Al-Qur’on   Al-Karim”dagi   “Ko‘z”   leksemasi   bilan   bog‘liq
kombinatsiyalarning konkordans ishchi oynasida ko‘rinishi
Aniqlangan somatik frazemalar “Al-Qur’on Al-Karim” ning qaysi surasi va
nechanchi oyatida borligini bilish uchun “Mualliflik korpusi” dasturining Fayldan
ko‘rish   oynasiga   o‘tiladi.   Qidirilayotgan   so‘z   qatoriga   ko‘z   so‘zi   kiritilib,   Start
berilgach,   dastur   tadqiqotchiga   shu   asardagi   ko‘z   komponentli   birliklarni   ko‘k
rangda ajratib beradi.
3.13-rasm.   “Al-Qur’on   Al-Karim”dagi   “Ko‘z”   leksemasi   bilan   bog‘liq
natijalarning Fayldan ko‘rish oynasida ko‘rinishi
Dastur   asosida  aniqlangan  ko‘z komponentli   ayrim   somatik  frazemalarning
semantik tahlilini keltirib o‘tamiz.
“Baqara” surasining 7-oyatida:   “Alloh taolo alarning dillari va quloqlariga
muhr   urg‘ondur   va   alarning   ko‘zlarida   parda   bordur   va   bordur   (tayyorlab
qo‘yilg‘ondur)   alar   uchun   azim   azob ” 61
  deb   keltiriladi.   Bu   oyatda   dillari   va
quloqlariga   muhr   urg‘ondur   iborasi   qo‘llangan   bo‘lib,   iboraning   izohini     aynan
61
 Ал-Қуръон ал-Карим. Таржималар ва шарҳлар. Тошкент: 2002. 11-bet
62 o‘zbek tili iboralarining izohli lug‘atida uchratmadik, tadqiqotchi sifatida qalbi va
qulog‘i yopiq, qancha da’vat qilma imonga kirmaydi degan ma’noni anglatadi, deb
tahlil   qildik.   Ko‘zlarida   parda   bordur   iborasining   izohini   ham   aynan   o‘zbek   tili
iboralarining izohli lug‘atida uchratmadik, tadqiqotchi sifatida   ko‘zini yog‘ bosdi,
ko‘zini   shira   bosdi   frazemalariga   ma’nodosh   bo‘lib,   takabburlanmoq,   tanib,
tanimaganga   olmoq   ma’nosini   anglatadi,   degan   xulosaga   keldik.   “Ko‘zlari
pardada” frazeologik birligini “Qahf”, “Josiyya” suralari oyatlarida ham uchratish
mumkin.   “Qahf”   surasining   101-oyati da   “ul   kofirlariki   ko‘zlari   pardada   erdi
Maning yodimdin va qodir  emas  edilar  eshitmakka  ham” 62
  deb keltirilgan bo‘lsa,
“Josiyya”   surasi   23-oyat i da   “Oyo,   ko‘rdingizmi   ul   kishiniki,   o‘zig‘a   ma’bud
tutibdur   nafsoniy   xohishin   va   ozdiribdur   Xudo   ani   ilm   ila   va   muhr   uribdur
qulog‘ig‘a   va   dilig‘a   va   solibdur   ko‘zig‘a     parda .   Va   ani   kim   hidoyat   qilur
Xudodin   keyin?   Oyo,   hali   ham   nasihat   olmaslarmi? ” 63
  kabi   shaklda   qo‘llangan.
“Baqara” surasining 7-oyatida bu ibora 3 komponentdan (ko‘zlarida (1), parda (2),
bordur (3)); “Qahf” surasining 101-oyatida 2 komponentdan (ko‘zlari (1), pardada
(2);   “Josiyya”   surasining   23-oyatida   2   komponentdan   (ko‘zig‘a   (1),   parda(2))
iboratligini ko‘ramiz.
“Baqara”  surasining 267-oyatini  Oltinxon To‘ra “Ey mo‘minlar, sarf  qiling
hosillaringizning   va   Biz   sizlar   uchun   yerdin   chiqarib   berg‘on   narsalarning
pokizasin   va   qasd   qilmanglar   yomonini   andin   bermak   uchun   va   sizlar   hargiz
olmassizlar,   magar   andin   ko‘z   yumursizlar .   Ba   bilingizlarki,   Alloh,   albatta,
behojatdur,   ta’rif   qiling‘ondur” 64
  tarzida   tarjima   qilgan   bo‘lsa,   shayx   Abdulaziz
Mansur   tarjimasida   quyidagichadir:   “Ey   imon   keltirganlar!   O‘z   qo‘l   mehnatingiz
va   Biz   sizlar   uchun   yerdan   chiqargan   narsalarning   yaxshilaridan   ehson   qilingiz!
O‘zingiz   faqat   ko‘zingizni   chirt   yumibgina   oladigan   darajadagi   yomon   narsalarni
(ehson   qilishga)   tanlamangiz!   Shunigdek,   bilingizki,   albatta,   Alloh   g‘aniy   va
maqtovga loyiq zotdir ” 65
.   Ko‘z   yummoq   frazemasi omonim frazema bo‘lib, I ko‘z
62
 Ал-Қуръон ал-Карим. Таржималар ва шарҳлар. Тошкент: 2002. 290-bet
63
 O‘sha manba. 486-bet
64
 O‘sha manba. 48-bet
65
  Қуръони   карим   маъноларининг   таржима   ва   тафсири.Тошкент.   Ўзбекистон   Республикаси   Президенти
Администрацияси ҳузуридаги Ахборот ва оммавий коммуникациялар агентлиги “O ‘zbekiston” НМИУ ДУК,
2021. 45-b
63 yummoq   –   vafot   etmoq;   II   ko‘z   yummoq   –   bilib   bilmaslikka   olmoq,   bee’tibor
qoldirmoq   ma’nolarida   qo‘llaniladi.   Mutarjim   Oltinxon   To‘ra   bu   frazemani   bilib
bilmaslikka   olmoq,   bee’tibor   qoldirmoq   ma’nolariga   ekvivalentidagi   birlikda
qo‘llagan, degan xulosaga keldik.
“Oli   Imron”   surasining   153-oyatiga   berilgan   tafsirda   olim   “…Agar   alardin
ba’zilari   o‘ljag‘a   ko‘z   tashlamasalar   edi,   bu   qadar   tashvishlik   hollarg‘a   duchor
bo‘lmas   erdilar”   deb   bayon   qiladi.   Ko‘z   tashlamoq   ibora   sanalib,   olim
Sh.Rahmatullayev   “O‘zbek   tilining   izohli   frazeologik   lug‘ati”da   quyidagicha
izohlaydi.   Ko‘z   tashlamoq   kim   nimaga   yoki   kimga .   Qisqa   muddat   qaramoq.
Varianti:   nazar   tashlamoq,   nigoh   tashlamoq.   O   ‘xshashi:   ko   ‘z   qirini   tashlamoq,
ko‘z yugurtirmoq. 66
“Ko‘zini   ochmoq”   frazemasi   “hushyor   qilmoq,   yaxshi-yomonni
tushunadigan   qilmoq” 67
  ma’nosiga   tengdir.   Biz   tadqiqot   ishi   jarayonida   bu
frazeologik  birlikning    turli   grammatik  shakllarini   uchratdik.  Jumladan,   “An’om”
surasining   104-oyati   Oltinxon   To‘ra   tomonidan   quyidagicha   tafsir   qilingan:
“Tahqiq,   sizlarg‘a   keldi   Rabbilaringiz   tarafidan   dalillar.   Kimiki   ko‘zi   ochildi   –
foydasi   o‘zig‘adur,   kimiki   ko‘rlikda   qoldi   –   zarari   o‘zidadur   va   man   sizlarg‘a
nigohbon   emasdurman”,   “A’rof”   surasining   201-oyatida   ham   “Tahqiq,   zotlariki
Xudodan   qo‘rqurlar,   alarg‘a   qachon   shayton   tarafidin   vasvasa   kelsa,   Allohni   yod
qila   boshlarlar.   Keyin   birdan   alarning   ko‘zlari   ochilur ” 68
,   “Al-Hijr”   surasining   3-
oyatiga   keltirilgan   izohda   “Vaqtiki,   nasihat   alarg‘a   ta’sir   qilmasa,   g‘aflatdin
uyg‘onmasalar,   qo‘yub   beringki   bir   necha   kun   hayvonlar   kabi   yeb-ichib,   dunyo
rohatlaridan   bahra   olsunlar,   oz   kunlar   o‘z   qilmishlarining   yomon   oqibatlarin
ko‘rib-bilib,   ko‘zlarin   ochsunlar ” 69
,   “Mo‘minun”   surasi   77-oyatning   izohida
“Ya’ni   bularg‘a   tanbeh   bo‘lsun   va   ko‘zlari   ochilsun   deb,   qahat   kabi   azoblarg‘a
giriftor   etildilar…” 70
  “Ko‘z   ochmoq”   frazemasining   grammatik   shakllaridagi
farqlarni keltirib o‘tamiz: “An’om” surasi 104-oyatida ochmoq fe’li o‘zlik nisbat,
66
 Раҳматуллаев Ш. Ўзбек тилининг изоҳли фразеологи луғати. –Тошкент:Ўқитувчи, 1978. 148-bet
67
 Раҳматуллаев Ш. Ўзбек тилининг изоҳли фразеологи луғати. –Тошкент:Ўқитувчи, 1978.139-bet
68
 Ал-Қуръон ал-Карим. Таржималар ва шарҳлар. Тошкент: 2002. 160-бет
69
 O‘sha manba. 2002. 242-bet
70
 O‘sha  manba.  340-bet
64 o‘tgan zamon, III shaxs, birlik kategoriyasida qo‘llanganligini, “A’rof” surasining
201-oyatida   ko‘z   komponenti   ko‘plik   kategoriyasida,   ochmoq   fe’li   esa   o‘zlik
nisbat,   kelasi   zamon   kategoriyasida   ifodalanganligini,   “Al-Hijr”   surasi   3-oyatida
frazeoligik   birlikning   ko‘z   komponenti   -lar   ko‘plik   kategoriyasini   va   -n   tushum
kelishigi affiksini olgan shaklda bo‘lib, ochmoq komponenti yetakchi morfemasiga
-sun   fe’lning   buyruq-istak   mayli   kategoriyasi,   -lar   III   shaxs   ko‘plik   grammatik
kategoriyalarini olgan shaklda qo‘llanilganini, “Mo‘minun” surasi 77-oyat izohida
frazemaning   ko‘z   komponenti   -lar   ko‘plik   kategoriyasini   olgan   shaklda   bo‘lib,
ochmoq   komponentining   yetakchi   morfemasiga   -sun   fe’lning   buyruq-istak   mayli
kategoriyasi bilan birgalikda kelgan shaklda ko‘rish mumkin.
“Al-Hijr”   surasining   88-oyatida   esa   “ko‘z   ochmoq”   frazemasi   boshqa
ma’noda   qo‘llanganligini   ko‘rish   mumkin.   “   Ko‘zlaringizni   ochib      boqmang   ul
narsag‘aki, foydalanturdik aning ila alardin bir necha jamoani
Yahudiyni, nasoroni va mushriklarni.
Va g‘amgin bo‘lmang alarg‘a.
Musulmon bo‘lmog‘onliklari uchun.
Va bas, qiling yoningizni mo‘minlarg‘a.
Ya’ni xoksor bo‘ling mo‘minlar uchun” 71
.
Xuddi shu suraning mazkur oyati shayx Abdulaziz Mansurning tarjimalarida
“Ko‘zlaringizni   Biz   u   (kofirlardan   ayrim)   toifalarni   bahramand   qilgan   narsalarga
(ularning boyliklariga)  tikmang …” 72
 tarzida berilgan.  “Ko‘z tikmoq”  iborasi  tikilib
qaramoq, umidvor bo‘lib qaramoq, hirs bilan qaramoq 73
 ma’nolarini beradi.
“ A’rof” surasi 116-oyatda “Muso dedi: “Sizlar tashlanglar”. Bas, vaqtiki alar
tashladilar, odamlar   ko‘zlarin bog‘lab qo‘ydilar   va alarg‘a xavf soldilar va buyuk
bir   jodu   ko‘rsatdilar.” 74
      Ko‘zlarini   bog‘lab   qo‘ymoq   frazemasi   komponentlari
o‘zining   nominativ   ma’nosini   yo‘qotgan   bo‘lib,   aql-hushini   olmoq,   o‘zini   idora
qila   olmay   qolmoq   ma’nolarida   ishlatiladi.   Xuddi   shu   oyat   Shayx   Abdulaziz
71
 Ал-Қуръон ал-Карим. Таржималар ва шарҳлар. Тошкент: 2002. 247-bet
72
  Қуръони   карим   маъноларининг   таржима   ва   тафсири.Тошкент.   Ўзбекистон   Республикаси   Президенти
Администрацияси ҳузуридаги Ахборот ва оммавий коммуникациялар агентлиги “O ‘zbekiston” НМИУ ДУК,
2021. 266-b
73
 Раҳматуллаев Ш. Ўзбек тилининг изоҳли фразеологи луғати. –Тошкент:Ўқитувчи, 1978.149-bet
74
 Ал-Қуръон ал-Карим. Таржималар ва шарҳлар. Тошкент: 2002. 151-bet
65 Mansur   tafsirida:   “(Muso):   “Tashlangiz!”   -   dedi.   Bas,   tashlagan   edilar,
odamlarning   ko‘zlarini   sehrlab,   ularni   cho‘chitib   yubordilar   –   ulkan   sehr
keltirdilar ” 75
 tarzida keltirilgan.
“Anfol” surasi  69-oyatning izohida “…Va ba’zilari moli manfaatini   ko‘zda
tutdilar ” 76
  degan jumla mavjud. Bu izohda  ko‘zda tutmoq  frazema sanalib, “fikran
hisobga olmoq” 77
 ma’nosini ifodalaydi.
“Ra’d”   surasi   19-oyat   izohida   “Musulmon   banda   Qur’onu   Hadisg‘a   amali
bo‘lg‘on sababdin   ko‘zi   va   dili ochiq   bir inson bo‘lur, ul   albatta bedin, nodon ila
barobar   bo‘lmas” 78
  degan   fikrlar   mavjud.   Ko‘zi   ochiq   iborasi   omonim   ibora
hisoblanib,   I.“barhayot”,   II.“yaxshini   yomondan,   foydani   zarardan   farqlashga
qobiliyatli” 79
 ma’nolarini anglatadi. Bu oyatda u ikkinchi ma’noga tengdir.
“Nahl”   surasining   77-oyati   “Allohg‘a   xosdur   osmonlarning   va   yerning
g‘ayblarini   bilmak.   Va   Qiyomat   kelishi   ko‘z   yumib   ochish   kabi   vaqtdin   boshqa
narsa   emas,   balki   u   andin   ham   yaqinroqdur.   Albatta,   Alloh   har   bir   narsag‘a
qodirdur!” 80
 tarzida tarjima qilingan. “Naml” surasi 40-oyat tafsirida “…Man   ko‘z
yumib   ochish   miqdorida   taxtni   hozir   qilurman,   dedilar   va   hozir   qildilar” 81
shaklidagi   jumla   mavjud   bo‘lib,   “ko‘z   ochib   yumish”   frazeologik   birlik   sanaladi.
Sh.   Rahmatullayev   “O‘zbek   tilining   izohli   frazeologik   lug‘ati”da   “Ko‘z   ochib
yumguncha” iborasiga “Hash-pash” deguncha, “ha-hu” deguncha iboralari sinonim
bo‘lishini   va   “juda   qisqa   muddatda,   tezda”   so‘zlariga   ekvivalent   sifatida
izohlaydi. 82
Tilimizda,   asosan   og‘zaki   nutqimizda   “ko‘z   oldida”   iborasi   keng
qo‘llaniladi,   bu   ibora   “ko‘z   o‘ngida”   iborasiga   variantdosh   bo‘lib,   olim
Sh.Rahmatullayev “ko‘z o‘ngida”  iborasini “bevosita ko‘ringan, kuzatilgan holda”
deb   izohlaydi.   Oltinxon   To‘ra   “Al-Qur’on   Al-Karim”   kitobida   “ko‘z   oldida”
75
  Қуръони   карим   маъноларининг   таржима   ва   тафсири.Тошкент.   Ўзбекистон   Республикаси   Президенти
Администрацияси ҳузуридаги Ахборот ва оммавий коммуникациялар агентлиги “O ‘zbekiston” НМИУ ДУК,
2021. 164-б
76
 Ал-Қуръон ал-Карим. Таржималар ва шарҳлар. Тошкент: 2002. 168-bet
77
 Раҳматуллаев Ш. Ўзбек тилининг изоҳли фразеологи луғати. –Тошкент:Ўқитувчи, 1978.133-bet
78
  Ал-Қуръон ал-Карим. Таржималар ва шарҳлар. Тошкент: 2002. 232-bet
79
 Раҳматуллаев Ш. Ўзбек тилининг изоҳли фразеологи луғати. –Тошкент:Ўқитувчи, 1978.141-bet
80
  Ал-Қуръон ал-Карим. Таржималар ва шарҳлар. Тошкент: 2002. 256- bet
81
  Ал-Қуръон ал-Карим. Таржималар ва шарҳлар. Тошкент: 2002. 374-bet
82
 Раҳматуллаев Ш. Ўзбек тилининг изоҳли фразеологи луғати. –Тошкент:Ўқитувчи, 1978.147-bet
66 iborasidan   turli   grammatik   shakllarda   foydalanganlar.   Jumladan,   “Al-Isro”   surasi
93-oyatning tafsirida “Ya’ni siz Me’rojdan so‘zlarsiz, agar rost bo‘lsa bizning  ko‘z
oldimizda   osmong‘a chiqing va andin bir yozilg‘on   kitob   olib   tushingki, ani biz
o‘quyluk   va   tushunayluk” 83
;   “To   ho”   surasi   39-oyatda   “   “Sol   bolani   sanduqg‘a,
keyin solg‘il sanduqni daryog‘a, keyin tashlasun ani daryo kunorasig‘a;  olsun ani
Mening dushmanim va uning dushmani”. Va soldim Man sang‘a bir muhabbat o‘z
tarafimdin va toki tarbiyat qilinsun sani    ko‘z oldimda ” 84
; “Mo‘minun” surasining
27-oyatida “Keyin Biz ang‘a vahiy yuborduk: “San bir kema yasagil Bizning   ko‘z
oldimizda   va   Bizning   hukmimiz   ila,   keyin   qachon   Bizning   farmonimiz   kelsa   va
tannur qaynasa, solgil ul kemaga har qism jonvordin bir er va bir urg‘ochini va o‘z
ahlingni   ham…” 85
  kabi.     Misol   tariqasida   keltirilgan   oyatlarda   bu   frazema
yuqoridagi izohga mos keladi, deb hisoblaymiz.
“Nur”   surasi   43-oyat   “Oyo,   ko‘rmadingmi,   tahqiq,   Xudo   yumshoqlik   ila
haydar   bulutlarni,   keyin   alarni   bir-birig‘a   qo‘shur,   keyin   alarni   ustma-ust   qilur,
keyin ko‘rursan yomg‘irni aning orasidan chiqur va tushurur yuqori tarafdin anda
bor   tog‘lardin   do‘lni   va   tekkizur   ani   kimg‘a   xohlasa.   Yaqindurki   bulutning
chaqmog‘i   ko‘zlarni   qamashtirsa”   86
  shaklidagi   kalom   bor.   Bu   oyatda   “ko‘z
qamashdi”   iborasi   qo‘llanilib,   “nur   aks   etib   ko‘zi   hech   narsani   ko‘rmaydi” 87
ma’nosini ifodalaydi.
“Shuaro” surasi 35-oyat izohida  “Qo‘llaridagi aso yo‘g‘on bir ajdaho bo‘lib,
muborak   qo‘llari   o‘z-o‘zi   ila   hammaning   ko‘zini   xira   qilg‘ach,   hech   bir   munosib
javob   topa   olmay,   o‘z   g‘ulomlari   va   chovkarlarig‘a   boqib,   alardin   bu   qiyinchilik
uchun chora talab qila boshladi”   88
  degan tafsir berilgan bo‘lsa, “Qiyomat” surasi
7-oyati   “Bas,   vaqtiki,   ko‘zlar   xira   bo‘lsa” 89
  tarzida   tarjima   qilingan.   Bu
tarjimalarda mutarjim “ko‘zi xira” birikmasini qo‘llagan. Bu birlik to‘lig‘icha o‘z
ma’nosini yo‘qotgan emas, ko‘z komponenti nominativ ma’noda, xira komponenti
83
  Ал-Қуръон ал-Карим. Таржималар ва шарҳлар. Тошкент: 2002. 274- bet
84
  O ‘sha manba . 302- bet
85
  O ‘sha manba . 336- bet
86
  O ‘sha manba .. 350-bet
87
 Раҳматуллаев Ш. Ўзбек тилининг изоҳли фразеологи луғати. –Тошкент:Ўқитувчи, 1978.143-bet
88
  Ал-Қуръон ал-Карим. Таржималар ва шарҳлар. Тошкент: 2002. 362- bet
89
  O ‘sha manba .. 594-bet
67 dominativ   ma’noda   bo‘lib,   ko‘zi   yaxshi,   tiniq   ko‘rmaydi   ma’nosiga   tengdir,   deb
izohlaymiz.
“Shuaro”   surasi   61-oyatda   “qachonki   ikkita   yig‘uvchi   ko‘zga   tashlandi ,
Musoning   hamrohlari   dedilar:   “Bizlar   tutilduk ” 90
.   Mazkur   oyatdagi   ko‘zga
tashlanmoq   frazema hisoblanib, “ro‘y-rost, aniq ko‘rinmoq”, “aniq ajralib, sezilib
turmoq” 91
 ma’nolariga ekvivalent hisoblanadi.
Nutqimizda   “ko‘z   yummoq”   iborasi   ham   omonim   ibora   sanaladi.   I.vafot
etmoq,   II.Ko‘rib   ko‘rmaslikka   olmoq .   Olim   Oltinxon   To‘raning   “Al-Qur’on   Al-
Karim”   asarida   iboraning   “ko‘rib   ko‘rmaslikka   olmoq”   ma’nosida   qo‘llangan
tarjima   va   tafsirlarini   keltirib   o‘tamiz.   Jumladan,   “Naml”   surasi   66-oyat   tafsirida
“Ya’ni   mushriklarning   olimlari   oxiratni   tushuna   olmadilar,   balki   mumkin   va
nomumkinligida   qoldilar.   Balki   aning   dalil   va   guvohlarin   ko‘rishdin   ko‘zlarin
yumib   oldilar …” 92
  va   “Zuxruf”   surasi   36-oyatda   “Va   kimiki   ko‘zni   yumur
Rahmonning   yodidin,   Biz   ang‘a   shaytonni   sallat   qilurmiz,   ul   ang‘a   yo‘ldosh
bo‘lur” 93
.
“Azhob” surasi  19-oyatda “baxil bo‘lg‘on hollarida sizlarg‘a. Keyin vaqtiki
xavf kelib qolsa, ko‘rursan alarniki, boqurlar sang‘a   ko‘zlari bejo   bo‘lib, ul odam
kabiki,   ang‘a   o‘lim   behushlig‘i   kelur…” 94
  Bu   tarjimalarda   olim   “ko‘zlari   bejo”
birikmasini   qo‘llagan.   Bu   birlik   to‘lig‘icha   o‘z   ma’nosini   yo‘qotgan   emas,   ko‘z
komponenti  nominativ ma’noda, bejo komponenti  fors-tojik tilidan o‘zlashgan va
allanechuk   besaranjom,   nojo‘ya,   o‘z   joyida   emas     degan   izohga   ega.   “Ko‘zlari
bejo” birikmasini ko‘zi o‘z joyida emas, deb izohlaymiz.
O‘zbek   tilining   izohli   iboralar   lug‘atida   “ko‘zlari   tuban”   iborasini
uchratmadik.   Lekin   bu   birlikni   Oltinxon   To‘ra   qo‘llaganini   asarni   o‘qish
jarayonida kuzatdik. Tuban so‘zi “O‘zbek tilining izohli lug‘atida” 1) quyi, past; 2)
ko‘chma   ma’noda   mavqeyi   jihatidan   quyi   darajada;   3)   ko‘chma   razil,   qabih   95
90
 O‘sha manba.. 363-bet
91
 Раҳматуллаев Ш. Ўзбек тилининг изоҳли фразеологи луғати. –Тошкент:Ўқитувчи, 1978. 132-bet
92
 Ал-Қуръон ал-Карим. Таржималар ва шарҳлар. Тошкент: 2002. 377-bet
93
 O‘sha manba.: 2002. 477-bet
94
 O‘sha manba. 411-bet
95
 Ўзбек тилининг изоҳли луғати.II -Москва. 1981. 215-bet
68 tarzida   izohlangan.   Quyida   keltirilgan   tafsirlarda   “Ko‘zlari   tuban”   birligi   ko‘zlari
yerga   qaragan,   tik   qaramaydigan   ma’nolarda   qo‘llangan   degan   xulosaga   keldik.
Jumladan,   “Sod”   surasi   52-oyatini   “Va   bor   bo‘lur   qoshlarida   ko‘zlarin   tub    a   n  
qilguvchi   yoshlari   barobar   (xotinlar)” 96
  tarzida   Oltinxon   To‘ra   tafsir   qilgan
bo‘lsalar,   Shayx   Abdulaziz   Mansur   bu   oyatni   quyidagicha   tafsir   qiladilar:
“ularning   oldilarida   ko‘zlari   (erlaridan   boshqaga   boqishida)   cheklangan   (yosh   va
husnda)   tengqur(qiz)lar   bo‘lur”. 97
  Oltinxon   To‘ra   “Qamar”   surasi   7-oyatini   “Bas,
bo‘lg‘on   holda   ko‘zlari   tuban   chiqurlar   qabrlaridin,   go‘yoki   alar   taralg‘on
chigirtkalar   kabi   bo‘lurlar” 98
  tarzida   tarjima   qilgan   bo‘lsalar,   Shayx   Abdulaziz
Mansur  bu  oyatni  quyidagicha  tafsir  qiladilar:  “(ular)   ko‘zlari  qo‘rquvdan quyiga
boqqan   hollarida,   go‘yo   to‘zigan   chigirtkalar   kabi   qabrlaridan   chiqib   kelurlar”. 99
“Noziot”   surasi   9-oyatini   tarjimon   Oltinxon   To‘ra   “alarning   ko‘zlari   tubanda
bo‘lur” 100
  deb   izohlasalar,   Shayx   Abdulaziz   Mansur   bu   oyatni   quyidagicha   tafsir
qiladilar: “Ko‘zlar esa (dahshatdan) qamashib qoluvchidir”. 101
Biz   nutqimizda   hayotimizda   uchramagan,   o‘xshashi   va   tengi   bo‘lmagan,
hech qanday so‘z bilan ta’riflab bera olmaydigan holat va voqea-hodisaga nisbatan
“ko‘z   ko‘rib,   quloq   eshitmagan”   frazeologik   birlikni   ishlatamiz.   Olim   va   shoir
Oltinxon   To‘ra     “Sho‘ro”   surasi   22-oyat   tafsirida   “… Ko‘z   ko‘rmag‘on   va   quloq
eshitmag‘on   va   hech   bir   inson   ko‘ngliga   keltirmag‘on   ne’matlar   alarg‘a     inoyat
qilinur” 102
 shaklida bu iboradan foydalanganlar.
“Qof” surasi  22-oyatining tarjimasi quyidagicha: “(Dermiz angaki,) albatta,
san  bu kundin  bexabar  erding,  emdi  ko‘tarduk  sandin  pardai  g‘aflatingni,  bu kun
ko‘zing   o‘tkirdur ”. 103
  Bu   tarjimada   mutarjim   “ko‘zi   o‘tkir”   birikmasini   qo‘llagan.
96
Ал-Қуръон ал-Карим. Таржималар ва шарҳлар. Тошкент: 2002. 448-bet 
97
  Қуръони   карим   маъноларининг   таржима   ва   тафсири.Тошкент.   Ўзбекистон   Республикаси   Президенти
Администрацияси ҳузуридаги Ахборот ва оммавий коммуникациялар агентлиги “O ‘zbekiston” НМИУ ДУК,
2021. 456-b
98
 Ал-Қуръон ал-Карим. Таржималар ва шарҳлар. Тошкент: 2002. 518-bet
99
  Қуръони   карим   маъноларининг   таржима   ва   тафсири.Тошкент.   Ўзбекистон   Республикаси   Президенти
Администрацияси ҳузуридаги Ахборот ва оммавий коммуникациялар агентлиги “O ‘zbekiston” НМИУ ДУК,
2021. 529-b
100
 Ал-Қуръон ал-Карим. Таржималар ва шарҳлар. Тошкент: 2002. 607-bet
101
  Қуръони   карим   маъноларининг   таржима   ва   тафсири.Тошкент.   Ўзбекистон   Республикаси   Президенти
Администрацияси ҳузуридаги Ахборот ва оммавий коммуникациялар агентлиги “O ‘zbekiston” НМИУ ДУК,
2021. 583-b
102
 Ал-Қуръон ал-Карим. Таржималар ва шарҳлар. Тошкент: 2002. 472-bet
103
 O‘sha manba.  506 - bet
69 Bu   birlik   to‘lig‘icha   o‘z   ma’nosini   yo‘qotgan   emas,   ko‘z   komponenti     nominativ
ma’noda,   o‘tkir   komponenti   esa   dominativ   ma’noda   bo‘lib,   ko‘zi   yaxshi,   tiniq
ko‘radi ma’nosiga ekvivalentdir, deb izohlaymiz.
Xulosa   o‘rnida   shuni   ta’kidlash   mumkinki,   frazemalar   faqatgina   og‘zaki
jonli   so‘zlashuv     uslubida,   badiiy   adabiyot   durdonalaridagina   emas,   balki   diniy
adabiyotlarda   ham   salmoqli   o‘rinni   egallaydi   va   o‘zi   qo‘llangan   asar   tilining
jozibasini   oshirishga   xizmat   qiladi.   Qiroatxon   iboralar   izohini     to‘g‘ri   izohlay
olmasa, tushunishda xatolikka yo‘l qo‘yishi mumkin.
70 Bob bo‘yicha xulosalar
1.Oltinxon   To‘ra   tarjimasi   xorijdagi     turkistonlik   musulmonlar   uchun
Qur’oni   karimni   o‘rganishda   muhim   asar   hisoblandi   va   ular   orasida   shuhrat
qozondi.   Bu   tarjima   va   tafsirning   yana   bir   e’tiborli   tomoni   shundaki,   xorijdagi
o‘zbek   tili,   uning   so‘z   tuzilishi,   leksikologiyasi,   tilning   tarixini   o‘rganish   uchun
ham muhim manba bo‘la oladi.
2.   “Mualliflik   korpusi”   dasturiga   asar   fayli   kiritilib,   qidirilayotgan   so‘z
qismiga   somatik   frazemaning   bir   komponenti   kiritilib   start   berilsa,   dastur   ularni
butun matn ichidan ajratib beradi.
3.Tadqiqot   ishida   “Ko‘z”   leksemasi   tanlandi   va   224   ta   konkordans
aniqlandi.Oltinxon To‘raning Qur’oni karim ma’nolar tarjimasida “Ko‘z” so‘zi bor
bir qancha somatik frazemalar tahlil qilindi.
4. “Al-Qur’on   Al-Karim”da   quyida   keltirilgan   iboralar   tilimizda   mavjud
bo‘lib, ular to‘liqligicha o‘z ma’nosini yo‘qotib, frazeologik butunlikka aylangan:
“Ko‘z   yummoq”,   “Ko‘z   tashlamoq”,   “Ko‘z   ochib   yumguncha”,   “Ko‘z   ko‘rib,
quloq eshitmagan”, “Ko‘z qamashdi”, “Ko‘zi ochiq”.
5. “Al-Qur’on   Al-Karim”da   tarjimonning   quyidagi   individual   iboralari
aniqlandi: “Ko‘zlari tubanda”, “Ko‘zlarida parda bor”, “Ko‘zig‘a parda”, “Ko‘zlari
pardada”.
6. “Al-Qur’on   Al-Karim”da   ham   o‘z   ma’nosida,   ham   ko‘chma   ma’nosida
qo‘llangan   leksemalar   kombinatsiyasidan   tashkil   topgan   birliklarni   ham   uchratish
mumkin: “Ko‘zlari bejo”, “Ko‘zlari xira”, “Ko‘zi o‘tkir”, “Ko‘z oldimizda”
Somatik frazemalarning izohini  to‘g‘ri  izohlay  olish  asarning jozibasini  his
qilishga imkon beradi.
71 UMUMIY XULOSALAR
Globallashuv   davrida   jahon   tilshunosligining   jadal   rivojlanayotgan   sohasi
korpus lingvistikasi bo‘lib, uning ish quroli til korpusidir.   Korpus nutqning barcha
ko‘rinishlarini   qamrab   olish   imkoniyatiga   ega   axborot   manbayidir .   Korpus
dasturini   uzluksiz   to ‘ ldirib   b or ish   orqali   til   taraqqiyotida   sathlararo   ro ‘ y   berayotgan
o ‘ zgarishlarni   kuzatib   borish   mumkin .  Til   va   jamiyat   o ‘ rtasidagi   uzviylik   korpusda
yaqqol   namoyon   bo ‘ ladi .
Tilning   milliy   korpusi   axborot   manbayi   sifatida   korpuslashgan   tilda
yaratilgan   og ‘ zaki ,   yozma   yodgorliklar ,   milliy ,   madaniy   meros   namunalari
elektron   shaklda   Internet   tarmog ‘ idan   joy   olishi ,   tabiiy   tilning   elektron   shakldagi ,
qidiruv   dasturiga   joylashtirilgan   matnlar   yig ‘ indisi   bo ‘ lganligidan   bir   marta   tuzilib ,
mukammal   razmetkalangan   korpus   lingvistik   tadqiqotlar   samaradorligini
ta ’ minlashda   baza   vazifasini   bajarishi ,   elektron   kutubxona ,   lug ‘ at ,   grammatikalar
yaratish   uchun   asos   bo ‘ lishi ,     tilni   tadqiq   etish   ( so ‘ zning   o ‘ zgarishi ,   istorizm ,
neologizm   vujudga   kelishi ,   ma ’ no   torayishi ,   ma ’ no   kengayishi ,   yangi
frazeologizmlarning   paydo   bo ‘ lishini   kuzatish ),   til   o ‘ rganish ,   lug ‘ at   tuzishda   eng
zamonaviy ,  keng   imkoniyatli   dasturlashtirilgan   tizimi   kabi    qulayliklarga   ega .
O ‘zbek   tilining   milliy   korpusini   yaratish   –   bugungi   kunda   amaliy
tilshunosligimiz   oldida   turgan   eng   muhim   masalalardan   biri .   Milliy   korpus   bilan
birga mualliflik korpuslarini ham yaratish bugungi o‘zbek tilshunosligining muhim
vazifalaridan   biri   bo‘lib,   jahon   tajribalari   asosida   yaratish   ishlari   bormoqda.
Mualliflik   korpuslaridagi   ma’lumotlar   ilmiy   manbalar   asosida   tahrir   qilinganligi,
ma’lumotlarning aniqligliligi va ishonchliligi bilan xarakterlanadi.
Ushbu  magistrlik dissertatsiya  ish i ni bajarishda quyidagilar amalga oshirildi:
kompyuter   lingvistikasiga   oid,   xususan,   korpuslar   va   ularni   tuzishga   oid
adabiyotlar   o‘rganildi;   o‘zbek   tilining   kompyuter   yordamida   statistik   tahlili,
konkordans  tuzish,   n-grammlar  tuzish,   chastotali   lug‘at  kabi  ishlar  bajarilishining
zamonaviy   darajasi   tahlil   qilindi;   o‘zbek   tili   mualliflik   korpusini   yaratishning
dasturiy   majmuasi   loyihalandi;   mualliflik   korpusini   yaratish   algoritmlari   ishlab
chiqildi;  dasturlar majmuasi kodlashtirildi, sozlandi va sinovdan o‘tkazildi.
72 “Mualliflik korpusi” dasturining tarkibi va tavsifi quyidagicha:
1)   konkordans   ishchi   oynasida   o‘rganilayotgan   leksema   tanlangan   asarda
nechta bo‘lsa, miqdori va konteksti ko‘rsatiladi.
2)  fayldan ko‘rish  ishchi oynasida o‘rganilayotgan leksema tanlangan asarda
ko‘k rangda ajratib ko‘rsatiladi.
3)   klasterlar/N-grammlar   ishchi   oynasida   o‘rganilayotgan   leksema   bilan
minimum va maxsimum kiritilgan leksema ketma-ketligi namoyon bo‘ladi.
4)   so‘zlar   ro‘yxati   ishchi   oynasida   tadqiq   etilayotgan   matndagi   so‘zlarning
chastotasi aniqlanadi
5)   Dasturiy   majmua   yordamida   Oltinxon   To‘raning   “Al-Qur’on   Al-Karim”
asari   o‘rganildi.   Ishning   natijalarida   o‘zbek   tilshunosligi   uchun   muhim
ma’lumotlar olindi:
a)   Oltinxon   To‘raning   “Al-Qur’on   Al-Karim”   asaridan   “ko‘z”   so‘zi
o‘rganilganda 224 ta ro‘yxatdan iborat konkordans tuzildi.
b)   Shu so‘z bo‘yicha uni  grammasining minimum qiymati  2 va maksimum
qiymati 4 bo‘lgan n-gramma 672 ta kontekstdan iborat ro‘yxat hosil bo‘ldi.
c)   chastotali   lug‘at   hosil   qilinganda,   37000   dan   ortiqroq   takrorlanmas
so‘zshakllar   aniqlanib,   asarda   eng   ko‘p   “va”   so‘zi   ishlatilgan   va   12451   marta
foydalanilgan.
6)   “Mualliflik   korpusi”   dasturi   bilan   ishlash   tadqiqotchiga   bir   qancha
qulayliklar yaratadi:
qisqa vaqtda ko‘p ma’lumotlarni olish mumkin;
tadqiqotga tortilgan leksemani ko‘k rangda ajratib beradi;
hech bir leksema nazardan chetda qolmaydi;
7)   Magistrlik   dissertatsiyasini   tayyorlash   davomida   biz   bir   qancha
qulayliklar qatorida mana bunday chalkashliklarga ham duch keldik:
-asar   kirill   alifbosidan   dastur   tadqiqotiga   moslashtirilgan   lotin   yozuviga
o‘tkazilganda  қ, ҳ, ғ, ў ,  е, ё, ю, я  harflari almashinuvida  chalkashliklar yuz berdi;
73 - nozil   bo‘lmoq,   qabul   qilmoq ,   madad   so‘rar   kabi   qo‘shma   so‘zlar   alohida
so‘z kabi ajratib berildi;
-ko‘z   tashlamoq,   ko‘z   yummoq   kabi   bir   butun   frazeologik   birliklar   ham
alohida qismlarga ajratib ko‘rsatildi;
-tadqiqotda ishida birinchi 10 talikdagi yuqori chastotali so‘z turlari ajratilib,
ularning N-grammlarini   yaratmoqchi bo‘lganimizda   va, ul, bir, ham  kabi shakllar
yolg‘iz   so‘z   shakl   holida   emas,   so‘z   tarkibidagi   qism   bo‘lganlarini   (masalan,   bu
ning N-grammlarida  bundan, Abu Bakr, qabul  kabi) ham belgilab berdi;
Bu holatlarga qo‘ldan o‘zgartirish kiritish konkordans lug‘atini, N-grammlar
lug‘atini,   chastotali   lug‘atni   tartibga   keltirishda   chalkashliklarga   olib   keladi.
Shuning   uchun   o‘z   holicha   qoldirdik.   Keyingi   ilmiy   ishlanishlarda   tuzatish   va
tuziladigan lug‘atlarni takomillashtirishni o‘z oldimizga maqsad qilib qo‘ydik.
74 F OYDALANILGAN ADABIYOTLAR RO‘YXATI
Ijtimoiy-siyosiy adabiyotlar:
1. O‘zbekiston   Respublikasi   Prezidentining   2020-yil   5-oktabrdagi   PF-6079-
sonli “Raqamli O‘zbekiston  -  2030” strategiyasini tasdiqlash va uni samarali
amalga oshirish chora-tadbirlari to‘g‘risida”gi farmoni//www.lex.uz .
2. O‘zbekiston   Respublikasi   Prezidentining   2020-yil   20-oktabrdagi   PF-6084-
sonli   “Mamlakatimizda   o‘zbek   tilini   yanada   rivojlantirish   va   til   siyosatini
takomillashtirish chora-tadbirlari to‘g‘risida”gi farmoni//www.lex.uz
3. Ўзбекистон   Республикасининг   Қонуни.   Илм-фан   ва   илмий   фаолият
тўғрисида.// Халқ сўзи, 2019, 3 0  октябрь.  № 224 (7454).
4. Ўзбекистон   Республикаси   Президентининг   “Ўзбек   тилининг   давлат
тили сифатидаги нуфузи ва мавқеини тубдан ошириш чора-тадбирлари
тўғрисида”ги   ПФ-5850-сон   Фармони .//Халқ   сўзи,   2019,   22   октябрь.
№ 218 (7448).
5. Ўзбекистон Республикаси Президентининг 2022 йил 28 январдаги ПФ-
60 “2022-2026 йилларга мўлжалланган Янги Ўзбекистоннинг Тараққиёт
стратегияси тўғрисида”ги Фармони.//Янги Ўзбекистон, 2022, 1 феврал.
№22   (544) .
6. Мирзиёев,   Шавкат   Миромонович.   Миллий   ўзлигимиз   ва   мустақил
давлатчилигимиз   тимсоли.   Ўзбек   тилига   давлат   тили   мақоми
берилганлигининг   ўттиз   йиллигига   бағишланган   тантанали
маросимдаги нутқи .//Халқ сўзи, 2019, 22 октябрь.  № 218 (7448).
7. Ilmiy-nazariy adabiyotlar:
8. Abdulloh Ismatulloh, Hoji.  Markaziy Osiyoda İslom madaniyati. –Toshkent:
Sharq: 2005.
9. Abduraxmonova   N .   O‘zbek   tili   elektron   korpusining   kompyuter   modellari.
Monografiya, Toshkent – 2021.
75 10. Ataboyev   N.   Korpus   lingvistikasining   asosiy   xusussiyatlari   maqola   //
“Ўзбекистонда   хорижий   тиллар”   илмий-методик   электрон   журнал
journal.fledu.uz 2019, №2 .
11.   Mengliyev   B   va   boshqalar.   O‘zbek   tilining   milliy   korpusi//Ma’rifat,   -
Toshkent, 2018.
12.   Mengliyev   B.   “Globallashuv:   tillar   taraqqiyoti   va   tanazzuli”.   “Ma’rifat”
gazetasi, 2017 yil, 19 oktabr, 76-son
13.   Qarshiyev   A.B.,   Tursunov   M.S.   “Matnlarni   statistik   tahlili   uchun   amaliy
dasturlar   majmuasi”//“Axborot   va   telekommunikatsiya   texnologiyalari
muammolari” ilmiy-texnik konferensiyaning ma’ruzalar to‘plami, II qism. –
Toshkent, 2015 .
14.   Qarshiyev   A.B.,   Tursunov   M.S.,   Xamiyev   A.   “O‘zbek   tilining   statistik
lug‘atlarini   tuzish   uchun   amaliy   dasturlar   yaratish”   //“Fan-ta’lim   va   ishlab
chiqarish   integratsiyada   axborot   kommunikatsiya   texnologiyalarni
qo‘llashning   hozirgi   zamon   masalalari”   respublika   ilmiy-texnika
anjumanining ma’ruzalar to‘plami, III qism. –Nukus, 2015.
15.   Rabbimov,   S.Umirova,   B.Xolmuxamedov.   O‘zbek   tili   korpusida   so‘z
turkumlarini   teglash   masalasi.   “O‘zbek   milliy   va   ta’limiy   korpuslarini
yaratishning nazariy hamda amaliy masalalari”. Vol.1.2021.
16.   Xamroyeva   Sh.   O‘zbek   tili   mualliflik   korpusini   tuzishning   lingvistik
asoslari.  PhD dissertatsiyasi,Buxoro, 2018.
17.   Ziyodulloyev   Sh.,   Eshmo‘minov   A.   Korpus   lingvistikasi.   //   Science   and
Education Scientific Journal October 2020 / Volume 1 Issue 7.
18.   O‘rinbayeva   D. Xalq og‘zaki ijodi: janriy-lisoniy va lingvostatistik tadqiq
muammolari PjD dis. Samarqand, 2019.
19.   Абдуллаев Д. Айрим соматик фраземалар// Мулоқот. 1997-йил 5-сон .
20.   Абдурахмонова Н.З. Инглизча матнларни ўзбек тилига таржима қилиш
дастурининг   лингвистик   таъминоти   (Содда   гаплар   мисолида).
Филол.фан.бўйича   фалсафа   доктори   (PhD)…дис.   афтореф.   –   Тошкент,
2018.
76 21.   Атабоев   Н.   Корпус   ва   компьютер   лингвистикасининг   фарқли
жиҳатлари.   /   Хорижий   филология.   http://samxorfil.uz/maqola/korpus
lingvistikasining asosiy xususiyatlari .
22.   Гулямова   Ш.   Корпус   лингвистикаси   –   замонавий   амалий
тилшуносликнинг устувор йўналиши.   https://uzjournals.edu.uz/buxdu/    .  
23.   Дониёров Х. Ўзбек тилининг миллий корпусида лексик синонимларни
бериш масаласи. / Хорижий филология. 2019 йил. №3-сон.
24.   Махмутова   М.К.   Проблемы   аннотирования   (тагирования)   текстов   в
корпусной   лингвистике   //   Выпускная   квалификационная   работа
ЮУрГУ. – Челябинск, 2018.
25.   Норов  А. Компьютер лингвистикаси асослари. – Қарши, 2017.
26.   Пўлатов А. Компьютер лингвистикаси. – Тошкент: Akademnashr, 2011 .
27.   Сайфуллаева   Р.,   Менглиев   Б.   ва   б.   Ҳозирги   ўзбек   адабий   тили.–
Тошкент: Фан ва технология, 2009 .
28.   Тоирова   Г .   Миллий   корпус   яратишнинг   технологик   жараёни
хусусида .   /   Scientific-methodological   electronic   journal   “Foreign
Languages in Uzbekistan”, 2020, No 2 (31), 57-64  https://journal.fledu.uz    .  
29.      Хидиров   O .     Миллий   корпус   учун   парсинг   дастури   яратишнинг
лингвистик асослари . PhD dissertatsiya avtoreferati. 2021.
30.   Хурсанов   Н.   Матнлар   корпусини   яратиш.   //   Образование   и
инновационные исследования. 2021. №4.
31.   Эшмўминов   А.   Ўзбек   тили   миллий   корпусининг   синоним   сўзлар
базаси.филол.фан.бўйича PhD dissetatsiyasi. –Termiz.  2019.
32.   Ўринбоева   Д.Б.   Ўзбек   фольклори   матнларининг   лингвостатистик
тадқиқи. – Тошкент: Фан, 2010.
33.   Rahmatullayev   Sh.   Hozirgi   adabiy   o‘zbek   tili.   Darslik.   –Toshkent:
Universitet, 2006.
34.   Xamroyeva   Sh.M.   Korpus   lingvistikasi   atamalarining   qisqacha   izohli
lug‘ati. Toshkent -2018.
77 35. O‘rinbayeva   D.B.,   Karshiyeva   D.U.   Kompyuter   lingvistikasidan   qisqacha
atamalar lug‘ati. Samarqand: 2018.
36.   Ал-Қуръон ал-Карим. Таржималар ва шарҳлар. –Тошкент: Фан, 2002 .
37.   История   корпусной   лингвистики.   (Электрон   ресурс)-
https://www.myfilology.ru/177/istoriyakorpusnoj-lingvistiki/ .
38.   Каримов   С.,   Қаршиев   А.,   Исроилова   Г.   Абдулла   Қаҳҳор   асарлари
тилининг   луғати.     Алфавитли   луғат.   –   Т:   «Ўзбекистон   миллий
энцеклопедияси» Давлат илмий нашриёти, 2007 .
39.   Курс   “Корпусная   лингвистика”   (А.Б.   Кутузов)   Лицензия   Creative
commons Attribution Share-Alike .
40.   Маматов   А.   Ўзбек   тилида   фразеологизмларнинг   шаклланиш
масалалари.-Тошкент: ЎТА.2001.3-сон.
41.   Раҳматуллаев   Ш.   Ўзбек   тилининг   изоҳли   фразеологик   луғати.   –
Тошкент:Ўқитувчи, 1978.
42.   Сайфуллаева   Р.,   Менглиев   Б.   ва   б.   Ҳозирги   ўзбек   адабий   тили.
– Тошкент: Фан ва технология, 2009 .
43.   Хожиев   А.   Лингвистик   терминларнинг   изоҳли   луғати.   –   Тошкент:
Ўқитувчи, 1985.
44.   Ўзбек тилининг изоҳли луғати. -Москва. 1981.
45.   Қуръони   карим   маъноларининг   таржима   ва   тафсири.Тошкент.
Ўзбекистон   Республикаси   Президенти   Администрацияси   ҳузуридаги
Ахборот ва оммавий коммуникациялар агентлиги “O‘zbekiston” НМИУ
ДУК, 2021 .
Internet saytlari:
46. .  http://dx.doi.org/10.26739/2181-9297-2021-1-25   
47. .  http://dx.doi.org/10.26739/2181-9297-2020-3-33   
48.   https://kun.uz/uz/news/2020/10/18/baxtiyor-mengliyev-ozbek-tilining-ham-
milliy-korpusi-yaratilishi-lozim   
78 49.   http://til.gov.uz/uz/news-and-announcements/news/237  
50.   https://uzjournals.edu.uz/buxdu  
51.   https://uz.wikipedia.org/wiki/Korpus  
52.   http://www.tuvancorpus.ru/?q=content/o-proekte  
53. http://www.manaviyat.uzpostview379   
54.   http://ruscorpora.ru .       
55. https://uzjournals.edu.uz/buxdu/vol4/iss4/9?utm_source=uzjournals.edu.uz   
%2Fbuxdu
%2Fvol4%2Fiss4%2F9&utm_medium=PDF&utm_campaign=PDFCoverPa
ges     
79

O‘ZBEK TILI MILLIY KORPUSIDA QUR’ONI KARIM MA’NOLARI TARJIMASINING LINGVISTIK TA’MINOTI (OLTINXON TO‘RA TAFSIRI ASOSIDA) Mundarija KIRISH…………………………………………………………………..……....3 I BOB. TILSHUNOSLIKDA KORPUS TUSHUNCHASI 1.1 Tilshunoslikda korpus lingvistikasi va milliy til korpuslari……….…..…8 1.2. Milliy korpus va mualliflik korpuslarining zamonaviy tilshunoslikdagi o‘rni…………………………………………………………………………..…19 I bob bo‘yicha xulosa..........................................................................................29 II BOB. “MUALLIFLIK KORPUSI” DASTURI USTIDA BAJARILADIGAN AMALLAR 2.1. Dasturiy majmuaning tuzilishi va tavsifi…………………………….…..31 2.2. Dasturiy majmuadan foydalanish tartibi va ish natijalari......................45 II bob bo‘yicha xulosa…....................................................................................51 III BOB. “MUALLIFLIK KORPUSI” DASTURIDA “AL-QUR’ON AL- KARIM” (tarjima va sharhlar) (Oltinxon To‘ra tarjima va tafsiri)NING LINGVISTIK TA’MINOTI 3.1. “Al-Qur’on Al-Karim” (Oltinxon To‘ra tarjima va tafsiri) ning tili va lug‘ati………………………………………………………………………..…52 3.2. “Al-Qur’on Al-Karim”dagi “Ko‘z” leksemasi bilan bog‘liq somatik frazemalarning semantik tahlili.......................................................................63 III bob bo‘yicha xulosa.....................................................................................74 UMUMIY XULOSALAR ……………………………………………………75 FOYDALANILGAN ADABIYOTLAR RO‘YXATI……………..…………78 0

Kirish M avzuning asoslanishi va uning dolzarbligi. Axborot texnologiyalari bugungi kunda har bir sohaga asosiy poydevor sifatida kirib bormoqda. Bugungi kunimizni kompyuter va Internetsiz tasavvur qilish qiyin. Qo‘limizdagi mitti telefon bizni dunyo bilan bog‘lay oladi. Undan faqatgina kundalik ehtiyojlar uchungina foydalanib qolmasdan, badiiy va ilmiy kitoblarni ham mutolaa qilishimiz, matn yoki kitobni bir tildan ikkinchi bir tilga tarjima qilishimiz, turli xil dasturlar yordamida so‘zning imlosini terkshirish, izohini bilishimiz ham mumkin bo‘lyapti. Kompuyuter texnologiyalaridan foydalanish tilshunoslik faniga ham kirib kelib, kompyuter lingvistikasining shakllanishiga zamin yaratdi. Jahon tilshunosligida kompyuter va korpus tilshunosligiga oid ilmiy qarashlar XX asrning 40-yillarida paydo bo‘lib, 60-yillarida jarayon jadallashdi. Natijada, XXI asr boshlarida millionlab so‘zlarni o‘zida aks ettiruvchi yuzlab til korpuslari paydo bo‘ldi. Ayni damda bir-biridan nutq turi, matn tili, janri, kirish usuli kabilar bilan farqlanuvchi Britaniya milliy korpusi, Amerika milliy koprusi, rus tili milliy korpuslari yaratildi. Dunyo bilan yuzlashayotgan Vatanimizda bugungi kunda hujjatlarni qog‘oz shaklidan elektron shaklga ko‘chirish, har bir sohani raqamlashtirish jarayoni ketmoqda. Axborot texnologiyalarini rivojlantirish maqsadida O‘zbekiston Respublikasi Prezidentining 2018-yil 19-fevraldagi PF- 5349-sonli “Axborot texnologiyalari va kommunikatsiyalari sohasini yanada takomillashtirish chora-tadbirlari to‘g‘risida”gi farmoni qabul qilingan. Bu farmon ijrosi nafaqat axborot texnologiyalari bilan ishlovchi soha vakillari uchun, balki lingvistlar uchun ham dasturulamaldir. Professor B.Mengliyev, tillarning tara q qiyoti va yashab qolishini kompyuter texnologiyalari sohasida, I nternet tizimida qo‘llanilish darajasi bilan bog‘laydi. Biz ona tilimiz – o‘zbek tilining taraqqiy etishini, uning o‘lik tilga aylanib qolmasligini istasak, o‘zbek milliy tili korpusini yaratishimiz bugungi globallashuv davrining muhim vazifasidir. Prezidentimiz Sh.Mirziyoyev o‘zbek tiliga davlat tili maqomi berilganligining 30 yilligiga bag‘ishlangan tantanali marosimdagi nutqida o‘zbek 1

tilini “xalqimiz uchun milliy o‘zligimiz va mustaqil davlatchiligimiz timsoli, bebaho ma’naviy boylik, buyuk qadriyatdir” 1 deb e’tirof etish bilan birga “O‘zbek tili Amerika Qo‘shma Shtatlari, Buyuk Britaniya, Germaniya, Fransiya, Shvetsiya, Rossiya, Ukraina, Xitoy, Yaponiya kabi davlatlarning 60 ga yaqin universiteti va 100 dan ziyod maktablarida o‘rganilmoqda” 2 , deb ta’kidlab o‘tgan. Bu ona tilimizning dunyoga tanilib borayotganiga misol bo‘la oladi. Bugungi kun tilshunosligining dolzarb vazifalaridan biri ona tilimizni boyitish va amaliy foydalanish samaradorligini oshirish barobarida uning zamonaviy axborot- kommunikatsiya tizimida keng qo‘llanilishiga erishishdir. O‘zbekiston Respublikasi Prezidentining 2019-yil 21-oktabrdagi “O‘zbek tilining davlat tili sifatidagi nufuzi va mavqeyini tubdan oshirish chora-tadbirlari to‘g‘risida”gi Farmonida “davlat tilining axborot va kommunikatsiya texnologiyalari, xususan, Internet jahon axborot tarmog‘ida munosib o‘rin egallashini ta’minlash, o‘zbek tilining kompyuter dasturlarini yaratish” 3 vazifasini belgilab bergan bo‘lib, ushbu vazifani bajarish bugungi kun tilshunoslari oldiga o‘zbek milliy korpusini yaratish, mualliflik korpuslarini tuzishning lingvistik asoslarini ishlab chiqish, lingvistik modellarni tuzish kabi bir qator kechiktirib bo‘lmas vazifalarni qo‘ydi. O‘zbekiston Respublikasi Prezidentining 2022-yil 28-yanvardagi “2022- 2026-yillarga mo‘ljallangan Yangi O‘zbekistonning Taraqqiyot strategiyasi to‘g‘risida”gi Farmoni hamda mazkur faoliyatga tegishli boshqa me’yoriy hujjatlarda belgilangan vazifalarni amalga oshirishda ushbu dissertatsiya ishi muayyan darajada xizmat qiladi. Tadqiqot obyekti va predmeti. Tadqiqot obyektini Qur’oni karimning Оltinxon To‘ra tomonidan amalga oshirilgan tafsiri; predmeti ni til korpusi, mualliflik korpusi, korpusi interfeysi, lingvistik razmetka tashkil etadi. 1 Президент Шавкат Мирзиёевнинг ўзбек тилига давлат тили мақоми берилганлигининг ўттиз йиллигига бағишланган тантанали маросимдаги нутқи. http://xs.uz/uz – Тошкент, 2019. 2 O‘sha manba 3 Ўзбекистон Республикаси Президентининг “Ўзбек тилининг давлат тили сифатидаги нуфузи ва мавқеини тубдан ошириш чора-тадбирлари тўғрисида”ги ПФ-5850-сон Фармони .// Халқ сўзи, 2019, 22 октябрь. № 218(7448) 2

Magistrlik ishining maqsadi va vazifalari. Qur’oni karimning Оltinxon To‘ra tomonidan amalga oshirilgan tafsirining korpusini yaratish tadqiqotning maqsadi hisoblanadi. Dissertatsiyada ko‘zda tutilgan maqsadni amalga oshirish uchun quyidagilar vazifalarga e’tibor qaratildi: – mualliflik korpuslarining mushtarak va farqli jihatlari tadqiq etish; – А .P.Chexov va Abdulla Qahhor asarlari korpusi misolida mualliflik korpusi tajribasini o‘rganish; – Oltinxon To‘ra korpusi interfeysining dizayn, qidiruv tizimi, ma’lumotlar bazasi oynasi kabi xususiyatlarini tavsiflash; – Qur’oni karimning Oltinxon To‘ra tafsiri misolida so‘zshakllarning chastotasini tuzish; – Qur’oni karimning Oltinxon To‘ra tafsiri misolida “ko‘z” leksemasi bilan bog‘liq somatik frazemalarni semantik tahlil qilish; Tadqiqotning ilmiy yangiligi quyidagilardan iborat: “Al-Qur’on Al-Karim” (Oltinxon To‘ra tarjima va tafsiri)ning 1994-yilda nashrdan chiqqan birinchi nashri asosida kitobning elektron shakli yaratilgan; Oltinxon To‘ra tafsirdagi so‘zlar asosida konkordans tuzish, N-grammlar hosil qilish, chastotali lug‘at tuzishga mo‘ljallangan “Mualliflik korpusi” dasturiy ta’minoti ishlab chiqilgan va unga O‘zbekiston Respublikasi Adliya Vazirligi huzuridagi Intellektual mulk agentligi tomonidan № DGU 15257 raqamli guvohnoma berilgan; tadqiqotda “Ixlos” surasining Oltinxon To‘ra va shayx Abdulaziz Mansur tomonidan qilingan o‘zbekcha tarjima matnlari qiyoslangan va morfologik razmetkalangan; “Ko‘z” komponentli iboralar semantik jihatdan tahlil etilgan. Tadqiqotning asosiy masalalari va farazlari. Korpus yaratish uch bosqichda taraqqiy etgan. Xususan, birinchi avlodi elektron kutubxona shaklida, ikkinchi avlodi matnni qayta ishlay olish, yangi davrda esa hajman katta, ammo sodda tegli korpuslar yaratilgan. Zamonaviy rus, ingliz, turk, tojik tili 3

korpuslarining umumiy xususiyatlari mushtarak bo‘lib, farqli tomonlari so‘z miqdori va lingvistik tahlil imkoniyatida kuzatildi. Tadqiqotning asosiy mazmuni bo‘yicha o‘tkazilgan Respublika miqyosidagi ilmiy konferensiya to‘plamlarida 1 ta, xalqaro ilmiy-amaliy konferensiya materiallarida 2 ta maqola e’lon qilindi. “Mualliflik korpusi” dasturi uchun O‘zbekiston Respublikasi Adliya vazirligi huzuridagi Intellektual mulk agentligining №DGU 15257 raqamli guvohnomasiga ega bo‘lgan. Tadqiqot mavzusi bo‘yicha adabiyotlar sharhi (tahlili) . Jahon tilshunosligida korpus lingvistikasi o‘tgan asrning 60-yillarida o‘rganish obyektiga aylangan. Dastlab, R.G.Piatrovskiy tomonidan fikrlar aytilgan bo‘lsa ham, lekin korpus sohasidagi maqsadli tadqiqotlar 40-yillarda Blumfild, Frays va Bondjerslar tomonidan boshlanganligini aytib o‘tish joiz. Braun korpusi (1961-1964), 1980- yilda yaratilgan ingliz tili banki loyihalari e’tiborga molik ishlar hisoblanadi. Rus tilshunosligida V.P.Zaxarov, A.B.Kutuzov, Ye.V.Nedoshivina, V.V.Rikov, V.Plungyanlar korpus, uning turlari, o‘ziga xos xususiyati, korpusning ijtimoiy ahamiyati, korpus tuzish tamoyillari borasida tadqiqot olib borganlar. Mualliflik korpuslari O.V.Kukushkina, A.A.Polikarpov, Ye.V.Surovtsevalar tomonidan tadqiq etilgan. O‘zbek tilshunosligida kompyuter lingvistikasi, matnga leksikografik ishlov berish va lingvostatistik tahlil etish borasida birmuncha tadqiqotlar amalga oshirilgan. А .Po‘latov, H.Orziqulov, S.Muhamedov, M.Ayimbetov, S.Muhamedova, S.Karimov, G.Jumanazarova, A.Babanarov, D.O‘rinbayeva, N.Abdurahmonova, A.Norov va boshqalarning kuzatishlarini ana shunday ishlar sifatida qayd etamiz. Bu tadqiqotlar matnni innovatsion yondashuv–kompyuter lingvistikasi yutuqlari yordamida leksikografik va lingvostatistik tadqiq etishning zamonaviy usullarini tavsiya etganligi bilan dolzarblik kasb etgan. Bundan tashqari, 2018-yilda Buxoro davlat universitetida Sh . Xamroyeva “O‘zbek tili mualliflik korpusini tuzishning lingvistik asoslari” PhD dissertatsiyasini himoya qilgan. Dissertatsiyada korpus lingvistikasining shakllanishi, taraqqiyoti va nazariy asoslari haqida, mualliflik korpusini tuzishning 4