MATNLARNI AVTOMATIK TAHRIRLASH
MA TN LA RN I AV TOMA TIK TA HRIRLASH Reja: 1. Avtomatik tahrir yo‘nalishi. 2. Matn tahirini amalga oshirish jarayoni 3. Nogrammatik ifodalar. 4. Avtomatik tahrir jarayonida avtomatik tizimlardan foydalanish. 5. Kompyuter lingvistikasida mavjud avtomatik tizimlar. 6. Boris tizimining ishlash prinsipi. 7. Ma’lumotlar bazasini yaratish.
Avtomatik tahrir kompyuter lingvistikasining asosiy yo‘nalishlaridan biri bo‘lib, u kompyuterdagi matn muharrirlari Microsoft Word, Excel, Wordpad, Lexicon) rivojlanshi bilan bog‘liqdir. Bilamizki, avtomatik tahrir deganda matndagi mexanik xatolarning avtomatik tarzda to‘g‘rilanishi va xato ekanligi haqidagi signallarning userga taklif etilishi kabilar bilan bog‘liq. Aniq misollar bilan tushuntiriladigan bo‘lsa, Microsoft Word dasturi bilan ishlar ekanmiz, unda so‘zlarning-yozilishi bilan bog‘liq xatolar bo‘lsa, ularning ostiga qizil yoki ko‘k rangda chizilishi, katta harf bilan yozilishi kerak bo‘lgan so‘zlarning avtomatik bosh harfga o‘tkazilishi, hujjatga avtomatik numeratsiya qo‘yilishi kabilar avtomatik tahrir erishgan yutuqlar hisoblanadi. Avtomatik tahrir yo‘nalishi XX asr o‘rtalariga kelib rivojlandi. U matn muharrir dasturlari bilan birgalikda yangicha imkoniyatlar bilan, qo‘shimcha effektlar bilan rivojlanmoqda. Oddiy muharrirlardan farqi shun daki, unda tahrir avtomatik tarzda qisqa vaqt birligi ichida hajman katta bo‘lgan matnni tez tekshirish va xatolarni to‘g‘rilash imkoniyati bo‘ladi. Avtomatik tahrirning pragmatik ahamiyati shundaki, u kelajakda taraqqiy etsa, yetarli ma’lumotlar bazasi yaratilsa va maxsus dasturlar ishlab chiqil-sa, muharrir kasbi uchun ehtiyoj qolmaydi. Bu esa matn bilan ishlashni osonlashtiradi.
Ma’lumki, kompyuter yaratilmasdan ilgari matnlar yozuv mashinkalarida terilgan, bu jarayonda orfografik, punktuatsion, stilistik va Grammatik xatolarga yo‘l qo‘yilsa, matnni boshdan oxirigacha qayta yozib chiqishga to‘g‘ri kelgan, bu csa foydalanuvchiga noqulaylik tug‘dirgan. Kompyuterda esa matnni tahrirlash birmuncha qulay bo‘lib, unda foydalanuvchi dialogli rejimda ishlaydi va o‘z o‘rnida xatolarni to‘g‘rilash imkoniyatiga ega bo‘ladi. Hatto matn bilan ishlash jarayonida biz yuqorida ta’kidlab o‘tgan avtomatik tahrirlash, xatolarni to‘g‘rilash imkoniyati ham mavjud. Shu o‘rinda alohida ta’kidlash zarurki, avtomatik tahrirlash tizimi faqat matn muharrirlari dasturlari bazasiga qo‘shilgan tillarda amal qiladi, masalan, ingliz, rus, nemis, fransuz tillarida. Agar bazada mavjud bo‘lmagan tilda matn kiritilsa, uni avtomatik tahrirlay olmaydi, ayrim internatsional so‘zlar bundan mustasno. Avtomatik tahrirlash jarayonida MS Word lug‘atida mavjud bo‘lmagan so‘z uchrasa, ostiga qizil chiziq bilan ajratib ko‘rsatiladi. Mazkur holat quyidagi sababga ko‘ra bo‘lishi mumkin, bunda o‘sha so‘z imlosi haqida dastur variant taklif eta olmaydi, chunki Ms Word lug‘atida bu so‘z mav jud emas. Ehtimol u so‘z tog‘ri yozilgan bo‘lishi mumkin, bunda insonning ishtiroki zarur bo‘ladi. Agar so‘zning imlosi to‘g‘ri bo‘lsa, matnda yana tez-tez qayta ishlalilsa, uning avtokorreksiyada to‘g‘ri deb sanalishi uchun Ms Word lug‘atiga «kiritib qo‘yish» (kontekst menyudagi «add» yoki «добавить» komandasi yordamida)
mumkin. Matn kiritish davomida so‘z yoki so‘zlar birikmasi ko‘k chiziq bilan ajratib qo‘yiladi, bunda so‘zning imlosida xato mavjud. Bu holda foydalanuvchi xatoni o‘zi tog‘rilab qo‘yishi zarur yoki ostiga chizilgan so‘zda sichqonchaning o‘ng tomoni bosilsa, kontekst menyusida so‘zning to‘g‘ri varianti taklif etiladi va uni tanlashi zarur bo‘ladi. Avtomatik tahrirlash tizimi juda ko‘p amaliy vazifalarni o‘z ichiga oladi. Bu vazifalarning eng asosiylarini umumlashtirib sanab o‘tmoqchimiz: orfografiyani tekshirish; grammatika va stilistikani tekshirish; kontekstli qidiruv; formatlash; avtomatik referatlash - matndagi kalit so‘zlar asosida uning umumiy mundarijasini yaratish; matn ichiga jadval, rasm, turli figuralar, klip-artlar, grafik sxemalar, diagrammalar qo‘shish, giperhavolalar bilan ta’minlash; matndagi abzaslar, belgilar, so‘zlarning aniq miqdorini aniqlash (statistikasini ko‘rsatish); tezaurus xizmati - matndagi muayyan so‘zning sinonimik variantlarini aniqlash; * transliteratsiyalash - bir alifbodan boshqa alifboga o‘tkazish (masalan, kirill alifbosidan lotin alifbosidagi harfga almashtirish).
Avtomatik tahrirda uch tarkibli asosiy vazifa e’tiborga olinishi lozim: 1. Orfografiyani tekshirish - bu vazifa morfologik tahlil yordamida amalga oshiriladi, bunda etalon lug‘atdagi baza asosida tekshiriladi. 2. Sintaksisni tekshirish orfografiyani tekshirishdan ko‘ra murakkabroq. Chunki orfografiyani tekshiruvchi dasturlar yaratilgan, lekin norasmiy matnlarning sintaktik jihatdan avtomatik tahriri masalasi haligacha hal etilgani yo‘q. Rasmiy matnlarning avtomatik tahriri bo‘yicha muhim natijalarga erishilgan. 3. Semantik tahrirlash inson tafakkurini modellashtirishga asoslangan sun’iy intellekt tizimi bilan bog‘liq ravishda o‘rganilmoqda. Bunda mazkur ko‘p aspektli muammoni semantik maydon, freym yondashuv, tezauruslar tizimini boyitish, so‘z va so‘z birikmalari o‘rtasidagi paradjgmatik-munosabatlar (sinonimiya, gipo-giperonimik-tur-jins munosabati)ni modellashtirishga tatbiq etish asosida hal etisn mumkin. Chunki inson bunday assotsiatiy munosabatlarni o‘z intellek’tiga tayanib o‘rnata oladi, biroq bu jarayon kompyuter uchun murakkabdir. Ms Word dasturida orfografiyani tekshirish imkoniyati cheklanganligi bois hozirgi kunda maxsus Spell Checker dasturlar yaratilmoqda. Bundау dasturlar sirasiga quyidagilarni kiritish mumkin: SpellLink Multilingual Yevro ingliz, ispan, italyan, nemis,