logo

Matnlar bilan ishlovchi vositalar. Matn muharrirlari. Nashriyot tizimi vositalari. Elektron lug’atlar. Belgilarni optik tanish vositalari. Tarjimon dasturlar

Загружено в:

08.08.2023

Скачано:

0

Размер:

50.2021484375 KB
Matnlar bilan ishlovchi vositalar. Matn muharrirlari. Nashriyot tizimi vositalari.
Elektron lug’atlar. Belgilarni optik tanish vositalari. Tarjimon dasturlar.
Reja:
1. Matnlar bilan ishlovchi vositalar
2. Matn muharrirlari
3. Belgilarni optic tanish vositalari
4.  Multimedia vositalari.
5. Multimediali o’qitish texnologiyalari
1 Kompyuterda   matnli   ma'lumotlarni   qayta   ishlash   uchun   umumiy   maqsadli
dasturlar - matn muharrirlari qo'llaniladi.
Zamonaviy   matn   protsessorlari   foydalanuvchiga   hujjatlarni   tayyorlash   uchun   keng
imkoniyatlar  yaratadi.   Bular   tahrirlash   funktsiyalari  bo'lib,  ular  bitta  hujjat   ichida  va
turli   hujjatlar   o'rtasida   bo'laklarni   har   qanday   o'zgartirish,   qo'shish,   almashtirish,
nusxalash   va   ko'chirish,   kontekst   bo'yicha   qidirish,   belgilar   formatlash,   paragraflar,
sahifalar, hujjat bo'limlari, tartib, grammatika va imlo, oddiy bilan birga foydalanish
imkonini   beradi.   ro'yxatlar,   jadvallar,   rasmlar,   grafiklar   va   diagrammalarning   matn
elementlari.
Matn   muharriri   yordamida   kompyuterda   hujjatlar   yaratish   uchun   axborotni   qayta
ishlash   texnologiyasini   o'zlashtirish   kerak,   tamom.Ushbu   ishning   dolzarbligi   -   matn
muharrirlari   juda   qiziqarli   mavzu   bo'lib,   unda   siz   matnli   ma'lumotlarni   qayta
ishlashning   barcha   xususiyatlari   va   chiplarini   ochib   berishingiz   mumkin.   Har   yili
ishni   yaxshilash,   samaradorlik,   tezlik   va   qulaylikni   oshirish   uchun   yangi   dasturlar
yaratiladi.
Ishning   maqsadi   matnli   ma'lumotlarni   qayta   ishlashning   asosiy   vositalari   va
texnologiyalarini   ko'rsatish,   Microsoft   Word   matn   protsessorining   funksionalligini
o'rganishdir.
Vazifalar:
 Matn muharrirlarini ko'rib chiqing;
 Matn protsessorlarining imkoniyatlarini o'rganing;
 Microsoft Excel-da vazifalar qanday hal qilinishini ko'ring.

   Matn muharrirlari.
Har bir kompyuter foydalanuvchisi  u yoki bu matnli axborotni tayyorlash, tahrirlash
zarurati   bilan   duch   keladi.   Kompyuter   uchun   yaratilgan   dastlabki   dasturlardan   biri
matnni qayta ishlash tizimlari yoki ularni matn muharrirlari deb atalgan.
2 Matn   protsessorlari   bilan   jihozlangan   kompyuterlar   yozuv   mashinkalarini
almashtirishi   kerak   edi.   Shunga   ko'ra,   birinchi   bunday   dasturlarda   belgilar   kiritish,
oddiy   matnni   tahrirlash   (o'chirish,   ko'chirish,   nusxalash   va   joylashtirish)   va   natijada
olingan   hujjatni   chop   etish   funktsiyalari   mavjud   edi.   Yozuv   mashinkasidan   farqi
tayyor   matnni   saqlash   va   keyin   uni   qayta   ishlatish   qobiliyati   edi.   Biroq,   yozuv
mashinkasining   funktsiyalarini   amalga   oshirish   kompyuter   foydalanuvchilarini
qoniqtira olmadi.   Matn muharrirlarining rivojlanishi juda tez kechdi.   Bundan tashqari,
matbaa   (nashr   qilish)   kompyuter   dasturlarini   ishlab   chiqish   parallel   ravishda
boshlandi.   Turli tizimlarni ishlab chiquvchilarning g'oyalari va kashfiyotlari bir-birini
to'ldirib,   bir-birini   "oziqlantirdi",   natijada   nafaqat   kuchli   bosma   dasturlar,   balki
"maishiy" matn muharrirlari ham paydo bo'ldi.   ular o'zlarining qobiliyatlari jihatidan
professionallardan bir oz pastroqdir.   Ushbu dasturlarning imkoniyatlari har xil - oddiy
tuzilishdagi   kichik   hujjatlarni   tayyorlash   dasturlaridan   tortib,   nashriyot   nashriyoti
kitob va jurnallarni (nashriyot tizimlari) bosma nashriyotga terish, loyihalash va to'liq
tayyorlash   dasturlarigacha.   Maxsus   matn   protsessori   (muharriri)   bilan   jihozlangan
kompyuterning   yozuv   mashinkasiga   nisbatan   afzalliklari   yaqqol   ko‘rinib   turardi   va
ular  qulaylik, mehnat  unumdorligini sezilarli darajada oshirish, eng muhimi, olingan
hujjatlar sifatini oshirishni ta’minlaganligidan iborat edi.   nashriyot nashriyoti kitoblar
va   jurnallarni   (nashriyot   tizimlari)   loyihalash   va   bosmaxonaga   to'liq
tayyorlash.   Maxsus   matn   protsessori   (muharriri)   bilan   jihozlangan   kompyuterning
yozuv   mashinkasiga   nisbatan   afzalliklari   yaqqol   ko‘rinib   turardi   va   ular   qulaylik,
mehnat   unumdorligini   sezilarli   darajada   oshirish,   eng   muhimi,   olingan   hujjatlar
sifatini   oshirishni   ta’minlaganligidan   iborat   edi.   nashriyot   nashriyoti   kitoblar   va
jurnallarni (nashriyot tizimlari) loyihalash va bosmaxonaga to'liq tayyorlash.   Maxsus
matn   protsessori   (muharriri)   bilan   jihozlangan   kompyuterning   yozuv   mashinkasiga
nisbatan   afzalliklari   yaqqol   ko‘rinib   turardi   va   ular   qulaylik,   mehnat   unumdorligini
sezilarli   darajada   oshirish,   eng   muhimi,   olingan   hujjatlar   sifatini   oshirishni
ta’minlaganligidan iborat edi.
3  Matn   muharrirlari   matnli   hujjatlarni   yaratish   va   tahrirlash   uchun
mo ljallangan   dasturlardir.ʻ   Matnni   tahrirlash   -   bu   matn   ustidagi   ichki
(semantik) va tashqi (dizayn) ishlarni bajarish uchun operatsiyalar majmuasidir.
Matn muharrirlarining   har xil turlari mavjud   :
 Muharrirlar   faqat   testni   o'z   ichiga   olgan   hujjatlarni   tayyorlash   uchun
mo'ljallangan   (masalan,   Notepad).   Bunday   muharrirda   yaratilgan   hujjatning
baytdagi   hajmi   hujjatdagi   belgilar   (harflar)   soniga   teng.   Bunday   matn
muharrirlaridan   dastur   matnlarini   tahrirlash   va   HTML   hujjatlarini   tayyorlash
uchun foydalanish mumkin.
 Matnni   tahrirlash   va   formatlash   (formatlash)   mumkin   bo'lgan   muharrirlar
(masalan,   WordPad).   Bunday   muharrirlarda   tayyorlangan   hujjatlar   nafaqat
matn belgilarini, balki ularning formati, ya'ni taqdimot shakli (o'lchami, kursiv
va tagiga chizilgan va boshqalar) haqidagi ma'lumotlarni ham o'z ichiga oladi.
 Murakkab   hujjatlarni   tayyorlash   imkonini   beruvchi,   ya'ni   nafaqat   matn,   balki
boshqa   ob'ektlar   -   rasmlar,   diagrammalar,   tovushlar   va   boshqalarni   o'z   ichiga
olgan muharrirlar.   Bunday muharrirlar odatda matn protsessorlari deb ataladi.
 Matn muharriri Lexicon.
Lexicon   matn   muharriri   rus   va   ingliz   tillarida   matnli   oddiy   hujjatlarni   qayta   ishlash
uchun mo ljallangan.
ʻ   LEKSIKON quyidagi   matn tahrirlash   funksiyalariga ega:
 matnni ko'rish va tahrirlash;
 matnni avtomatik formatlash;
 matnni avtomatik sahifalash;
 matn parchalarini bir joydan ikkinchi joyga ko‘chirish;
 hujjat bo'limlari uchun mundarijani yaratish;
 bir vaqtning o'zida bir nechta hujjatlarni tahrirlash;
4 WordPad matn muharriri.
Word   Pad   Editor   -   bu   juda   uzun   matnlarni   yaratish   va   tahrirlash   imkonini   beruvchi
matn   muharriri.   Windows   bilan   ta'minlangan   Word   Pad   muharriri   etarlicha   kuchli
emas, lekin kundalik vazifalarning aksariyati - xat yozish, talaba inshosi, tabriknoma
tayyorlash - Word Pad juda yaxshi bajariladi.
WordPad bilan:
 shriftlar bilan ishlash, turli shrift uslublari va ranglarini ishlatish;
 matnlarni   o'zining   formatida   va   boshqa   mashhur   formatlarda   (shu   jumladan
Microsoft Word formatida) saqlash;
 matnga turli formatdagi tasvirlarni kiritish.
 Word Perfect matn muharriri.
Word   Perfect   matn   muharriri   kompyuter   olamidagi   eng   mashhur   matn
muharrirlaridan   biridir.   Word   Perfect   juda   noodatiy   xususiyatlar   to'plamiga
ega.   Uning asosidagi bir xil universal tamoyillardan foydalangan holda, bir tomondan,
oddiy   hujjatlarni   qayta   ishlash,   boshqa   tomondan,   murakkab   tuzilishga   ega   bo'lgan
matnlar, rasmlar, jadvallar va boshqalarni tayyorlash juda oson.  
Word Perfect muharririning asosiy xususiyatlaridan ba'zilari:
 barcha an'anaviy matn tahrirlash amallarini o'z ichiga oladi  
 har doim matn formatini qo'llab-quvvatlaydi  
 o'rnatilgan belgilarning keng doirasiga ega
 avtomatik ravishda tarkibni, raqamlar va adabiyotlar ro'yxatini, turli indekslarni
yaratish, sarlavha va altbilgilarni qo'yish va hokazolarni yaratish mumkin.
 matematik   formulalarni   turadi,   matnga   rasm,   grafik,   jadval   va   hokazolarni
kiritadi.
 Matn muharriri Microsoft Word 6.0.
Microsoft   Word   6.0   kuchli   matn   protsessori   bo'lib,   matnni   qayta   ishlashning   barcha
jarayonlarini bajarishga mo'ljallangan: matn terish va joylashtirishdan tortib to imloni
5 tekshirish,   *.pcx   yoki   *.bmp   standartidagi   matnga   grafiklarni   kiritish,   matnni   chop
etish.   U   ko'plab   shriftlar   bilan   ishlaydi,   ham   rus,   ham   dunyoning   yigirma   bir
tillari.   Word-ning   ko'plab   foydali   xususiyatlaridan   biri   chegaralar   bo'ylab   avtomatik
matnni   tuzatish,   so'zlarni   avtomatik   o'rash,   shuningdek,   so'zlarning   imlo   tekshiruvi,
matnni ma'lum bir vaqt oralig'ida saqlash, matn yaratishga imkon beradigan sehrgarlar
va   shablonlarning   mavjudligini   o'z   ichiga   oladi.   ish   xati,   faks,   bir   necha   daqiqada
avtobiografiya,   jadval,   kalendar   va   boshqalar.   Word   berilgan   so'z   yoki   matn
fragmentini   qidiradi,   uni   belgilangan   fragment   bilan   almashtiradi,   o'chiradi,   ichki
buferga   ko'chiradi   yoki   shrift   bilan   almashtiradi;   shrift   yoki   shrift   o'lchami,
shuningdek   yuqori   yoki   pastki   belgilar.   Matnda   xatcho'pning   mavjudligi   matndagi
ko'milgan joyga tezda o'tish imkonini beradi.   Shuningdek, matnga avtomatik ravishda
yaratilgan sana, vaqt, qaytish manzili va matnni yozgan shaxsning ismini kiritishingiz
mumkin.   Makros buyruqlar yordamida Word matnga ma'lumotlar bazalari yoki grafik
ob'yektlarni, *.wav formatidagi musiqa modullarini kiritish imkonini beradi.   Hujjatga
kirishni   cheklash   uchun   siz   Word   matnni   yuklaganda   so'raladigan   matnga   parol
o'rnatishingiz   mumkin,   bu   matnda   biron   bir   harakatni   amalga   oshirish   uchun.   Word
bir   vaqtning   o'zida   bir   nechta   matnlar   bilan   ishlash   uchun   ko'plab   oynalarni   ochish,
shuningdek,   bitta   faol   oynani   gorizontal   ravishda   ikkiga   bo'lish   va   ularni   tekislash
imkonini   beradi.   Matnda   xatcho'pning   mavjudligi   matndagi   ko'milgan   joyga   tezda
o'tish imkonini beradi.   Shuningdek, matnga avtomatik ravishda yaratilgan sana, vaqt,
qaytish   manzili   va   matnni   yozgan   shaxsning   ismini   kiritishingiz   mumkin.   Makros
buyruqlar   yordamida   Word   matnga   ma'lumotlar   bazalari   yoki   grafik   ob'yektlarni,
*.wav   formatidagi   musiqa   modullarini   kiritish   imkonini   beradi.   Hujjatga   kirishni
cheklash uchun siz Word matnni yuklaganda so'raladigan matnga parol o'rnatishingiz
mumkin,   bu   matnda   biron   bir   harakatni   amalga   oshirish   uchun.   Word   bir   vaqtning
o'zida   bir   nechta   matnlar   bilan   ishlash   uchun   ko'plab   oynalarni   ochish,   shuningdek,
bitta   faol   oynani   gorizontal   ravishda   ikkiga   bo'lish   va   ularni   tekislash   imkonini
beradi.   Matnda   xatcho'pning   mavjudligi   matndagi   ko'milgan   joyga   tezda   o'tish
6 imkonini   beradi.   Shuningdek,   matnga   avtomatik   ravishda   yaratilgan   sana,   vaqt,
qaytish   manzili   va   matnni   yozgan   shaxsning   ismini   kiritishingiz   mumkin.   Makros
buyruqlar   yordamida   Word   matnga   ma'lumotlar   bazalari   yoki   grafik   ob'yektlarni,
*.wav   formatidagi   musiqa   modullarini   kiritish   imkonini   beradi.   Hujjatga   kirishni
cheklash uchun siz Word matnni yuklaganda so'raladigan matnga parol o'rnatishingiz
mumkin,   bu   matnda   biron   bir   harakatni   amalga   oshirish   uchun.   Word   bir   vaqtning
o'zida   bir   nechta   matnlar   bilan   ishlash   uchun   ko'plab   oynalarni   ochish,   shuningdek,
bitta   faol   oynani   gorizontal   ravishda   ikkiga   bo'lish   va   ularni   tekislash   imkonini
beradi.   *.wav   formatidagi   musiqa   modullari.   Hujjatga   kirishni   cheklash   uchun   siz
Word   matnni   yuklaganda   so'raladigan   matnga   parol   o'rnatishingiz   mumkin,   bu
matnda   biron   bir   harakatni   amalga   oshirish   uchunMatn   protsessorini   asosiy   menyu
buyruqlari,   kontekst   menyusi   buyruqlari   va   asboblar   paneli   yordamida   boshqarish
mumkin.
Har bir asosiy menyu bandi matn muharririda turli amallarni bajarish uchun o'zining
pastki menyusini o'z ichiga oladi.
 Notepad++ matn muharriri.
Notepad++   -   bu   keng   ko'lamli   dasturlash   tillari   uchun   sintaksisni   qo'llab-
quvvatlaydigan   matnli   fayl   muharriri.   Dastur   keng   imkoniyatlarga   ega   va   protsessor
resurslarining minimal iste'moli bilan tavsiflanadi.
 Notepad   dasturi   kichik,   50   kilobaytgacha   bo'lgan,   formatlanmagan   matnlarni
yaratish   uchun   mo'ljallangan   matn   protsessoridir.   Yaratilgan   fayllar   1251
Windows kodlar jadvalida *.txt matn formatida
Notepad++   ning   ilg'or   xususiyatlari   orasida   matnni   ajratib   ko'rsatish   imkoniyati   va
dasturlash   tili   sintaksisiga   ko'ra   bloklarni   yig'ish   imkoniyati   mavjud.   Foydalanuvchi
dasturlash   tilining   sintaksisini   mustaqil   ravishda   belgilashi   mumkin.   Orqa   yorug'lik
rejimini   o'rnatish   mumkin.   Direktivlar   va   dasturlash   tili   operatorlarining   ranglarini
ajratib ko'rsatish mavjud.
7 Notepad++ bir vaqtning o'zida bir nechta hujjatlarni ko'rish va tahrirlash imkoniyatini
beradi.   Shuningdek,   siz   bir   xil   hujjatni   turli   joylarda   joylashgan   ikkita   displey
oynasida   ko'rishingiz   va   tahrirlashingiz   mumkin.   Bitta   ko'rish   oynasidagi   hujjatga
o'zgartirish avtomatik ravishda ikkinchi ko'rish oynasiga o'tkaziladi (ya'ni, siz ikkinchi
ko'rish oynasida klonga ega bo'lgan bitta hujjatni tahrir qilyapsiz).
Notepad++ ning boshqa xususiyatlari:
 Yozilgan so'zni avtomatik to'ldirish.
 O'zingizning   API   funktsiyalari   ro'yxatini   yaratish   qobiliyati   (yoki   uni   yuklab
olish sahifasidan yuklab oling).
 Oddiy ifodalarni topish/almashtirishni qo'llab-quvvatlash.
 Matn qismlarini sudrab olish uchun to'liq yordam.
 Ko'rish oynalarining dinamik o'zgarishi.
 Fayl   holatini   avtomatik   aniqlash   (faylni   boshqa   dastur   tomonidan   o'zgartirish
yoki o'chirish to'g'risida bildirishnoma - faylni qayta yuklash yoki uni dasturdan
o'chirish imkoniyati bilan).
 Kattalashtirish va kichiklashtirish (masshtablash).
 Ko'p sonli tillarni qo'llab-quvvatlash.
 Dasturlar   ro'yxati   rangli   chop   etilishi   mumkin   -   tahrirlash   oynasida   ekranda
ko'rganingizdek.
 Hujjat eslatmalari.
 Matnni tahrirlashda qavslarni belgilang.
 Makroyozuv va bajarish.
 Ko'pincha   bloknot   veb-sahifalar   uchun   HTML   kodini   tekshirish   va   ba'zi
hollarda   yozish   uchun   ishlatiladi.   Buning   sababi,   bloknot   o'z   fayliga   faqat   sof
belgilar   kodini   formatlashsiz   yozadi,   bu   dasturchilar   uchun   juda   qulaydir.   Va
ba'zida u kichik o'lchamli, ammo mazmuni muhim bo'lgan .dll, .inf, .cfg va .bat
fayllarini ko'rishdir.
8  Microsoft Word matn muharriri.
Microsoft   Word   matn   muharriri   bugungi   kunda   eng   yaxshi   professional   so'zlarni
qayta ishlash dasturlaridan biridir.   Bu shuningdek, kitoblar va davriy nashrlarni terish
va joylashtirish uchun foydalanuvchilarga qulay nashriyot tizimidir.  
Microsoft   Office     -   bu   hujjatlar   bilan   turli   operatsiyalarni   bajarish   uchun
mo'ljallangan paket.   Shunga o'xshash funktsiyalarga ega bo'lgan boshqa dasturlardan
farqli   o'laroq,   Microsoft   Office-ga   kiritilgan   ilovalar   bitta   tizimga   birlashtirilgan
bo'lib,   bu   ularning   turli   xil   elementlarni   o'z   ichiga   olgan   hujjatlar   bilan   samarali
ishlashini   ta'minlaydi   (masalan,   Word   hujjatida   Excel   elektron   jadvali   va   Access
ma'lumotlar bazasining bir qismi bo'lishi mumkin. ).
Word     matn   va   grafiklarni   tahrirlash,   veb-sahifalarni   yaratish   va   hujjatlarni   qayta
ishlash uchun mo'ljallangan ko'p funktsiyali dastur bo'lib, unga hatto audio va video
qismlarini ham kiritish oson.   Word yordamida deyarli har qanday hujjat yaratish, uni
elektron shaklda nashr qilish yoki qog'oz nusxada chop etish mumkin.
OCR texnologiyasining hozirgi holati   [   tahrir        |   kodni tahrirlash        ]
Chop   etilgan   matndagi   lotin   harflarini   aniq   tanib   olish   hozircha   faqat   skanerlangan
bosma   hujjatlar   kabi   aniq   tasvirlar   mavjud   bo‘lgandagina   mumkin.   Muammoning
ushbu formulasi bilan aniqlik 99% dan oshadi, mutlaq aniqlikka faqat keyingi insoniy
tahrir orqali erishish mumkin.   Qo'lda yozilgan "bosma" va standart qo'lyozma matnni,
shuningdek,   boshqa   formatdagi   bosma   matnlarni   (ayniqsa,   juda   ko'p   belgilar   bilan)
tanib olish muammolari hozirda faol tadqiqot mavzusidir.
Usullarning aniqligi  bir  necha usul  bilan o'lchanishi  mumkin va shuning uchun juda
katta   farq   qilishi   mumkin.   Misol   uchun,   agar   mavjud   bo'lmagan   so'zlarni   qidirishda
tegishli dasturiy ta'minot uchun ishlatilmaydigan maxsus so'z uchrasa, xatolik ortishi
mumkin.
9 Onlayn   belgilarni   aniqlash   ba'zan   optik   belgilarni   aniqlash   bilan   aralashib
ketadi.   Ikkinchisi   matnni   ko'rsatishning   statik   shakli   bilan   ishlaydigan   oflayn   usul
bo'lib,   onlayn   belgilarni   aniqlash   esa   yozish   paytidagi   harakatlarni   hisobga
oladi.   Masalan, PenPoint OS yoki planshet kompyuter yordamida onlayn tanib olishda
siz chiziq o'ngdan chapga yoki chapdan o'ngga yozilganligini aniqlashingiz mumkin.
Tez orada qo'l yozuvini tanib olish uchun onlayn tizimlar yaqinda tijorat mahsulotlari
sifatida   mashhur   bo'ldi.   Bunday   qurilmalarning   algoritmlari   kirish   liniyalarining
alohida   bo'limlarining   tartibi,   tezligi   va   yo'nalishi   ma'lum   bo'lishidan
foydalanadi.   Bundan tashqari, foydalanuvchi faqat yozishning o'ziga xos shakllaridan
foydalanishni o'rganadi.   Ushbu usullarni skanerlangan qog'oz hujjatlarini ishlatadigan
dasturiy   ta'minotda   qo'llash   mumkin   emas,   shuning   uchun   qo'lda   yozilgan   "bosma"
matnni tanib olish muammosi hali ham ochiq.   Artefaktlarsiz qo'lda yozilgan "bosma"
matnli rasmlarda 80% - 90% aniqlikka erishish mumkin, ammo bunday aniqlik bilan
rasm   sahifadagi   o'nlab   xatolar   bilan   o'zgartiriladi.   Bunday   texnologiya   faqat   juda
cheklangan miqdordagi ilovalarda foydali bo'lishi mumkin.
Yana   bir   keng   o'rganilgan   muammo   qo'l   yozuvini   tanib   olishdir   .   Hozirgi   vaqtda
erishilgan   aniqlik   qo'lda   yozilgan   "bosma"   matnga   qaraganda   ancha   past.   Yuqori
ballga   faqat   kontekstual   va   grammatik   ma'lumotlardan   foydalangan   holda   erishish
mumkin.   Misol   uchun,   tanib   olish   jarayonida   lug'atda   butun   so'zlarni   qidirish
matndagi   alohida   belgilarni   aniqlashga   urinishdan   ko'ra   osonroqdir.   Tilning
grammatikasini   bilish   so'zning   fe'l   yoki   ot   ekanligini   aniqlashga   yordam
beradi.   Alohida qo'lyozma belgilar shakllari ba'zan butun qo'lyozmani aniq tanib olish
uchun etarli ma'lumotni o'z ichiga olmaydi (98% dan ortiq).
Tanib olish sohasidagi yanada murakkab vazifalarni hal qilish uchun, qoida tariqasida,
aqlli tanib olish tizimlari, masalan,   sun'iy neyron tarmoqlari   qo'llaniladi .
Matnni   aniqlash   tizimlarini   kalibrlash   uchun   qo'lda   yozilgan   raqamlar   tasvirlaridan
iborat standart   MNIST   ma'lumotlar bazasi yaratilgan .
10 OCR ning ahamiyati nimada?
Ish   jarayonlarining   aksariyati   bosma   nashrlardan   ma'lumot   olish   bilan   bog'liq.   Har
qanday   biznes-jarayon   shakllar,   hisob-fakturalar,   skanerlangan   yuridik   hujjatlar   va
qog'ozda   chop   etilgan   shartnomalarni   o'z   ichiga   oladi.   Bunday   katta   hajmdagi
hujjatlarni saqlash va qayta ishlash uchun ko'p vaqt va joy talab etiladi.   Qog'ozsiz ish
jarayoni   oldinga   yo'l   bo'lsa-da,   hujjatni   tasvirga   skanerlash   ba'zi   qiyinchiliklarni
keltirib   chiqaradi.   Bu   jarayon   qo'lda   aralashuvni   talab   qiladi   va   zerikarli   va   sekin
bo'lishi mumkin.
Hujjat   mazmunini   raqamlashtirish   ularda   matn   yashiringan   tasvir   fayllarini
yaratadi.   Matnni   qayta   ishlash   dasturlari   tasvirlardagi   matnni   qayta   ishlay
olmaydi.   OCR   bu   muammoni   tasvirni   ofis   dasturlari   tomonidan   tahlil   qilinadigan
matn   ma'lumotlariga   aylantirish   orqali   hal   qiladi.   Keyinchalik   bu   ma'lumotlar   tahlil,
operatsiyalarni   optimallashtirish,   jarayonlarni   avtomatlashtirish   va   ish   faoliyatini
yaxshilash uchun ishlatilishi mumkin.
OCR qanday ishlaydi?
OCR texnologiyasi quyidagi bosqichlarni o'z ichiga oladi:
Tasvir olish
Skaner   hujjatlarni   o'qiydi   va   ularni   ikkilik   ma'lumotlarga   aylantiradi.   OCR   dasturi
skanerlangan tasvirni tahlil qiladi va yorug'lik joylarini fon sifatida, qorong'i joylarni
esa matn sifatida tasniflaydi.
Dastlabki ishlov berish
Matnni   tanib   olishga   tayyorlash   uchun   OCR   dasturi   tasvirni   tozalaydi   va   xato
joylarini olib tashlaydi.   Quyidagi tozalash usullari qo'llaniladi:
 Tanib olish osonroq bo'lishi uchun skanerlangan hujjatni to'g'rilang va burilmasin.
11  Raqamli   tasvirdagi   kontrastni   tekislash   yoki   nuqsonlarni   olib   tashlash   va   matnli
tasvirlarning chekka effektlarini yumshatish.
 Skanerlangan rasmdagi ramkalar va chiziqlarni o'chiring.
 Ko'p tilli OCR texnologiyasi uchun shriftni aniqlash
Matnni tanib olish
OCR dasturiy ta'minoti matnni aniqlash uchun foydalanadigan OCR algoritmlari yoki
dasturiy   ta'minot   jarayonlarining   ikkita   asosiy   turi   mavjud:   naqsh   moslashtirish   va
xususiyatlarni chiqarish.
Shakl mosligi
Shaklni   moslashtirish   glif   deb   ataladigan   belgi   tasvirini   ajratib  olish   va   uni   xotirada
saqlangan   shunga   o'xshash   glif   bilan   solishtirish   orqali   ishlaydi.   Rasmni   aniqlash
faqat   saqlangan   glifning   shrifti   va   shkalasi   skanerlangan   glifning   shrifti   va
masshtabiga   mos   kelsagina   amalga   oshiriladi.   Bu   usul   ma'lum   shriftda   terilgan
hujjatlarni skanerlash bilan ishlashda samarali.
Xususiyatlarni chiqarish
Xususiyatlarni ajratib olish gliflarni chiziqlar, yopiq yo'llar, chiziq yo'nalishi va chiziq
kesishuvlari   kabi   xususiyatlarga   ajratadi   yoki   parchalaydi.   Xususiyatlar   so'ngra   turli
xil   saqlangan   gliflar   orasida   eng   yaxshi   yoki   eng   yaqin   moslikni   topish   uchun
ishlatiladi.
Tugatish
Tahlildan   so'ng   tizim   olingan   matn   ma'lumotlarini   kompyuter   fayliga
aylantiradi.   Ba'zi   OCR   tizimlari   skanerlangan   hujjatning   oldingi   va   keyingi
versiyalarini o'z ichiga olgan izohli PDF-fayllarni yaratishi mumkin.
OCRning qanday turlari mavjud?
12 Ma'lumotlar   olimlari   turli   xil   OCR   texnologiyalarini   ulardan  foydalanish   va   qo'llash
asosida tasniflaydi.   Quyida bir nechta misollar keltirilgan:
Oddiy optik belgilarni aniqlash dasturlari
Oddiy   OCR   mexanizmi   shablon   sifatida   turli   xil   saqlangan   shrift   naqshlari   va   matn
tasvirlaridan   foydalanadi.   OCR   dasturi   matn   belgilarining   tasvirlarini   ichki
ma'lumotlar   bazasi   bilan   belgilar   bo'yicha   solishtirish   uchun   naqsh   moslashtirish
algoritmlaridan   foydalanadi.   Tizim   matnni   so'zma-so'z   moslashtiradigan   yondashuv
optik   so'zni   aniqlash   deb   ataladi.   Uning   cheklovlari   bor,   chunki   deyarli   cheksiz
miqdordagi shriftlar va qo'l yozuvi uslublari mavjud va har bir turni hisobga olish va
ma'lumotlar bazasida saqlash mumkin emas.
Aqlli belgilarni aniqlash dasturlari
Zamonaviy OCR tizimlari matnni xuddi inson kabi o'qish uchun Intelligent Character
Recognition   (ICR)   texnologiyasidan   foydalanadi.   Ular   insonning   o'qish   qobiliyatlari
uchun   ilg'or   mashina   o'rganish   usullaridan   foydalanadilar.   Neyron   tarmoq   deb
ataladigan mashinani o'rganish tizimi tasvirni qayta-qayta qayta ishlash orqali matnni
ko'p   darajalarda   tahlil   qiladi.   U   turli   xil   tasvir   atributlarini   (egri   chiziqlar,   chiziqlar,
kesishmalar  va halqalar)  qidiradi  va yakuniy natijaga erishish  uchun turli  darajadagi
tahlil   natijalarini   birlashtiradi.   ICR   tasvirlarni   xarakter   bo'yicha   qayta   ishlasa   ham,
jarayon ko'p vaqt talab qilmaydi va natijalar bir necha soniya ichida olinadi.
So'zni aqlli aniqlash
Intellektual  so'zni  aniqlash tizimlari  ICR bilan bir  xil  printsip asosida  ishlaydi, lekin
avval tasvirdagi belgilarni ajratmasdan butun so'zlarning tasvirlarini qayta ishlaydi.
Optik belgilarni aniqlash
OCR   sizga   hujjatdagi   logotiplar,   moybo'yoqli   belgilar   va   boshqa   belgilarni   aniqlash
imkonini beradi.
13 OCR ning asosiy afzalliklari nimada?
Ma'lumotlar   olimlari   turli   xil   OCR   texnologiyalarini   ulardan  foydalanish   va   qo'llash
asosida tasniflaydi.   Quyida bir nechta misollar keltirilgan:
Oddiy optik belgilarni aniqlash dasturlari
Oddiy   OCR   mexanizmi   shablon   sifatida   turli   xil   saqlangan   shrift   naqshlari   va   matn
tasvirlaridan   foydalanadi.   OCR   dasturi   matn   belgilarining   tasvirlarini   ichki
ma'lumotlar   bazasi   bilan   belgilar   bo'yicha   solishtirish   uchun   naqsh   moslashtirish
algoritmlaridan   foydalanadi.   Tizim   matnni   so'zma-so'z   moslashtiradigan   yondashuv
optik   so'zni   aniqlash   deb   ataladi.   Uning   cheklovlari   bor,   chunki   deyarli   cheksiz
miqdordagi shriftlar va qo'l yozuvi uslublari mavjud va har bir turni hisobga olish va
ma'lumotlar bazasida saqlash mumkin emas.
Aqlli belgilarni aniqlash dasturlari
Zamonaviy OCR tizimlari matnni xuddi inson kabi o'qish uchun Intelligent Character
Recognition   (ICR)   texnologiyasidan   foydalanadi.   Ular   insonning   o'qish   qobiliyatlari
uchun   ilg'or   mashina   o'rganish   usullaridan   foydalanadilar.   Neyron   tarmoq   deb
ataladigan mashinani o'rganish tizimi tasvirni qayta-qayta qayta ishlash orqali matnni
ko'p   darajalarda   tahlil   qiladi.   U   turli   xil   tasvir   atributlarini   (egri   chiziqlar,   chiziqlar,
kesishmalar  va halqalar)  qidiradi  va yakuniy natijaga erishish  uchun turli  darajadagi
tahlil   natijalarini   birlashtiradi.   ICR   tasvirlarni   xarakter   bo'yicha   qayta   ishlasa   ham,
jarayon ko'p vaqt talab qilmaydi va natijalar bir necha soniya ichida olinadi.
14

Matnlar bilan ishlovchi vositalar. Matn muharrirlari. Nashriyot tizimi vositalari. Elektron lug’atlar. Belgilarni optik tanish vositalari. Tarjimon dasturlar. Reja: 1. Matnlar bilan ishlovchi vositalar 2. Matn muharrirlari 3. Belgilarni optic tanish vositalari 4. Multimedia vositalari. 5. Multimediali o’qitish texnologiyalari 1

Kompyuterda matnli ma'lumotlarni qayta ishlash uchun umumiy maqsadli dasturlar - matn muharrirlari qo'llaniladi. Zamonaviy matn protsessorlari foydalanuvchiga hujjatlarni tayyorlash uchun keng imkoniyatlar yaratadi. Bular tahrirlash funktsiyalari bo'lib, ular bitta hujjat ichida va turli hujjatlar o'rtasida bo'laklarni har qanday o'zgartirish, qo'shish, almashtirish, nusxalash va ko'chirish, kontekst bo'yicha qidirish, belgilar formatlash, paragraflar, sahifalar, hujjat bo'limlari, tartib, grammatika va imlo, oddiy bilan birga foydalanish imkonini beradi. ro'yxatlar, jadvallar, rasmlar, grafiklar va diagrammalarning matn elementlari. Matn muharriri yordamida kompyuterda hujjatlar yaratish uchun axborotni qayta ishlash texnologiyasini o'zlashtirish kerak, tamom.Ushbu ishning dolzarbligi - matn muharrirlari juda qiziqarli mavzu bo'lib, unda siz matnli ma'lumotlarni qayta ishlashning barcha xususiyatlari va chiplarini ochib berishingiz mumkin. Har yili ishni yaxshilash, samaradorlik, tezlik va qulaylikni oshirish uchun yangi dasturlar yaratiladi. Ishning maqsadi matnli ma'lumotlarni qayta ishlashning asosiy vositalari va texnologiyalarini ko'rsatish, Microsoft Word matn protsessorining funksionalligini o'rganishdir. Vazifalar:  Matn muharrirlarini ko'rib chiqing;  Matn protsessorlarining imkoniyatlarini o'rganing;  Microsoft Excel-da vazifalar qanday hal qilinishini ko'ring.  Matn muharrirlari. Har bir kompyuter foydalanuvchisi u yoki bu matnli axborotni tayyorlash, tahrirlash zarurati bilan duch keladi. Kompyuter uchun yaratilgan dastlabki dasturlardan biri matnni qayta ishlash tizimlari yoki ularni matn muharrirlari deb atalgan. 2

Matn protsessorlari bilan jihozlangan kompyuterlar yozuv mashinkalarini almashtirishi kerak edi. Shunga ko'ra, birinchi bunday dasturlarda belgilar kiritish, oddiy matnni tahrirlash (o'chirish, ko'chirish, nusxalash va joylashtirish) va natijada olingan hujjatni chop etish funktsiyalari mavjud edi. Yozuv mashinkasidan farqi tayyor matnni saqlash va keyin uni qayta ishlatish qobiliyati edi. Biroq, yozuv mashinkasining funktsiyalarini amalga oshirish kompyuter foydalanuvchilarini qoniqtira olmadi. Matn muharrirlarining rivojlanishi juda tez kechdi. Bundan tashqari, matbaa (nashr qilish) kompyuter dasturlarini ishlab chiqish parallel ravishda boshlandi. Turli tizimlarni ishlab chiquvchilarning g'oyalari va kashfiyotlari bir-birini to'ldirib, bir-birini "oziqlantirdi", natijada nafaqat kuchli bosma dasturlar, balki "maishiy" matn muharrirlari ham paydo bo'ldi. ular o'zlarining qobiliyatlari jihatidan professionallardan bir oz pastroqdir. Ushbu dasturlarning imkoniyatlari har xil - oddiy tuzilishdagi kichik hujjatlarni tayyorlash dasturlaridan tortib, nashriyot nashriyoti kitob va jurnallarni (nashriyot tizimlari) bosma nashriyotga terish, loyihalash va to'liq tayyorlash dasturlarigacha. Maxsus matn protsessori (muharriri) bilan jihozlangan kompyuterning yozuv mashinkasiga nisbatan afzalliklari yaqqol ko‘rinib turardi va ular qulaylik, mehnat unumdorligini sezilarli darajada oshirish, eng muhimi, olingan hujjatlar sifatini oshirishni ta’minlaganligidan iborat edi. nashriyot nashriyoti kitoblar va jurnallarni (nashriyot tizimlari) loyihalash va bosmaxonaga to'liq tayyorlash. Maxsus matn protsessori (muharriri) bilan jihozlangan kompyuterning yozuv mashinkasiga nisbatan afzalliklari yaqqol ko‘rinib turardi va ular qulaylik, mehnat unumdorligini sezilarli darajada oshirish, eng muhimi, olingan hujjatlar sifatini oshirishni ta’minlaganligidan iborat edi. nashriyot nashriyoti kitoblar va jurnallarni (nashriyot tizimlari) loyihalash va bosmaxonaga to'liq tayyorlash. Maxsus matn protsessori (muharriri) bilan jihozlangan kompyuterning yozuv mashinkasiga nisbatan afzalliklari yaqqol ko‘rinib turardi va ular qulaylik, mehnat unumdorligini sezilarli darajada oshirish, eng muhimi, olingan hujjatlar sifatini oshirishni ta’minlaganligidan iborat edi. 3

 Matn muharrirlari matnli hujjatlarni yaratish va tahrirlash uchun mo ljallangan dasturlardir.ʻ Matnni tahrirlash - bu matn ustidagi ichki (semantik) va tashqi (dizayn) ishlarni bajarish uchun operatsiyalar majmuasidir. Matn muharrirlarining har xil turlari mavjud :  Muharrirlar faqat testni o'z ichiga olgan hujjatlarni tayyorlash uchun mo'ljallangan (masalan, Notepad). Bunday muharrirda yaratilgan hujjatning baytdagi hajmi hujjatdagi belgilar (harflar) soniga teng. Bunday matn muharrirlaridan dastur matnlarini tahrirlash va HTML hujjatlarini tayyorlash uchun foydalanish mumkin.  Matnni tahrirlash va formatlash (formatlash) mumkin bo'lgan muharrirlar (masalan, WordPad). Bunday muharrirlarda tayyorlangan hujjatlar nafaqat matn belgilarini, balki ularning formati, ya'ni taqdimot shakli (o'lchami, kursiv va tagiga chizilgan va boshqalar) haqidagi ma'lumotlarni ham o'z ichiga oladi.  Murakkab hujjatlarni tayyorlash imkonini beruvchi, ya'ni nafaqat matn, balki boshqa ob'ektlar - rasmlar, diagrammalar, tovushlar va boshqalarni o'z ichiga olgan muharrirlar. Bunday muharrirlar odatda matn protsessorlari deb ataladi.  Matn muharriri Lexicon. Lexicon matn muharriri rus va ingliz tillarida matnli oddiy hujjatlarni qayta ishlash uchun mo ljallangan. ʻ LEKSIKON quyidagi matn tahrirlash funksiyalariga ega:  matnni ko'rish va tahrirlash;  matnni avtomatik formatlash;  matnni avtomatik sahifalash;  matn parchalarini bir joydan ikkinchi joyga ko‘chirish;  hujjat bo'limlari uchun mundarijani yaratish;  bir vaqtning o'zida bir nechta hujjatlarni tahrirlash; 4

WordPad matn muharriri. Word Pad Editor - bu juda uzun matnlarni yaratish va tahrirlash imkonini beruvchi matn muharriri. Windows bilan ta'minlangan Word Pad muharriri etarlicha kuchli emas, lekin kundalik vazifalarning aksariyati - xat yozish, talaba inshosi, tabriknoma tayyorlash - Word Pad juda yaxshi bajariladi. WordPad bilan:  shriftlar bilan ishlash, turli shrift uslublari va ranglarini ishlatish;  matnlarni o'zining formatida va boshqa mashhur formatlarda (shu jumladan Microsoft Word formatida) saqlash;  matnga turli formatdagi tasvirlarni kiritish.  Word Perfect matn muharriri. Word Perfect matn muharriri kompyuter olamidagi eng mashhur matn muharrirlaridan biridir. Word Perfect juda noodatiy xususiyatlar to'plamiga ega. Uning asosidagi bir xil universal tamoyillardan foydalangan holda, bir tomondan, oddiy hujjatlarni qayta ishlash, boshqa tomondan, murakkab tuzilishga ega bo'lgan matnlar, rasmlar, jadvallar va boshqalarni tayyorlash juda oson. Word Perfect muharririning asosiy xususiyatlaridan ba'zilari:  barcha an'anaviy matn tahrirlash amallarini o'z ichiga oladi  har doim matn formatini qo'llab-quvvatlaydi  o'rnatilgan belgilarning keng doirasiga ega  avtomatik ravishda tarkibni, raqamlar va adabiyotlar ro'yxatini, turli indekslarni yaratish, sarlavha va altbilgilarni qo'yish va hokazolarni yaratish mumkin.  matematik formulalarni turadi, matnga rasm, grafik, jadval va hokazolarni kiritadi.  Matn muharriri Microsoft Word 6.0. Microsoft Word 6.0 kuchli matn protsessori bo'lib, matnni qayta ishlashning barcha jarayonlarini bajarishga mo'ljallangan: matn terish va joylashtirishdan tortib to imloni 5