BIG DATA VA BLOKCHEYN TEXNOLOGIYALARI
![AREBig Dat a t ushunchasi. Big Dat a
muammolar v a imk oniy at lar. Big Dat a ni
aniqlov chi v a uni qay t a ishlash jaray onida
hosil bo’luv chi xususiy at larBIG DATA VA BLOKCHEYN TEXNOLOGIYALARI](/data/documents/7b68c86f-527b-4584-bd2c-fb257cfdfc29/page_1.png)
![Reja:
ARE
Big Data tushunchasi;
Big Data muammolar va imkoniyatlar;
Big Data ni aniqlovchi va uni qayta ishlash
jarayonida hosil bo’luvchi xususiyatlarBig Dat a](/data/documents/7b68c86f-527b-4584-bd2c-fb257cfdfc29/page_2.png)
![AREBig Dat a
IBM ma'lumotlariga ko'ra, har
kuni 2,5 kvintillion bayt ma'lumot
ishlab chiqarilmoqda va shuning
uchun bugungi kunda dunyodagi
ma'lumotlarning 90% so'nggi ikki
yil ichida shakllangan deyish
mumkin .
IDG (International Data
Group) olimlari 2018-yilda
"Raqamli koinot" ning hajmi 33
Zettabaytga yetganligini va bu
ko’rsatgich 2025-yilga kelib 175
Zettabaytga yetishini bashorat
qilishmoqda.](/data/documents/7b68c86f-527b-4584-bd2c-fb257cfdfc29/page_3.png)
![AREBig Dat a
Yuqorida majoziy ma’noda aytilgan ma’lumotlar
to’foni qanchalik katta? Keling buni qanchalik katta
ekanligini tushunish uchun quyidagi masalani ko’rib
o’tamiz:
Tasavvur qiling yuqorida aytilgan bir kunda ishlab
chiqarilayotgan 2,5 kvintillion bayt ma'lumotni bir
kishi ushbu ma’umotlar saqlanayotgan serverlardan
yuklab olmoqchi bo’lsin, agar u o’rtacha Mbit/sekund
tezlik bilan ma’lumotlarni yuklab olmoqchi bo’lganda
ham unga yilga yaqin vaqt kerak bo’lar edi. bayt602 5,2 ](/data/documents/7b68c86f-527b-4584-bd2c-fb257cfdfc29/page_4.png)
![AREBig Dat a
Ma’lumotlarning bu qadar tez sur’atlarda o’sib
borishi ilm-fan sohasida ushbu ma’lumotlarni saqlash
va qayta ishlashga doir yangi “Big Data” - katta
ma’lumotlar atamasining paydo bo’lishiga olib keldi.
Terminning birinchi ta'rifi 1997-yilda NASA ning
ikkita tadqiqotchisi Maykl Koks va Devid Ellsvort
tomonidan kiritilgan. "Big Data" tushunchasi uchun
rasmiy ta’rif aniq berilmagan, dastlabki berilgan
ta’riflarni aksariyati bu tushunchaning kelib chiqish
sababiga ya’ni ma’lumotlar hajmiga asoslangan. Bu
ta’riflarning ba’zilarini quyida keltirib o’tilgan.](/data/documents/7b68c86f-527b-4584-bd2c-fb257cfdfc29/page_5.png)
![AREBig Dat a
Big Data – bu oddiy tarzda saqlash, uzatish va qayta
ishlash mumkin bo’lmagan katta hajmdagi ma’lumotlar
majmuasidir.
Big Data – hajmi jihatidan odatdagi ma’lumotlar
bazasining dasturiy ta’minoti tomonidan olish, saqlash,
boshqarish va tahlil qilish imkoniyatiga ega
bo’lmaydigan ma’lumotlar to’plamlaridir.](/data/documents/7b68c86f-527b-4584-bd2c-fb257cfdfc29/page_6.png)
![AREBig Dat a
Big Data - bu qiymatga
aylanish uchun o’ziga xos
texnologiya va analitik
usullarni talab qiladigan yuqori
hajm, tezlik va turli-tumanlik
bilan tavsiflangan axborot
aktivlaridir.
Ushbu ta’rifda Big Dataning uch xususiyati (3 V) ga, hajm
(Volume), tezlik (Velocity) va turli xillik (Vareity) ega ekanligiga
urg’u berishgan,](/data/documents/7b68c86f-527b-4584-bd2c-fb257cfdfc29/page_7.png)
![AREBig Dat a
Hajm (Volume). Ma'lumotlarning kiruvchi oqimi va
saqlanadigan ma’lumotlar hajmini anglatadi. Ma’lumotlar
hajmining kattaligi ularni Big Data deb hisoblash
mumkinligining muhim ko’rsatgichidir. Xorijlik olimlar R.
Elmasri, B. Navathe o’zlarining tadqiqot ishida bugungi
sharoitda ma’lumotlar hajmining Big Data deb qaralish
oralig’ini terabayt yoki petabaytdan ekzobaytgacha o’zgarib
turishini aytib o’tishadi. Lekin ko’pchilik xorijiy olimlar Big
Data hajmining bu oralig’iga qat’iy chegara qo’yish haqida
ilmiy fikrlar yoki xulosalar keltirishmagan. Buning
sababilaridan biri har qanday faol manbadan chiqayotgan
ma’lumoltar bir kun kelib katta hajimli ma’lumotlarni hosil
qilishi bo’lsa, ikkinchi sababi Big Data ma’lumotlarining
hajmiga qo’yilgan chegara vaqti kelib o’zgarishidir.](/data/documents/7b68c86f-527b-4584-bd2c-fb257cfdfc29/page_8.png)
![AREBig Dat a
Tezlik (Velacity) – bu ma’lumotlarning yaratilish
(o’sish darajasi) va tahlil qilish uchun qayta ishlash
tezligi tushuniladi. Boshqacha qilib aytganda tezlik
nafaqat ma’lumotlarning bazaga kirish tezligini balki
ushbu bazadan muhim ma’lumotlarni olish tezligini
ham anglatadi. Odatda Big Data real vaqtda
ma’lumotlarni yuqori tezlikda tahlil qilinishini talab
qiladi. Buning uchun Big Data ma’lumotlarini qayta
ishlash texnologiyasi ularni ma’lumotlar omboriga
kirishdan oldin tahlil qilish imkoniyatini yaratishi
kerak.](/data/documents/7b68c86f-527b-4584-bd2c-fb257cfdfc29/page_9.png)
![AREBig Dat a
Tezlik amaliy foydalanish nuqtai nazridan Big Dataning eng
asosiy xususiyatlaridan biridir. Fujitsu olimlari o’z tadqiqot
ishlarida bu g’oyanini quyidagi ikki fikrlari orqali qo’llab
quvatlayd:
1) “Hozirda odamlar uchun petabayt (1 million gigabayt)
katta bo’lib tuyuladi, ammo ertaga bu hajm odatiy holga va vaqt
o’tishi bilan bu ham nazarimizda kichik hajmga aylanadi.
Shuning uchun o’lchamni unuting – Big Data qaror qabul qilish
tezligi bilan bog’liq. Biznes ma’noda Big Data – bu tezkor
javoblardir”.
2) “Reuters axborot agentligini 100 yildan buyon Big Data
bilan shug’illanib kelayapti chunki uning biznes modeli
ko’pgina manbaalardagi ma’lumotlardan tegishli yangiliklarni
tezlik bilan olish va kerakli odamlarga iloji boricha tezroq
yetkazishga asoslangan”.](/data/documents/7b68c86f-527b-4584-bd2c-fb257cfdfc29/page_10.png)
![AREBig Dat a
Ukrainalik olim V.A. Reznichenko o’z tadqiqot
ishida Big Data ma'lumotlar toifasi kuniga 100 Gb dan
yuqori bo'lgan ma'lumotlar oqimlarining ko'p qismini
o'z ichiga oladi deb takidlaydi. Reznichenko fikridan
xulosa qiladigan bo’lsak kun davomida o’rtacha
sekundiga 1,19 Mbayt dan yuqori tezlik bilan
ma’lumotlar oqimini hosil qiluvchi ma’lumotlar
guruhini Big Data deb atash mumkin bo’ladi](/data/documents/7b68c86f-527b-4584-bd2c-fb257cfdfc29/page_11.png)
![AREBig Dat a
Turli xillik (Vareity) – bu turli manbaalardan turli
ma’lumotlarni qabul qilish, saqlash va qayta ishlash
qobiliyatidir. Ya’ni turli xillik deganda quyidagilar nazarda
tutuladi:
Ma’lumotlarni turli manbaalardan qabul qilishliligi.
Ma’lumotlarni qabul qilish va saqlash formatlarining
turli xilligi: matn, audio, video, tasvirlar.
Semantik xilma-xillik. Ya’ni bir xil ma’lumotlarning
turli yo’llar bilan taqdim etilishi. Misol uchun talabaning besh
yoki uch baho olganligi haqidagi ma’lumotning a’lo yoki
qoniqarli kabi atamalar bilan taqdim etilishi.
Ma’lumotlarning turli tuzilishliligi.](/data/documents/7b68c86f-527b-4584-bd2c-fb257cfdfc29/page_12.png)
![AREBig Dat a
Ishonchlilik (Veracity) – bu ma’lumotlarning to’g’riligini,
ishonchligini tavsiflovchi xususiyatdir. Vishnu Pendyala o’z
tadqiqot ishida “Ishonchlilik – Big Datadan foydalanish va
undan natija olishning hal qiluvchi jihatidir” deb xususiyati
muhimligini takidlaydi. Big Data ma’lumotlaridan
foydalanish texnologiyasi puxta tanlangan va tasdiqlangan
ma’lumotlarning ma’lumotlar bazasiga kirishini nazarda
tutmaydi. Dastlabki ma’lumotlar “xom” bo’lishi mumkin,
yani ular hech qanday dastlabki ishlovlarsiz, tasodifiy va juda
ko’p “shovqinlar”ni o’z ichiga olgan holda bazaga kelishi
mumkin. Big Data tahlil qilish va qaror qabul qilish uchun
ajoyib imkoniyatlarni taqdim etsada, uning qiymati ko'p
jihatdan asl ma'lumotlarning sifatiga bog'liq. Big Data
texnologiyasi ushbu xususiyatni hisobga oladi va bunday
ma'lumotlar bilan ishonchli ishlashga imkon beradi.](/data/documents/7b68c86f-527b-4584-bd2c-fb257cfdfc29/page_13.png)
![AREBig Dat a
Qiymatlilik (Value) – bu amaliy muammolar nuqtai
nazidan uning ahamiyatliligini tushuntiradi.
Qiymatlilik Big Dataning muhim xususiyati ekanligi
haqida Ishwarappa va J. Anuradha o’z ilmiy ishlarida
shunday fikr bildirishadi: “Big Dataning potensial
qiymati juda katta shuning uchun qiymatlilik katta
ma'lumotlarning eng muhim jihatidir”. Bu haqda
Azrboyjonlik tadqiqotchilar Magerramov Z.T.,
Abdullaev V.G., Magerramova A.Z. lar o’z tadqiqot
ishida qiymatlilik Big Datani yangi hodisa sifatida
ajratishga imkon beradigan asosiy xususiyatidir deb
takidlashadi.](/data/documents/7b68c86f-527b-4584-bd2c-fb257cfdfc29/page_14.png)
![AREBig Dat a
O’zgaruvchanlik (Variability) – bu harakatdagi
ma'lumotlarning vaqt o'tishi bilan har qanday
o'zgarishini, shu jumladan oqim tezligini, formatini
yoki tarkibining o’zgarishini anglatadi.
Dolzarblilik (Volatility) - ma'lumotlarning qancha
vaqtgacha amal qilinishini va qancha vaqt saqlanishi
kerakligini anglatadi. Dolzarblilik Big Dataning hajm
(qancha ma'lumot saqlanishi kerak va saqlash narxi
qancha?), qiymatlilik (ma'lumotlar qancha vaqtgacha
dolzarb bo'lib qoladi va qiymat hosil qiladi?)
xususiyatlariga va ma’lumotlarni qayta ishlash
zarurligiga bog'liqdir.](/data/documents/7b68c86f-527b-4584-bd2c-fb257cfdfc29/page_15.png)
![AREBig Dat a
Yaroqlilik (Validity). Ushbu xususiyat ishonchlilik
bilan chambarchas bog'liq bo'lib, mavjud
ma'lumotlarning maqsadga muvofiq ishlatilishi jihatidan
qanchalik to'g'ri va noto'g'ri ekanligini tavsiflaydi.
Vizualizatsiya (Visualization). Ma'lumotlarning katta
hajmi va murakkabligi shunchalik ulkanki, ko'plab
tashkilotlar ularni tahlil qilish orqali har qanday
raqobatbardosh ustunlikka erishish uchun kurashadilar.
Big Data turli foydalanuvchilar uchun oson tushunarli
tarzda taqdim etilishi kerak. Vizualizatsiya - bu juda katta
miqdordagi ma'lumotlarni tushunarli va o'qilishi mumkin
bo'lgan tarzda tushunarli qilish jarayonidir.](/data/documents/7b68c86f-527b-4584-bd2c-fb257cfdfc29/page_16.png)
![AREBig Dat a
Hayotiylik (Viability) - korxonalar uchun eng muhim
natijalarni bashorat qilish ehtimoli yuqori bo'lgan
xususiyatlar va omillarni sinchkovlik bilan tanlash
jarayonini anglatadi. Hayotiylik (Viability) xususiyati
haqida Vishnu Pendyala shunday ta’rif beradi:
“Hayotiylik - Big Data haqida hamma narsa foydali
emasligini anglatadi. Faqatgina xususiyatlarni tanlash
uchun mavjud bo'lgan atributlarning hayotiyligini
baholash zarur, bu qiymatni aniqlashga yordam beradi”.
Baholash (Valuation) - bu Big Datadan qiymatni
chiqarish jarayoni. Baholash xususiyatini qiymatlilik
xususiyati bilan adashtirmaslik kerak. Chunki birinchisi
jarayon, ikkinchisi esa natijadir.](/data/documents/7b68c86f-527b-4584-bd2c-fb257cfdfc29/page_17.png)
AREBig Dat a t ushunchasi. Big Dat a muammolar v a imk oniy at lar. Big Dat a ni aniqlov chi v a uni qay t a ishlash jaray onida hosil bo’luv chi xususiy at larBIG DATA VA BLOKCHEYN TEXNOLOGIYALARI
Reja: ARE Big Data tushunchasi; Big Data muammolar va imkoniyatlar; Big Data ni aniqlovchi va uni qayta ishlash jarayonida hosil bo’luvchi xususiyatlarBig Dat a
AREBig Dat a IBM ma'lumotlariga ko'ra, har kuni 2,5 kvintillion bayt ma'lumot ishlab chiqarilmoqda va shuning uchun bugungi kunda dunyodagi ma'lumotlarning 90% so'nggi ikki yil ichida shakllangan deyish mumkin . IDG (International Data Group) olimlari 2018-yilda "Raqamli koinot" ning hajmi 33 Zettabaytga yetganligini va bu ko’rsatgich 2025-yilga kelib 175 Zettabaytga yetishini bashorat qilishmoqda.
AREBig Dat a Yuqorida majoziy ma’noda aytilgan ma’lumotlar to’foni qanchalik katta? Keling buni qanchalik katta ekanligini tushunish uchun quyidagi masalani ko’rib o’tamiz: Tasavvur qiling yuqorida aytilgan bir kunda ishlab chiqarilayotgan 2,5 kvintillion bayt ma'lumotni bir kishi ushbu ma’umotlar saqlanayotgan serverlardan yuklab olmoqchi bo’lsin, agar u o’rtacha Mbit/sekund tezlik bilan ma’lumotlarni yuklab olmoqchi bo’lganda ham unga yilga yaqin vaqt kerak bo’lar edi. bayt602 5,2
AREBig Dat a Ma’lumotlarning bu qadar tez sur’atlarda o’sib borishi ilm-fan sohasida ushbu ma’lumotlarni saqlash va qayta ishlashga doir yangi “Big Data” - katta ma’lumotlar atamasining paydo bo’lishiga olib keldi. Terminning birinchi ta'rifi 1997-yilda NASA ning ikkita tadqiqotchisi Maykl Koks va Devid Ellsvort tomonidan kiritilgan. "Big Data" tushunchasi uchun rasmiy ta’rif aniq berilmagan, dastlabki berilgan ta’riflarni aksariyati bu tushunchaning kelib chiqish sababiga ya’ni ma’lumotlar hajmiga asoslangan. Bu ta’riflarning ba’zilarini quyida keltirib o’tilgan.