logo

Python dasturlash tilida malumotlarni tahlillash,vizulizatsiya

Загружено в:

12.08.2023

Скачано:

0

Размер:

10465.107421875 KB
Mavzu : Python dasturlash tilida malumotlarni tahlillash,vizulizatsiya
Reja:
1. Python dasturlash tilida malumotlarning turlari 
2. Python dasturlash tilida malumotlarni tahlili
3. Python dasturlash tilida malumotlarni  vizulizatsiya qilish  PYTHONDA MA’LUMOT TURLARI
Python   1990   yilda   paydo   bo'lgan,   ammo   yaqinda   mashhurlikka   erisha
boshlagan. 2020-yilda Python JavaScript, HTML/CSS va SQLdan keyin to rtinchiʻ
eng   ko p   ishlatiladigan   dasturlash   tili   bo ldi,   dasturchilarning   44,1   foizi   undan	
ʻ ʻ
foydalanadi.
Python - bu API ishlab chiqish, sun'iy intellekt, veb-ishlab chiqish, narsalar
Interneti   va   boshqalar   uchun   ishlatiladigan   talqin   qilingan,   umumiy   maqsadli,
yuqori darajadagi ob'ektga yo'naltirilgan til.
Python   qisman   ma'lumotlar   olimlari   tufayli   juda   mashhur   bo'ldi.   Bu
o'rganish uchun eng oson tillardan biridir. U ma'lumotlarni tahlil qilishning barcha
bosqichlarida   qo'llaniladigan   ko'plab   kutubxonalarni   taklif   qiladi.   Shuning   uchun
til bu maqsadlar uchun o'ziga xos tarzda mos keladi.
Ma’lumki,   axborotlar   matnli,   raqamli,   ovozli,   grafik   va   boshqa   shakllarda
uzatilishi   mumkin.   Bunday   axborotlarni   dasturlash   tillarida   qayta   ishlash   uchun,
ularni   turlarga   ajratish   lozim.   Dasturlarda   foydalaniladigan   ma’lumotlar   turlari
dasturning   maqsadiga   bog’liq   bo’ladi:   oddiy   kalkulyator   sonlardan   foydalanadi,
elektron pochta manzillarini tekshirishga mo’ljallangan dastur esa matnlar bilan ish
ko’radi. Sonlar natural, butun va haqiqiy sonlarga ajratiladi. Matnli axborotlar esa
belgilar   yoki   satrli   ma’lumotlardan   iborat   bo’lishi   mumkin.Ma’lumotlar   turi   –
kompyuter xotirasidagi yacheykada saqlanadigan ma’lumotlar shakli.
Ma’lumotlar   turi   –   bu   o‘zgaruvchi   yoki   doimiy   qiymatlardagi   ma’lumotlar
shakli.Ma’lumotlar turi kompyuter xotirasida yetarlicha joyni zaxiraga olib qo‘yish
uchun kerak bo‘ladi.Odatda, dasturlash tillarida ma’lumotlar turi o’zgaruvchi yoki
doimiy bilan birga e’lon qilinadi. Python dinamikturlarga ajratuvchi dasturlash tili
hisoblanadi. Shu sababli, Pythonda o’zgaruvchining turi u foydalanayotgan qiymat
bo’yicha   belgilanadi,   lekin   ma’lumot   turini   boshqa   turga   o’zgartirish   uchun   tur
ko’rsatilishi   shart.   Python   barcha   bosqichlarda   ajoyib   ishlaydi.   Bunda   birinchi
navbatda turli kutubxonalar yordam beradi. Qidiruv, qayta ishlash, modellashtirish
(vizualizatsiya bilan birga) ma'lumotlarni tahlil qilish uchun tildan foydalanishning
eng mashhur 3 ta stsenariysidir. Ma’lumotla
r turi Ma’lumotlar
turi tavsifi Misol
int() Butun
sonlar, masalan,
o‘quvchilar
sonini   ifidalash
uchun >>>   soni=25
float() Haqiqiy
sonlar,
masalan,   pul
miqdorini
ifodalash
uchun. >>>   narxi=20.45
str() Satrli, masalan,
so‘z   yoki
gaplarni
ifodalash
uchun. >>>   name=’Ahmad‘
bool() Mantiqiy, rost
yoki   yolg‘on
ekanligini
ifodalash uchun >>>
a=True
>>>   b=False
Muhandislar   Python   yordamida   ma lumotlarni   qidirish   uchun   Scrapy   vaʼ
BeautifulSoup’dan   foydalanadilar.Scrapy   yordamida   siz   internetda   tuzilgan
ma lumotlarni to playdigan dasturlar yaratishingiz mumkin. Bundan tashqari, API	
ʼ ʻ
dan ma'lumotlarni yig'ish uchun ham foydalanish mumkin.BeautifulSoup API dan
ma'lumotlarni   olish   ishlamayotgan   joyda   ishlatiladi;   u   ma'lumotlarni   to'playdi   va
ma'lum bir formatda tartibga soladi. Ma ’ lumotlar   turini   o ’ zgartirish
O’zgaruvchi   tarkibida   ixtiyoriy   turdagi   ma’lumot   saqlanishi   mumkin.
Ma’lumotlar   turini   o’zgartirish   uchun   mos   ma’lumotlar   turi   buyruqlaridan
foydalaniladi.   input()   operatori   yordamida   kiritilgan   ma’lumotlar   satrli
ko’rinishda bo’ladi.
Sintaksisi:
input(kiruvchi ma’lumot)
input–
operator(yoki funksiya);
kiruvchi ma’lumot
– bu o‘zgaruvchi yoki vergul bilan ajratilgan
o‘zgaruvchilar ketma-ketligi.
Butun son turidagi ma’lumotlarni kiritish uchun  int(input())   ko‘rinishida ishlatish 
lozim.Yoki kiritilgan ma’lumot turini   int()   funksiyasi yordamida o‘zgartirish  
kerak.
Misol:
>>>   age=input(‘Yoshingizni kiriting:’)
Yoshingizni kiriting: 15
>>>
print(age+1)
Traceback (most recent call last) :
File «pyshell#27», line 1, in module print (age+1)
TypeError: can only concatenate str (not «int») to str
Ushbu   misolda   yoshi   o’zgaruvchisiga   1   sonini   qo’shishda   xatolik   kelib
chiqdi,   sababi   foydalanuvchi   tomonidan   kiritilgan   15   ni   kompyuter   satrli
o’zgaruvchi deb qabul qildi va satrga sonni qo’sha olmadi.
Python dasturlash tilida malumotlarni tahlili Biz   car.csv   ma lumotlar  to plamidanʼ ʻ   foydalanamiz  va  Pandas  va  Matplotlib
kutubxona   funksiyalari   yordamida   ma lumotlarni   manipulyatsiya   qilish   va	
ʼ
vizualizatsiya   qilish   hamda   tushunchalarni   topish   uchun   ma lumotlar   tahlilini	
ʼ
o tkazamiz.	
ʻ
1. Kutubxonalarni import qiling.
2. Ma'lumotlar to'plamini pandas   read_csv()   funksiyasidan foydalanib yuklang.
3.   head()   funksiyasi yordamida ma'lumotlar to'plamining boshini ko'rsatish.
4.   tail()   funksiyasidan   foydalanib,   ma’lumotlar   to‘plamidan   pastki   5   qatorni
ko‘rsating . 5.   describe()   funksiyasidan   foydalanib   ma’lumotlar   to‘plamining   umumiy
statistikasini chop eting .
6.Barcha o‘zgaruvchilar uchun gistogramma chizing. 7.   Avtomobil   hajmi   va   dvigatel   ot   kuchi   o'rtasidagi   munosabatni   tasavvur   qilish
uchun quti syujeti.
8. Dengiz tug'ilgan kutubxonasidan foydalanib, juftlik syujetini tuzing.
9.   Drop   ()   funksiyasidan   foydalanib,   ma'lumotlar   to'plamidan   ahamiyatsiz
ustunlarni tashlang .   10. Ustunlar nomini o'zgartirish uchun   rename()   funksiyasidan foydalaning.
11. Ikki nusxadagi satrlarning umumiy sonini chop eting.
12. drop_duplicates()   funksiyasi   yordamida takroriy qatorlarni olib tashlang .
13. Ma'lumotlar to'plamidan etishmayotgan qiymatlarni tashlang. 14.   Bir   brendga   to'g'ri   keladigan   avtomobillar   sonini   topish   uchun   gistogramma
chizing.
15. O‘zgaruvchilar orasidagi korrelyatsiya grafigini tuzing. Ma'lumotlarni vizualizatsiya qilish
Matplotlib   va   Seaborn   ma'lumotlarni   vizualizatsiya   qilish   uchun   keng
qo'llaniladi.   Ular   raqamlarning   katta   ro'yxatini   qulay   grafiklar,   chiziqli
diagrammalar,   diagrammalar,   issiqlik   xaritalari   va   boshqalarga   aylantirishga
yordam beradi.
Albatta,   kutubxonalar   ko'p.   Python   ma'lumotlarni   tahlil   qilish   loyihalari
uchun   son-sanoqsiz   vositalarni   taklif   etadi   va   bu   yo'lda   har   qanday   vazifani
bajarishda yordam berishi mumkin.
Ma'lumotlarni   tahlil   qilish   uchun   mukammal   tilni   topish   deyarli   mumkin
emas,   chunki   ularning   har   biri   o'zining   afzalliklari   va   kamchiliklariga   ega.   Biri
vizualizatsiya   uchun   yaxshiroq,   ikkinchisi   esa   katta   hajmdagi   ma'lumotlar   bilan
yaxshiroq   ishlaydi.   Tanlov,   shuningdek,   ishlab   chiquvchining   shaxsiy
imtiyozlariga   bog'liq.   Keling,   ma'lumotlarni   tahlil   qilish   uchun   Pythonning
afzalliklari va kamchiliklarini ko'rib chiqaylik.  Dasturlash   hech   qachon   oson   bo'lmagan   va   hatto   katta   tajribaga   ega   ishlab
chiquvchilar   ham   muammolarga  duch   kelishadi.   Yaxshiyamki,  har  bir   tilda   to'g'ri
echimlarni   topishga   yordam   beradigan   hamjamiyat   mavjud.   Masalan,   GitHub-da
Python   loyihalari   bilan   90   000   dan   ortiq   omborlar   mavjud.   Shuning   uchun   siz
deyarli har doim savolingizga javob topishingiz mumkin.
Python   oddiy   sintaksisi   va   o'qilishi   tufayli   o'rganish   eng   oson   tillardan
biridir.   Bundan   tashqari,   kodning   ancha   kam   qatorlarini   talab   qiladi.   Ishlab
chiquvchi   kodning   o'zi   haqida   emas,   balki   u   nima   qilishi   haqida   o'ylamasligi
mumkin.   Python-da   disk   raskadrovka   qilish   ham   ancha   oson.Python   o'zining
moslashuvchanligi va asboblarning keng doirasi tufayli turli sohalarda qo'llaniladi.
Python uchun ma'lumotlarni tahlil qilishning turli bosqichlarida foydalanish
mumkin   bo'lgan   juda   ko'p   kutubxonalar   mavjud.   Bundan   tashqari,   ularning
aksariyati   bepul.   Bularning   barchasi   Python   yordamida   ma'lumotlar   bilan   ishlash
qulayligiga ta'sir qiladi.
Python   umumiy   maqsadli   til   bo'lib,   faqat   ma'lumotlarni   tahlil   qilish   uchun
yaratilmagan.   Dinamik matn terish bilan ishlab chiqish ancha oson, lekin u turli xil
turlari bilan bog'liq ma'lumotlardagi xatolarni qidirishni sekinlashtiradi.
Ma'lumotlar tahlilini qayerda o'rganish kerak
Eng   yaxshi   kurslardan   biri   bu   bir   yillik   ma'lumot   olimi   kasbi:   Skillbox-
dan   ma'lumotlarni   tahlil   qilish   . Ivi ,   QIWI ,   Rambler   va   Epam   tahlilchilari
ma ' lumotlar   bilan   ishlash   va   uy   vazifasini   sharhlash   usullarini   o ' rgatishadi .
Ma'lumotlarni   vizualizatsiya   qilish   ma'lumotlar   olimlari   ishining   katta
qismidir.   Loyihani ishlab chiqishning dastlabki bosqichlarida ko'pincha ma'lumotlar
ochib   beradigan   naqshlarni   aniqlash   uchun   Exploratory   Data   Analysis   (EDA)   ni
amalga   oshirish   kerak   bo'ladi.   Ma'lumotlarni   vizualizatsiya   qilish   katta   va
murakkab   ma'lumotlar   to'plamini   oddiy   va   vizual   tarzda   taqdim   etishga   yordam
beradi.   Loyihani yakunlash bosqichida uning natijalari haqida shunday hisobot bera
olish muhimki, hatto texnik bilimga ega bo'lmagan noprofessionallar  ham aniq va
tushunarli bo'ladi. Matplotlib   -   bu   Python-da   yozilgan   mashhur   ma'lumotlarni   vizualizatsiya
qilish   kutubxonasi.   Foydalanish   juda   oson   bo'lsa-da,   har   bir   yangi   loyiha   uchun
ma'lumotlar,   parametrlar,   grafiklarni   o'rnatish   va   renderlash   zerikarli   va   zerikarli
ishdir.   Ushbu   postda   biz   Matplotlib   Python   kutubxonasi   yordamida   ma'lumotlarni
vizuallashtirish   va   ularni   amalga   oshirish   uchun   tez   va   oddiy   funksiyalarni
yozishning   6   usulini   o'rganamiz.   Ayni   paytda,   ma'lumotlarni   vizualizatsiya
qilishning to'g'ri turini tanlashga yordam beradigan ushbu chiroyli grafikani ko'rib
chiqing!
Ikki   o'zgaruvchi   o'rtasidagi   munosabatni   ko'rsatishni   istasangiz,   ulardan
foydalaning,   chunki   ular   sizga   ma'lumotlarning   taxminiy   taqsimotini   ko'rsatishga
imkon   beradi.   Bundan   tashqari,   turli   xil   ma'lumotlar   guruhlari   o'rtasidagi
munosabatlarni   turli   ranglar   bilan   bo'yash   orqali   ko'rsatishi   mumkin.   Uchta
o'zgaruvchi   o'rtasidagi   munosabatni   ko'rsatish   kerakmi?   Muammo   yo'q!   Ushbu
uchinchi   o'zgaruvchini   kodlash   uchun   oddiygina   nuqta   o'lchami   kabi   qo'shimcha
parametrlarni qo'shing, xuddi pastdan ikkinchi chizmada bo'lgani kabi. Ranglar bo'yicha guruhlangan tarqalish sxemasi
Scatterplot   -th   parametrini   ko'rsatish   uchun   rang   va   o'lcham   bo'yicha
guruhlangan   -   mamlakat   o'lchami   Endi   kod   uchun.   Birinchidan,   biz   Matplotlib
kutubxonasini,   to g rirog i   uning   pyplot   modulini   Python-ga   qisqacha   “plt”ʻ ʻ ʻ
qisqartmasidan foydalanib import qilamiz.   Yangi   uchastka   yaratish   uchun   biz   plt.subplots() .   Keyin   biz   x   o'qi   va   y   o'qi
ma'lumotlarini   funktsiyaga   o'tkazamiz   va   keyin   biz   hamma   narsani   birgalikda
funktsiyaga   ax.scatter() tarqalish   sxemasini   qurish   uchun   o'tkazamiz.   Shuningdek,
biz   nuqta   o'lchamini,   nuqta   rangini   va   alfa   shaffofligini   o'rnatishimiz
mumkin.   Hatto   y   o'qi   uchun   logarifmik   shkaladan   ham   foydalanishingiz
mumkin.   Keyin biz o'qlar uchun sarlavha va teglarni o'rnatamiz.   Foydalanish oson
bo'lgan bu xususiyat sizga noldan boshlab scatterplot yaratish va chizish imkonini
beradi!
Bir o'zgaruvchi boshqa o'zgaruvchidan katta farq qilsa, boshqacha aytganda,
ular   yuqori   kovariatsiyaga   ega   bo'lsa,   uchastkalardan   eng   yaxshi
foydalaniladi.   Buni tushuntirish uchun quyidagi rasmga qaraylik.   Grafik ma'lum bir
vaqt oralig'ida katta foiz tarqalishini aniq ko'rsatadi.   Agar biz bir xil ma'lumotlarni
scatterplot   shaklida   taqdim   qilsak,   u   juda   chigal   va   murakkab   bo'lar   edi,   bu   esa
ko'rib   chiqilayotgan   bog'liqlikni   tushunish   va   tasavvur   qilishni
qiyinlashtiradi.   Chiziqli   diagrammalar   bu   vaziyat   uchun   ideal,   chunki   ular   ikkita
o'zgaruvchining kovariatsiyasini ko'rsatadi (bu holda, foiz va vaqt oralig'i).   Oldingi
misolda   bo'lgani   kabi,   biz   rang   bo'yicha   guruhlashimiz   mumkin. Diagramma
misoli.   Bu   AQShda   ayollarga   berilgan   bakalavr   darajalarining   foizini   ko'rsatadi
(1970–2012) Quyida chiziqli grafik yaratish uchun kod mavjud.   Bu o'zgaruvchilarda
ba'zi kichik o'zgarishlar bilan yuqorida muhokama qilingan scatterplotni dasturlash
kodiga o'xshaydi.
Gistogrammalar. Gistogrammalar   ma'lumotlarning   taqsimlanishini   ifodalash
(yoki hatto ochish) uchun foydalidir.   Quyidagi misolga qarang, biz chastota va IQ
gistogrammasini chizganmiz.   Biz kontsentratsiyani markazga yaqinroqda osongina
ko'rishimiz   mumkin   va   qiymatlarning   medianasi   ham   aniq   ko'rinadi.   Bundan
tashqari,   biz   uning   Gauss   taqsimotiga   amal   qilishini   ko'ramiz.   Barlardan
foydalanish   (masalan,   tarqalish   nuqtalari   o'rniga)   bizga   har   bir   intervalning
chastotasi o'rtasidagi nisbiy farqni aniq tasavvur qilish imkonini beradi.   Bandlardan
foydalanish   (intervallar   =   namuna   olish)   bizga   "katta   rasm"   ni   ko'rishga   yordam
beradi.   Agar bir xil ma'lumotlar intervallarni ajratib ko'rsatmasdan alohida nuqtalar sifatida taqdim etilsa, diagrammada juda ko'p shovqin paydo bo'ladi, bu esa ushbu
ma'lumotlardan   foydalangan   holda   tasvirlangan   tendentsiyani   tushunishni
qiyinlashtiradi.
Quyida   Matplotlib-dagi   shtrixli   diagramma   kodi.   Ikki   variantga   e'tibor
bering.   Birinchidan,   n_bins   parametrlari   gistogrammamizga   qancha   alohida   qutini
sig'dirishimiz   kerakligini   aniqlaydi.   Ko'proq   intervallar   bizga   aniqroq   ma'lumot
beradi,   lekin   axborot   shovqinini   keltirib   chiqarishi   va   bizni   katta   rasmni
tushunishdan   chalg'itishi   mumkin;   boshqa   tomondan,   kamroq   intervallar   bizga
qushning ko'rinishini va sodir bo'layotgan voqealarning yaxlit tasvirini beradi, shu
bilan   birga   uni   eng   kichik   tafsilotlar   bilan   ortiqcha   yuklamaydi.   Ikkinchidan,
kümülatif   parametr   mantiqiy   (ya'ni   1   yoki   0)   bo'lib,   bu   bizning   histogramamiz
kümülatif   yoki   yo'qligini   tanlash   imkonini   beradi.   Boshqacha   qilib   aytganda,   biz
ehtimollik zichligini ( Probability Density Function (PDF)) yoki kümülatif taqsimot
funksiyasini (Kumulyativ zichlik funktsiyasi (CDF)) belgilaymiz.
Endi   tasavvur   qiling-a,   biz   ma'lumotlarimizdagi   ikkita   o'zgaruvchining
taqsimlanishini   solishtirmoqchimiz.   Aqlga   keladigan   birinchi   fikr   ikkita   alohida gistogramma   yaratish   va   aniqlik   uchun   ularni   yonma-yon   joylashtirishdir.   Ammo
aslida   yaxshiroq   yo'l   bor:   biz   histogrammalarni   turli   shaffoflik   bilan   qoplashimiz
mumkin.   Quyidagi rasmga qarang.  
Overlay histogrammalarini yaratish uchun kodda o'rnatilishi kerak bo'lgan bir
nechta   parametrlar   mavjud.   Birinchidan,   ikkala   taqsimotning   o'zgaruvchilarini
joylashtirish uchun gorizontal diapazonni o'rnatamiz.   Ushbu diapazonga va kerakli
miqdordagi   qutilarga   ko'ra,   biz   har   bir   qutining,   har   bir   bandning   kengligini
hisoblashimiz mumkin.   Nihoyat, biz bir xil maydonda ikkita gistogramma quramiz
va ulardan biri shaffofroq bo'lishi kerak.
Ustunli   diagrammalar   ma'lumotlarni   toifalar   sifatida   tasavvur   qilish   kerak
bo'lganda eng samarali hisoblanadi, agar toifalar soni 10 dan oshmasa. Agar bizda
juda ko'p toifalar mavjud bo'lsa, u holda chiziqlar diagrammani chigallashtiradi va
tushunish   qiyin   bo'ladi.   Ular   kategoriyalangan   ma'lumotlar   uchun   yaxshi,   chunki
ustunning   o'lchamiga   (masalan,   kattalik)   qarab   toifalar   orasidagi   farqni   osongina
ko'rishingiz   mumkin;   toifalar   ham   osongina   shakllantirilishi   va   ranglar   bilan
ta'kidlanishi   mumkin.   Uch   xil   turdagi   shtrixli   diagrammalar   mavjud,   biz   ularni
keyin   ko'rib   chiqamiz:   oddiy,   guruhlangan   va   stacked.   Biz   ushbu   turlarning   har birini   o'z   navbatida   ko'rib   chiqamiz.Odatiy   chiziqli   diagramma   pastdan   birinchi
rasmda   joylashgan.   Funktsiyada   barplot()   x_data x   o'qi   bo'yicha
teglarni   y_data o'rnatadi va y o'qi bo'yicha ustun balandligini o'rnatadi.  
Guruhlangan   chiziqli   diagrammalar   bir   nechta   o'zgaruvchilarni   solishtirish
imkonini beradi.   Pastki qismdan ikkinchi diagrammaga qarang.   Biz solishtiradigan
birinchi  o'zgaruvchi  bu ballar  guruhdan guruhga qanday  o'zgarishi  (G1, G2, ... va
boshqalar).   Shuningdek, biz jinslarning taqsimlanishini bir-biri bilan taqqoslaymiz,
bu rang kodlangan.   Endi kodni ko'rib chiqing - o'zgaruvchi endi ro'yxatlar ro'yxati
ekanligini   ko'rasiz,   y_data_list har   bir   joylashtirilgan   ro'yxat   boshqa   guruhni
ifodalaydi.   Keyin biz har bir guruhni aylanib chiqamiz va har bir guruh uchun x o'qi
bo'yicha   har   bir   yorliq   uchun   ustunni   chizamiz;   barcha   guruhlar   ham   qo'shimcha
ravishda bo'yalgan.
Yig'ilgan   chiziqli   diagrammalar   turli   xil   o'zgaruvchilar   to'plamini
vizualizatsiya   qilish   uchun   juda   yaxshi.   Quyidagi   rasmda   qatorlar   bo'yicha
ajratilgan   holda,   biz   haftaning   kuni   bo'yicha   server   yukining   o'zgarishini
kuzatamiz.   Ranglar to'plami yordamida biz istalgan kunda qaysi serverlar eng ko'p
ishlayotganini   va   umuman   barcha   serverlarda   yuk   kunlar   bo'yicha   qanday
taqsimlanganini osongina ko'rishimiz va tushunishimiz mumkin.   Xulosa
Ma'lumotlar   turli   formatlarda   jadallik   bilan   yaratilmoqda.   Va   kompaniyalar
ushbu   ma'lumotlardan   qimmatli   ma'lumotlar   va   yashirin   tushunchalarni   olish
uchun   ma'lumotlar   tahliliga   tayanadilar.   Ushbu   "Python   yordamida   ma'lumotlar
tahlili"   maqolasini   o'qib   bo'lgach,   siz   ma'lumotlar   tahlili   nima   ekanligini   va
ma'lumotlar   tahlilining   turli   xil   ilovalarini   bilib   olgan   bo'lar   edingiz.   Shuningdek,
siz turli xil ma'lumotlar tahlili va jarayon bosqichlarini ko'rib chiqdingiz.   Nihoyat,
siz Pythonning NumPy, Pandas va Matplotlib kutubxonalaridan foydalangan holda
ma'lumotlar tahlilini amalga oshirdingiz.
Agar   shunday   bo'lsa,   iltimos,   ushbu   maqolaning   sharhlar   bo'limiga
qo'ying.   Bizning   mutaxassislarimiz   sizning   so'rovlaringizni   eng   qisqa   vaqt   ichida
hal qilishga yordam beradi.
Ma'lumotlarni   tahlil   qilish   uchun   mukammal   tilni   topish   deyarli   mumkin
emas,   chunki   ularning   har   biri   o'zining   afzalliklari   va   kamchiliklariga   ega.   Biri
vizualizatsiya   uchun   yaxshiroq,   ikkinchisi   esa   katta   hajmdagi   ma'lumotlar   bilan yaxshiroq   ishlaydi.   Tanlov,   shuningdek,   ishlab   chiquvchining   shaxsiy
imtiyozlariga bog'liq.  
Ma’lumki,   axborotlar   matnli,   raqamli,   ovozli,   grafik   va   boshqa   shakllarda
uzatilishi   mumkin.   Bunday   axborotlarni   dasturlash   tillarida   qayta   ishlash   uchun,
ularni   turlarga   ajratish   lozim.   Dasturlarda   foydalaniladigan   ma’lumotlar   turlari
dasturning   maqsadiga   bog’liq   bo’ladi:   oddiy   kalkulyator   sonlardan   foydalanadi,
elektron pochta manzillarini tekshirishga mo’ljallangan dastur esa matnlar bilan ish
ko’radi. Sonlar natural, butun va haqiqiy sonlarga ajratiladi. Matnli axborotlar esa
belgilar   yoki   satrli   ma’lumotlardan   iborat   bo’lishi   mumkin.Ma’lumotlar   turi   –
kompyuter xotirasidagi yacheykada saqlanadigan ma’lumotlar shakli.
Foydalanilgan adabiyotlar
1. Gary   Bradski,  Adrian   Kaehler .   Learning   OpenCV,   Computer   Vision   with   the
OpenCV Library,  -USA, 2008, -580 p.
2. Digital Information Strategies: From Applications and Content to Libraries and
People.2015 .
3. Pratt, William K. Digital image processing, 4th ed., -USA, 2007, -782 p.
4. Прэтт У. Цифровая обработка изображений/ в 2-х. кн. -М.: Мир, 1982.  792
5. Automate   the   Boring   Stuff   with   Python,   2nd   Edition:   Practical   Programming
for Total Beginners .
6. http://opencv.org/  
7. https://www.w3schools.com/python/.
8. http://docs.opencv.org/2.4/modules/contrib/doc/facerec/facerec_tutorial.htm
9. http://sourceforge.net/projects/opencvlibrary/

Mavzu : Python dasturlash tilida malumotlarni tahlillash,vizulizatsiya Reja: 1. Python dasturlash tilida malumotlarning turlari 2. Python dasturlash tilida malumotlarni tahlili 3. Python dasturlash tilida malumotlarni vizulizatsiya qilish

PYTHONDA MA’LUMOT TURLARI Python 1990 yilda paydo bo'lgan, ammo yaqinda mashhurlikka erisha boshlagan. 2020-yilda Python JavaScript, HTML/CSS va SQLdan keyin to rtinchiʻ eng ko p ishlatiladigan dasturlash tili bo ldi, dasturchilarning 44,1 foizi undan ʻ ʻ foydalanadi. Python - bu API ishlab chiqish, sun'iy intellekt, veb-ishlab chiqish, narsalar Interneti va boshqalar uchun ishlatiladigan talqin qilingan, umumiy maqsadli, yuqori darajadagi ob'ektga yo'naltirilgan til. Python qisman ma'lumotlar olimlari tufayli juda mashhur bo'ldi. Bu o'rganish uchun eng oson tillardan biridir. U ma'lumotlarni tahlil qilishning barcha bosqichlarida qo'llaniladigan ko'plab kutubxonalarni taklif qiladi. Shuning uchun til bu maqsadlar uchun o'ziga xos tarzda mos keladi. Ma’lumki, axborotlar matnli, raqamli, ovozli, grafik va boshqa shakllarda uzatilishi mumkin. Bunday axborotlarni dasturlash tillarida qayta ishlash uchun, ularni turlarga ajratish lozim. Dasturlarda foydalaniladigan ma’lumotlar turlari dasturning maqsadiga bog’liq bo’ladi: oddiy kalkulyator sonlardan foydalanadi, elektron pochta manzillarini tekshirishga mo’ljallangan dastur esa matnlar bilan ish ko’radi. Sonlar natural, butun va haqiqiy sonlarga ajratiladi. Matnli axborotlar esa belgilar yoki satrli ma’lumotlardan iborat bo’lishi mumkin.Ma’lumotlar turi – kompyuter xotirasidagi yacheykada saqlanadigan ma’lumotlar shakli. Ma’lumotlar turi – bu o‘zgaruvchi yoki doimiy qiymatlardagi ma’lumotlar shakli.Ma’lumotlar turi kompyuter xotirasida yetarlicha joyni zaxiraga olib qo‘yish uchun kerak bo‘ladi.Odatda, dasturlash tillarida ma’lumotlar turi o’zgaruvchi yoki doimiy bilan birga e’lon qilinadi. Python dinamikturlarga ajratuvchi dasturlash tili hisoblanadi. Shu sababli, Pythonda o’zgaruvchining turi u foydalanayotgan qiymat bo’yicha belgilanadi, lekin ma’lumot turini boshqa turga o’zgartirish uchun tur ko’rsatilishi shart. Python barcha bosqichlarda ajoyib ishlaydi. Bunda birinchi navbatda turli kutubxonalar yordam beradi. Qidiruv, qayta ishlash, modellashtirish (vizualizatsiya bilan birga) ma'lumotlarni tahlil qilish uchun tildan foydalanishning eng mashhur 3 ta stsenariysidir.

Ma’lumotla r turi Ma’lumotlar turi tavsifi Misol int() Butun sonlar, masalan, o‘quvchilar sonini ifidalash uchun >>> soni=25 float() Haqiqiy sonlar, masalan, pul miqdorini ifodalash uchun. >>> narxi=20.45 str() Satrli, masalan, so‘z yoki gaplarni ifodalash uchun. >>> name=’Ahmad‘ bool() Mantiqiy, rost yoki yolg‘on ekanligini ifodalash uchun >>> a=True >>> b=False Muhandislar Python yordamida ma lumotlarni qidirish uchun Scrapy vaʼ BeautifulSoup’dan foydalanadilar.Scrapy yordamida siz internetda tuzilgan ma lumotlarni to playdigan dasturlar yaratishingiz mumkin. Bundan tashqari, API ʼ ʻ dan ma'lumotlarni yig'ish uchun ham foydalanish mumkin.BeautifulSoup API dan ma'lumotlarni olish ishlamayotgan joyda ishlatiladi; u ma'lumotlarni to'playdi va ma'lum bir formatda tartibga soladi.

Ma ’ lumotlar turini o ’ zgartirish O’zgaruvchi tarkibida ixtiyoriy turdagi ma’lumot saqlanishi mumkin. Ma’lumotlar turini o’zgartirish uchun mos ma’lumotlar turi buyruqlaridan foydalaniladi. input() operatori yordamida kiritilgan ma’lumotlar satrli ko’rinishda bo’ladi. Sintaksisi: input(kiruvchi ma’lumot) input– operator(yoki funksiya); kiruvchi ma’lumot – bu o‘zgaruvchi yoki vergul bilan ajratilgan o‘zgaruvchilar ketma-ketligi. Butun son turidagi ma’lumotlarni kiritish uchun int(input()) ko‘rinishida ishlatish lozim.Yoki kiritilgan ma’lumot turini int() funksiyasi yordamida o‘zgartirish kerak. Misol: >>> age=input(‘Yoshingizni kiriting:’) Yoshingizni kiriting: 15 >>> print(age+1) Traceback (most recent call last) : File «pyshell#27», line 1, in module print (age+1) TypeError: can only concatenate str (not «int») to str Ushbu misolda yoshi o’zgaruvchisiga 1 sonini qo’shishda xatolik kelib chiqdi, sababi foydalanuvchi tomonidan kiritilgan 15 ni kompyuter satrli o’zgaruvchi deb qabul qildi va satrga sonni qo’sha olmadi. Python dasturlash tilida malumotlarni tahlili

Biz car.csv ma lumotlar to plamidanʼ ʻ foydalanamiz va Pandas va Matplotlib kutubxona funksiyalari yordamida ma lumotlarni manipulyatsiya qilish va ʼ vizualizatsiya qilish hamda tushunchalarni topish uchun ma lumotlar tahlilini ʼ o tkazamiz. ʻ 1. Kutubxonalarni import qiling. 2. Ma'lumotlar to'plamini pandas read_csv() funksiyasidan foydalanib yuklang. 3. head() funksiyasi yordamida ma'lumotlar to'plamining boshini ko'rsatish. 4. tail() funksiyasidan foydalanib, ma’lumotlar to‘plamidan pastki 5 qatorni ko‘rsating .