logo

R dasturlash tili

Yuklangan vaqt:

08.08.2023

Ko'chirishlar soni:

0

Hajmi:

147.76171875 KB
R dasturlash tili
Reja:
R dasturlash tili ............................................................................................................................................ 1
R bilan tanishtirish ....................................................................................................................................... 2
R dasturlash tili uchun misol ma'lumotlari .................................................................................................. 4
R dasturlash yordamida korrelyatsiya matritsasi yaratish ........................................................................... 6
Chiziqli regressiya modelini baholash uchun R dasturlash tilidan foydalanish ............................................ 6
R dasturlash yordamida tasodifiy raqamlarni yaratish ................................................................................ 7 R bilan tanishtirish
R - bu statistik hisoblash va grafika uchun til va muhit. Bu Jon Chambers va uning
hamkasblari   tomonidan   Bell   Laboratories   (avvalgi   AT&T,   hozir   Lucent
Technologies) da ishlab chiqilgan S tili va muhitiga o'xshash GNU loyihasidir . R
ni   S   ning   boshqa   amalga   oshirilishi   deb   hisoblash   mumkin.   Ba'zi   muhim   farqlar
mavjud, ammo S uchun yozilgan ko'p kod R ostida o'zgarmagan holda ishlaydi.
R turli xil statistik (chiziqli va chiziqli bo'lmagan modellashtirish, klassik statistik
testlar, vaqt-seriyalarni  tahlil  qilish, tasniflash, klasterlash, …) va grafik usullarni
taqdim etadi va juda kengaytiriladi. S tili ko'pincha statistik metodologiya bo'yicha
tadqiqot   uchun   tanlangan   vositadir   va   R   ushbu   faoliyatda   ishtirok   etish   uchun
ochiq manba yo'nalishini taqdim etadi.
R   ning   kuchli   tomonlaridan   biri   bu   yaxshi   ishlab   chiqilgan   nashr   sifatiga   ega
syujetlarni,   jumladan   matematik   belgilar   va   kerak   bo‘lganda   formulalarni   ishlab
chiqarish   qulayligidir.   Grafikadagi   kichik   dizayn   tanlovlari   uchun   standart
sozlamalarga   katta   e'tibor   berilgan,   ammo   foydalanuvchi   to'liq   nazoratni   saqlab
qoladi.
R   bepul   dasturiy   ta'minot   sifatida   Erkin   dasturiy   ta'minot   jamg'armasining   GNU
General Public License shartlariga muvofiq manba kodi shaklida mavjud . U turli
xil   UNIX   platformalari   va   shunga   o'xshash   tizimlar   (jumladan,   FreeBSD   va
Linux), Windows va MacOS larni kompilyatsiya qiladi va ishlaydi.
R muhiti
R   -   ma'lumotlarni   manipulyatsiya   qilish,   hisoblash   va   grafik   ko'rsatish   uchun
dasturiy   ta'minot   vositalarining   o'rnatilgan   to'plami.   O'z   ichiga   oladi   samarali
ma'lumotlarni qayta ishlash va saqlash vositasi;
massivlar, xususan matritsalar bo'yicha hisob-kitoblar uchun operatorlar to'plami;
ma'lumotlarni   tahlil   qilish   uchun   oraliq   vositalarning   katta,   izchil,
integratsiyalashgan to'plami;
ma'lumotlarni   tahlil   qilish   va   ekranda   yoki   qog'ozda   ko'rsatish   uchun   grafik
vositalar   va   yaxshi   ishlab   chiqilgan,   sodda   va   samarali   dasturlash   tili   bo'lib,   u shartli shartlar, tsikllar, foydalanuvchi tomonidan belgilangan rekursiv funktsiyalar
va kirish va chiqish moslamalarini o'z ichiga oladi.
"Atrof-muhit"  atamasi  uni   boshqa  ma'lumotlarni  tahlil  qilish  dasturlarida  bo'lgani
kabi   juda   o'ziga   xos   va   moslashuvchan   vositalarning   bosqichma-bosqich
to'planishi emas, balki to'liq rejalashtirilgan va izchil tizim sifatida tavsiflash uchun
mo'ljallangan.
R,   xuddi   S   kabi,   haqiqiy   kompyuter   tili   atrofida   ishlab   chiqilgan   va   u
foydalanuvchilarga yangi funktsiyalarni belgilash orqali qo'shimcha funktsiyalarni
qo'shish   imkonini   beradi.  Tizimning  ko'p  qismi  o'zi   S ning  R   dialektida  yozilgan
bo'lib,   bu   foydalanuvchilarga   algoritmik   tanlovlarni   kuzatishni   osonlashtiradi.
Hisoblash   intensiv   vazifalari   uchun   C,   C++   va   Fortran   kodlari   ulanishi   va   ish
vaqtida   chaqirilishi   mumkin.   Ilg'or   foydalanuvchilar   to'g'ridan-to'g'ri   R
obyektlarini boshqarish uchun C kodini yozishlari mumkin.
Ko'pgina   foydalanuvchilar   R   ni   statistika   tizimi   deb   bilishadi.   Biz   buni   statistik
usullar   amalga   oshiriladigan   muhit   sifatida   ko'rishni   afzal   ko'ramiz.   R   paketlar
orqali   kengaytirilishi   mumkin   (osonlik   bilan)   .   R   tarqatish   bilan   ta'minlangan
sakkizga   yaqin   paketlar   mavjud   va   yana   ko'plari   zamonaviy   statistikaning   juda
keng doirasini qamrab oluvchi Internet saytlarining CRAN oilasi orqali mavjud.
R o'zining LaTeX-ga o'xshash hujjat formatiga ega bo'lib, u bir qator formatlarda
ham, qog'oz nusxada ham on-layn rejimda keng qamrovli hujjatlarni taqdim etish
uchun ishlatiladi.
R   dasturlash   tili   tahlilchilar   tez-tez   foydalanadigan   kuchli   va   bepul   statistik
dasturiy vositadir.
R   dasturlash   tili   ochiq   kodli   dasturiy   ta'minot   bo'lib,   u   erda   R   hamjamiyati   uni
ishlab   chiqadi   va   qo'llab-quvvatlaydi,   foydalanuvchilar   esa   uni   bepul   yuklab
olishlari mumkin.
Ochiq manba bo'lish ko'plab afzalliklarni beradi, jumladan, quyidagilar:
Yangi statistik usullar tezda mavjud, chunki R hamjamiyati keng va faoldir. Har   bir   funktsiya   uchun  manba   kodi   bepul   mavjud   va  uni   hamma  ko'rib   chiqishi
mumkin.
R   dasturlash   tilidan   foydalanish   bepul!   Bu   SAS,   STATA   va   SPSS   kabi   nisbatan
qimmat statistik vositalar uchun muhim afzallikdir.
Ushbu   maqolada   men   R   funksiyalaridan   foydalangan   holda   haqiqiy   ma'lumotlar
to'plamiga   asosiy   statistik   tushunchalarni   qo'llash   orqali   R   dasturlash   tilining
kuchli tomonlari haqida qisqacha ma'lumot beraman.
Agar   siz   misollarga   amal   qilmoqchi   bo'lsangiz,   ushbu   maqolada   ko'rsatilgan
kodlarni   R   yoki   RStudio-ga   nusxalashingiz   va   joylashtirishingiz   mumkin.   Barcha
kodlar 100% takrorlanishi mumkin.
Keling, unga sho'ng'iymiz!
R dasturlash tili uchun misol ma'lumotlari
Ushbu   maqolaning   birinchi   qismida   biz   iris   ma'lumotlar   to'plamini   R.   Ronald
Fisher,   biolog   va   statistik   1936   yilda   taqdim   etgan   iris   gullari   ma'lumotlar
to'plamiga yuklaymiz. Unda gul o'lchovlari mavjud.
Ma'lumotlar to'plamini yuklab olgandan so'ng, quyidagi kodni bajarish orqali uni R
ga yuklang:
data(iris)          # Loading iris flower data as example data set
Keyinchalik,   bosh   funksiyasidan   foydalanib,   iris   gullari   ma'lumotlarining
tuzilishini tekshirishimiz mumkin.   Head funktsiyasi ma'lumotlar to'plamining faqat
birinchi olti qatorini qaytaradi:
head(iris)          # Printing	 first	 six	 rows	 of	 iris	 data	 set
Ushbu   jadval   misol   ma'lumotlarimizning   dastlabki   olti   qatorini   ko'rsatadi   va
bizning ma'lumotlarimizda beshta o'zgaruvchi borligini ko'rsatadi: "Sepal.Length",
"Sepal.Width", "Petal.Length", "Petal.Width" va "Turlar". Birinchi   to'rtta   o'zgaruvchi   raqamli   qiymatlarni   o'z   ichiga   oladi   va   beshinchi
o'zgaruvchi bizning ma'lumotlarimizni turli gul turlariga guruhlaydi.
Keyingi   bo'limlarda   biz   ushbu   ma'lumotlarni   tahlil   qilamiz   -   Shuning   uchun
o'qishda davom eting!
Ma'lumotlar   to'plami   uchun   asosiy   tavsiflovchi   statistikani   hisoblash   uchun   R
funksiyalaridan foydalanish
Quyidagi   sintaksis   ma'lumotlar   to'plamidagi   barcha   o'zgaruvchilar
uchun   tavsiflovchi statistik ma'lumotlar to'plamini qanday hisoblashni ko'rsatadi.
Ushbu   vazifa   uchun   biz   quyida   ko'rsatilgandek   xulosa   funksiyasini   qo'llashimiz
mumkin:
summary(iris)          # Return	 summary	 statistics
Ushbu   jadvalda   bizning   ma'lumotlarimizdagi   raqamli   ustunlar   uchun   minimal,   1-
kvantil,   median,   o'rtacha,   3-kvantil   va   maksimal   qiymatlar   va   raqamli   bo'lmagan
ustunlar uchun har bir toifaning hisobi mavjud.
Ushbu   ma'lumot   bizga   o'zgaruvchilarimiz   uchun   ma'lumotlar   taqsimoti   haqida
umumiy ma'lumot beradi.   Biroq, biz ma'lumotlarimizni batafsilroq tahlil qilishimiz
mumkin!
Tegishli   xabarlar   :   Markaziy   tendentsiya   o'lchovlari   va   foizlar   va   kvartillarni
sharhlash
R yordamida guruh bo'yicha tavsiflovchi statistikani hisoblash
Oldingi   bo'limlarda   ko'rganingizdek,   bizning   ma'lumotlar   to'plamimiz
kuzatishlarni   uchta   gul   turi   bo'yicha   guruhlaydi:   setoza,   versicolor   va
virginica.   Shuning   uchun,   turli   xil   gul   turlarining   tavsifiy   statistikasini   solishtirish
qiziqarli bo'lishi mumkin .
Quyidagi   R   kodi   Sepal.Length   o‘zgaruvchisi   uchun   guruh   bo‘yicha   o‘rtachani
(ya’ni   gul   turlarini)   hisoblash   uchun   agregat   va   o‘rtacha   funksiyalardan
foydalanadi: aggregate(Sepal.Length ~ Species,	 iris,	 mean)          	# Return	 mean	 by	 group
Jadvalda   ko'rsatilgandek,   gul   turlarining   o'rtacha   sepal   uzunligi   eng   qisqa   va
virginica turlarining sepal uzunligi eng uzun.
E'tibor   bering,   biz   birinchi   o'zgaruvchi   uchun   faqat   guruh   bo'yicha   o'rtacha
qiymatni   hisobladik.   Biroq,   biz   boshqa   o'zgaruvchilar   uchun   guruh   bo'yicha
o'rtachani   hisoblash   uchun   o'zgaruvchi   nomini   almashtirishimiz   mumkin.   Bundan
tashqari, biz o'rtacha o'rniga boshqa umumiy statistikani hisoblashimiz mumkin.
Ushbu   o'rtacha   farqlar   statistik   ahamiyatga   ega   yoki   yo'qligini   aniqlash   uchun
siz   bir tomonlama ANOVA ni bajarishingiz   kerak .
R dasturlash yordamida korrelyatsiya matritsasi yaratish
O'zgaruvchilar   o'rtasidagi   munosabatlarni   tushunish   qo'shimcha   foydali
ma'lumotlarni beradi.   Ushbu ma'lumotni olish uchun ma'lumotlarimizning raqamli
o'zgaruvchilariga kor funktsiyasini  qo'llash  orqali   korrelyatsiya   matritsasini  (ya'ni,
bir   vaqtning   o'zida   bir   nechta   o'zgaruvchilar   orasidagi
korrelyatsiya   koeffitsientlarini ko'rsatadigan jadval) yaratishimiz mumkin:
cor(iris[	
 , 1:4])          	# Return	 correlation	 matrix
Korrelyatsiya   matritsasida   siz,   masalan,   Petal.Width   va   Petal.Length   o'rtasidagi
korrelyatsiya   juda   yuqori   ekanligini   ko'rishingiz   mumkin,   lekin   Sepal.Width   va
Sepal.Length o'rtasidagi korrelyatsiya nisbatan past.
Tegishli post   :   Korrelyatsiya koeffitsientlarini tushunish
Chiziqli regressiya modelini baholash uchun R dasturlash tilidan foydalanish
R dasturlash tili statistik modellarni baholash   funktsiyalarini ham ta'minlaydi   .   Eng
ko'p ishlatiladigan model turlaridan biri chiziqli   regressiyadir   .   R da lm va jamlama
funksiyalaridan   foydalanib,   biz   ushbu   modellarni   taxmin   qilishimiz   va
baholashimiz mumkin. Quyidagi   R  sintaksisi   Sepal.Length  o zgaruvchisidan  bog liq  o zgaruvchi  sifatidaʻ ʻ ʻ
va   ma lumotlar   to plamidagi   qolgan   o zgaruvchilardan   mustaqil   o zgaruvchilar	
ʼ ʻ ʻ ʻ
sifatida foydalanadi:
summary(lm(Sepal.Length	
 ~ .,	 iris))          	# Results	 of	 linear	 regression
Boshqa   ko'plab   ko'rsatkichlardan   tashqari,   chiqish   regressiya   koeffitsientlari,
standart   xatolar,   t-qiymatlari   va   p-qiymatlarini   ko'rsatadi.   Chiqishning   o'ng
tomonidagi   yulduzlar   ko'rsatganidek,   barcha   mustaqil   o'zgaruvchilar   bog'liq
o'zgaruvchiga sezilarli darajada ta'sir qiladi.
Tegishli post   :   Regressiya koeffitsientlari va ularning P-qiymatlarini sharhlash
R dasturlash yordamida tasodifiy raqamlarni yaratish
Hozirgacha   biz   iris   gullari   ma'lumotlar   to'plamini   tahlil   qilish   uchun   R   dan
foydalandik.   Biroq, R dasturlash tili tasodifiy ma'lumotlarni yaratish   uchun kuchli
funktsiyalarni ham ta'minlaydi   .
Tasodifiy   jarayonlar   ishtirok   etganda,   tasodifiy   urug'ni   o'rnatish   foydali
bo'ladi   .   Tasodifiy   urug'   -   bu   psevdor   tasodifiy   sonlar   generatorini   ishga
tushiradigan   va   boshqa   tahlilchilarga   bizning   "tasodifiy"   chiqishimizni
ko'paytirishga   imkon   beradigan   raqam.   Biz   set.seed   funksiyasidan   foydalanib,   R-
da tasodifiy urug'ni o'rnatishimiz mumkin: set.seed(101101)          # Set a random seed
Keyinchalik,   tasodifiy   taqsimotdan   tasodifiy   sonlarni   chizishimiz   mumkin.   rnorm
funktsiyasi   normal taqsimotdan   raqamlarni oladi :
x_small <- rnorm(20)          # Generate small sample
Oldingi R kodi oddiy taqsimotdan keyin 20 ta tasodifiy sonni yaratdi.   Biz tasodifiy
yaratilgan   ma'lumotlarimizni   histogrammada   hist   funktsiyasidan   foydalanib
ko'rishimiz mumkin:
hist(x_small)          # Draw	 histogram	 of	 small	 sample
Oldingi   rasm   tasodifiy   ma'lumotlarimizni   histogrammada   tasvirlaydi.   Ko'rib
turganingizdek, bizning ma'lumotlarimiz hali normal taqsimlanmagan ko'rinadi.
Tegishli   xabarlar   :   Ma'lumotlaringizni   tushunish   va   normallikni   baholash   uchun
histogrammalardan foydalanish: histogramma va QQ chizmalariga qarshi
Buning sababi shundaki, biz oddiy taqsimotdan atigi 20 ta tasodifiy sonni oldik   va katta
sonlar qonuni   tufayli normal taqsimotni taxmin qilish uchun kattaroq   namunani   olishimiz
kerak .
Buni   rnorm   funksiyasidagi   sonni   ko'paytirish   orqali   amalga   oshirishimiz
mumkin.   Quyidagi R kodi oddiy taqsimotdan 10000 ta tasodifiy sonni oladi:
x_large	
 <-	 rnorm(10000)          	# Generate	 large	 sample Keling, ushbu ma'lumotlarni gistogrammada chizamiz:
hist(x_large, breaks	 = 100)          	# Draw	 histogram	 of	 large	 sample
Kodni bajargandan so'ng, R quyidagi gistogrammani yaratadi.
Ko'rib turganingizdek, bizning ma'lumotlarimiz normal taqsimotga deyarli mos keladi.

R dasturlash tili Reja: R dasturlash tili ............................................................................................................................................ 1 R bilan tanishtirish ....................................................................................................................................... 2 R dasturlash tili uchun misol ma'lumotlari .................................................................................................. 4 R dasturlash yordamida korrelyatsiya matritsasi yaratish ........................................................................... 6 Chiziqli regressiya modelini baholash uchun R dasturlash tilidan foydalanish ............................................ 6 R dasturlash yordamida tasodifiy raqamlarni yaratish ................................................................................ 7

R bilan tanishtirish R - bu statistik hisoblash va grafika uchun til va muhit. Bu Jon Chambers va uning hamkasblari tomonidan Bell Laboratories (avvalgi AT&T, hozir Lucent Technologies) da ishlab chiqilgan S tili va muhitiga o'xshash GNU loyihasidir . R ni S ning boshqa amalga oshirilishi deb hisoblash mumkin. Ba'zi muhim farqlar mavjud, ammo S uchun yozilgan ko'p kod R ostida o'zgarmagan holda ishlaydi. R turli xil statistik (chiziqli va chiziqli bo'lmagan modellashtirish, klassik statistik testlar, vaqt-seriyalarni tahlil qilish, tasniflash, klasterlash, …) va grafik usullarni taqdim etadi va juda kengaytiriladi. S tili ko'pincha statistik metodologiya bo'yicha tadqiqot uchun tanlangan vositadir va R ushbu faoliyatda ishtirok etish uchun ochiq manba yo'nalishini taqdim etadi. R ning kuchli tomonlaridan biri bu yaxshi ishlab chiqilgan nashr sifatiga ega syujetlarni, jumladan matematik belgilar va kerak bo‘lganda formulalarni ishlab chiqarish qulayligidir. Grafikadagi kichik dizayn tanlovlari uchun standart sozlamalarga katta e'tibor berilgan, ammo foydalanuvchi to'liq nazoratni saqlab qoladi. R bepul dasturiy ta'minot sifatida Erkin dasturiy ta'minot jamg'armasining GNU General Public License shartlariga muvofiq manba kodi shaklida mavjud . U turli xil UNIX platformalari va shunga o'xshash tizimlar (jumladan, FreeBSD va Linux), Windows va MacOS larni kompilyatsiya qiladi va ishlaydi. R muhiti R - ma'lumotlarni manipulyatsiya qilish, hisoblash va grafik ko'rsatish uchun dasturiy ta'minot vositalarining o'rnatilgan to'plami. O'z ichiga oladi samarali ma'lumotlarni qayta ishlash va saqlash vositasi; massivlar, xususan matritsalar bo'yicha hisob-kitoblar uchun operatorlar to'plami; ma'lumotlarni tahlil qilish uchun oraliq vositalarning katta, izchil, integratsiyalashgan to'plami; ma'lumotlarni tahlil qilish va ekranda yoki qog'ozda ko'rsatish uchun grafik vositalar va yaxshi ishlab chiqilgan, sodda va samarali dasturlash tili bo'lib, u

shartli shartlar, tsikllar, foydalanuvchi tomonidan belgilangan rekursiv funktsiyalar va kirish va chiqish moslamalarini o'z ichiga oladi. "Atrof-muhit" atamasi uni boshqa ma'lumotlarni tahlil qilish dasturlarida bo'lgani kabi juda o'ziga xos va moslashuvchan vositalarning bosqichma-bosqich to'planishi emas, balki to'liq rejalashtirilgan va izchil tizim sifatida tavsiflash uchun mo'ljallangan. R, xuddi S kabi, haqiqiy kompyuter tili atrofida ishlab chiqilgan va u foydalanuvchilarga yangi funktsiyalarni belgilash orqali qo'shimcha funktsiyalarni qo'shish imkonini beradi. Tizimning ko'p qismi o'zi S ning R dialektida yozilgan bo'lib, bu foydalanuvchilarga algoritmik tanlovlarni kuzatishni osonlashtiradi. Hisoblash intensiv vazifalari uchun C, C++ va Fortran kodlari ulanishi va ish vaqtida chaqirilishi mumkin. Ilg'or foydalanuvchilar to'g'ridan-to'g'ri R obyektlarini boshqarish uchun C kodini yozishlari mumkin. Ko'pgina foydalanuvchilar R ni statistika tizimi deb bilishadi. Biz buni statistik usullar amalga oshiriladigan muhit sifatida ko'rishni afzal ko'ramiz. R paketlar orqali kengaytirilishi mumkin (osonlik bilan) . R tarqatish bilan ta'minlangan sakkizga yaqin paketlar mavjud va yana ko'plari zamonaviy statistikaning juda keng doirasini qamrab oluvchi Internet saytlarining CRAN oilasi orqali mavjud. R o'zining LaTeX-ga o'xshash hujjat formatiga ega bo'lib, u bir qator formatlarda ham, qog'oz nusxada ham on-layn rejimda keng qamrovli hujjatlarni taqdim etish uchun ishlatiladi. R dasturlash tili tahlilchilar tez-tez foydalanadigan kuchli va bepul statistik dasturiy vositadir. R dasturlash tili ochiq kodli dasturiy ta'minot bo'lib, u erda R hamjamiyati uni ishlab chiqadi va qo'llab-quvvatlaydi, foydalanuvchilar esa uni bepul yuklab olishlari mumkin. Ochiq manba bo'lish ko'plab afzalliklarni beradi, jumladan, quyidagilar: Yangi statistik usullar tezda mavjud, chunki R hamjamiyati keng va faoldir.

Har bir funktsiya uchun manba kodi bepul mavjud va uni hamma ko'rib chiqishi mumkin. R dasturlash tilidan foydalanish bepul! Bu SAS, STATA va SPSS kabi nisbatan qimmat statistik vositalar uchun muhim afzallikdir. Ushbu maqolada men R funksiyalaridan foydalangan holda haqiqiy ma'lumotlar to'plamiga asosiy statistik tushunchalarni qo'llash orqali R dasturlash tilining kuchli tomonlari haqida qisqacha ma'lumot beraman. Agar siz misollarga amal qilmoqchi bo'lsangiz, ushbu maqolada ko'rsatilgan kodlarni R yoki RStudio-ga nusxalashingiz va joylashtirishingiz mumkin. Barcha kodlar 100% takrorlanishi mumkin. Keling, unga sho'ng'iymiz! R dasturlash tili uchun misol ma'lumotlari Ushbu maqolaning birinchi qismida biz iris ma'lumotlar to'plamini R. Ronald Fisher, biolog va statistik 1936 yilda taqdim etgan iris gullari ma'lumotlar to'plamiga yuklaymiz. Unda gul o'lchovlari mavjud. Ma'lumotlar to'plamini yuklab olgandan so'ng, quyidagi kodni bajarish orqali uni R ga yuklang: data(iris) # Loading iris flower data as example data set Keyinchalik, bosh funksiyasidan foydalanib, iris gullari ma'lumotlarining tuzilishini tekshirishimiz mumkin. Head funktsiyasi ma'lumotlar to'plamining faqat birinchi olti qatorini qaytaradi: head(iris)          # Printing  first  six  rows  of  iris  data  set Ushbu jadval misol ma'lumotlarimizning dastlabki olti qatorini ko'rsatadi va bizning ma'lumotlarimizda beshta o'zgaruvchi borligini ko'rsatadi: "Sepal.Length", "Sepal.Width", "Petal.Length", "Petal.Width" va "Turlar".

Birinchi to'rtta o'zgaruvchi raqamli qiymatlarni o'z ichiga oladi va beshinchi o'zgaruvchi bizning ma'lumotlarimizni turli gul turlariga guruhlaydi. Keyingi bo'limlarda biz ushbu ma'lumotlarni tahlil qilamiz - Shuning uchun o'qishda davom eting! Ma'lumotlar to'plami uchun asosiy tavsiflovchi statistikani hisoblash uchun R funksiyalaridan foydalanish Quyidagi sintaksis ma'lumotlar to'plamidagi barcha o'zgaruvchilar uchun tavsiflovchi statistik ma'lumotlar to'plamini qanday hisoblashni ko'rsatadi. Ushbu vazifa uchun biz quyida ko'rsatilgandek xulosa funksiyasini qo'llashimiz mumkin: summary(iris)          # Return  summary  statistics Ushbu jadvalda bizning ma'lumotlarimizdagi raqamli ustunlar uchun minimal, 1- kvantil, median, o'rtacha, 3-kvantil va maksimal qiymatlar va raqamli bo'lmagan ustunlar uchun har bir toifaning hisobi mavjud. Ushbu ma'lumot bizga o'zgaruvchilarimiz uchun ma'lumotlar taqsimoti haqida umumiy ma'lumot beradi. Biroq, biz ma'lumotlarimizni batafsilroq tahlil qilishimiz mumkin! Tegishli xabarlar : Markaziy tendentsiya o'lchovlari va foizlar va kvartillarni sharhlash R yordamida guruh bo'yicha tavsiflovchi statistikani hisoblash Oldingi bo'limlarda ko'rganingizdek, bizning ma'lumotlar to'plamimiz kuzatishlarni uchta gul turi bo'yicha guruhlaydi: setoza, versicolor va virginica. Shuning uchun, turli xil gul turlarining tavsifiy statistikasini solishtirish qiziqarli bo'lishi mumkin . Quyidagi R kodi Sepal.Length o‘zgaruvchisi uchun guruh bo‘yicha o‘rtachani (ya’ni gul turlarini) hisoblash uchun agregat va o‘rtacha funksiyalardan foydalanadi: