R dasturlash tili
![R dasturlash tili
Reja:
R dasturlash tili ............................................................................................................................................ 1
R bilan tanishtirish ....................................................................................................................................... 2
R dasturlash tili uchun misol ma'lumotlari .................................................................................................. 4
R dasturlash yordamida korrelyatsiya matritsasi yaratish ........................................................................... 6
Chiziqli regressiya modelini baholash uchun R dasturlash tilidan foydalanish ............................................ 6
R dasturlash yordamida tasodifiy raqamlarni yaratish ................................................................................ 7](/data/documents/aa5d1b08-e43a-4109-8454-68f8b826ce40/page_1.png)
![R bilan tanishtirish
R - bu statistik hisoblash va grafika uchun til va muhit. Bu Jon Chambers va uning
hamkasblari tomonidan Bell Laboratories (avvalgi AT&T, hozir Lucent
Technologies) da ishlab chiqilgan S tili va muhitiga o'xshash GNU loyihasidir . R
ni S ning boshqa amalga oshirilishi deb hisoblash mumkin. Ba'zi muhim farqlar
mavjud, ammo S uchun yozilgan ko'p kod R ostida o'zgarmagan holda ishlaydi.
R turli xil statistik (chiziqli va chiziqli bo'lmagan modellashtirish, klassik statistik
testlar, vaqt-seriyalarni tahlil qilish, tasniflash, klasterlash, …) va grafik usullarni
taqdim etadi va juda kengaytiriladi. S tili ko'pincha statistik metodologiya bo'yicha
tadqiqot uchun tanlangan vositadir va R ushbu faoliyatda ishtirok etish uchun
ochiq manba yo'nalishini taqdim etadi.
R ning kuchli tomonlaridan biri bu yaxshi ishlab chiqilgan nashr sifatiga ega
syujetlarni, jumladan matematik belgilar va kerak bo‘lganda formulalarni ishlab
chiqarish qulayligidir. Grafikadagi kichik dizayn tanlovlari uchun standart
sozlamalarga katta e'tibor berilgan, ammo foydalanuvchi to'liq nazoratni saqlab
qoladi.
R bepul dasturiy ta'minot sifatida Erkin dasturiy ta'minot jamg'armasining GNU
General Public License shartlariga muvofiq manba kodi shaklida mavjud . U turli
xil UNIX platformalari va shunga o'xshash tizimlar (jumladan, FreeBSD va
Linux), Windows va MacOS larni kompilyatsiya qiladi va ishlaydi.
R muhiti
R - ma'lumotlarni manipulyatsiya qilish, hisoblash va grafik ko'rsatish uchun
dasturiy ta'minot vositalarining o'rnatilgan to'plami. O'z ichiga oladi samarali
ma'lumotlarni qayta ishlash va saqlash vositasi;
massivlar, xususan matritsalar bo'yicha hisob-kitoblar uchun operatorlar to'plami;
ma'lumotlarni tahlil qilish uchun oraliq vositalarning katta, izchil,
integratsiyalashgan to'plami;
ma'lumotlarni tahlil qilish va ekranda yoki qog'ozda ko'rsatish uchun grafik
vositalar va yaxshi ishlab chiqilgan, sodda va samarali dasturlash tili bo'lib, u](/data/documents/aa5d1b08-e43a-4109-8454-68f8b826ce40/page_2.png)
![shartli shartlar, tsikllar, foydalanuvchi tomonidan belgilangan rekursiv funktsiyalar
va kirish va chiqish moslamalarini o'z ichiga oladi.
"Atrof-muhit" atamasi uni boshqa ma'lumotlarni tahlil qilish dasturlarida bo'lgani
kabi juda o'ziga xos va moslashuvchan vositalarning bosqichma-bosqich
to'planishi emas, balki to'liq rejalashtirilgan va izchil tizim sifatida tavsiflash uchun
mo'ljallangan.
R, xuddi S kabi, haqiqiy kompyuter tili atrofida ishlab chiqilgan va u
foydalanuvchilarga yangi funktsiyalarni belgilash orqali qo'shimcha funktsiyalarni
qo'shish imkonini beradi. Tizimning ko'p qismi o'zi S ning R dialektida yozilgan
bo'lib, bu foydalanuvchilarga algoritmik tanlovlarni kuzatishni osonlashtiradi.
Hisoblash intensiv vazifalari uchun C, C++ va Fortran kodlari ulanishi va ish
vaqtida chaqirilishi mumkin. Ilg'or foydalanuvchilar to'g'ridan-to'g'ri R
obyektlarini boshqarish uchun C kodini yozishlari mumkin.
Ko'pgina foydalanuvchilar R ni statistika tizimi deb bilishadi. Biz buni statistik
usullar amalga oshiriladigan muhit sifatida ko'rishni afzal ko'ramiz. R paketlar
orqali kengaytirilishi mumkin (osonlik bilan) . R tarqatish bilan ta'minlangan
sakkizga yaqin paketlar mavjud va yana ko'plari zamonaviy statistikaning juda
keng doirasini qamrab oluvchi Internet saytlarining CRAN oilasi orqali mavjud.
R o'zining LaTeX-ga o'xshash hujjat formatiga ega bo'lib, u bir qator formatlarda
ham, qog'oz nusxada ham on-layn rejimda keng qamrovli hujjatlarni taqdim etish
uchun ishlatiladi.
R dasturlash tili tahlilchilar tez-tez foydalanadigan kuchli va bepul statistik
dasturiy vositadir.
R dasturlash tili ochiq kodli dasturiy ta'minot bo'lib, u erda R hamjamiyati uni
ishlab chiqadi va qo'llab-quvvatlaydi, foydalanuvchilar esa uni bepul yuklab
olishlari mumkin.
Ochiq manba bo'lish ko'plab afzalliklarni beradi, jumladan, quyidagilar:
Yangi statistik usullar tezda mavjud, chunki R hamjamiyati keng va faoldir.](/data/documents/aa5d1b08-e43a-4109-8454-68f8b826ce40/page_3.png)
![Har bir funktsiya uchun manba kodi bepul mavjud va uni hamma ko'rib chiqishi
mumkin.
R dasturlash tilidan foydalanish bepul! Bu SAS, STATA va SPSS kabi nisbatan
qimmat statistik vositalar uchun muhim afzallikdir.
Ushbu maqolada men R funksiyalaridan foydalangan holda haqiqiy ma'lumotlar
to'plamiga asosiy statistik tushunchalarni qo'llash orqali R dasturlash tilining
kuchli tomonlari haqida qisqacha ma'lumot beraman.
Agar siz misollarga amal qilmoqchi bo'lsangiz, ushbu maqolada ko'rsatilgan
kodlarni R yoki RStudio-ga nusxalashingiz va joylashtirishingiz mumkin. Barcha
kodlar 100% takrorlanishi mumkin.
Keling, unga sho'ng'iymiz!
R dasturlash tili uchun misol ma'lumotlari
Ushbu maqolaning birinchi qismida biz iris ma'lumotlar to'plamini R. Ronald
Fisher, biolog va statistik 1936 yilda taqdim etgan iris gullari ma'lumotlar
to'plamiga yuklaymiz. Unda gul o'lchovlari mavjud.
Ma'lumotlar to'plamini yuklab olgandan so'ng, quyidagi kodni bajarish orqali uni R
ga yuklang:
data(iris) # Loading iris flower data as example data set
Keyinchalik, bosh funksiyasidan foydalanib, iris gullari ma'lumotlarining
tuzilishini tekshirishimiz mumkin. Head funktsiyasi ma'lumotlar to'plamining faqat
birinchi olti qatorini qaytaradi:
head(iris) # Printing first six rows of iris data set
Ushbu jadval misol ma'lumotlarimizning dastlabki olti qatorini ko'rsatadi va
bizning ma'lumotlarimizda beshta o'zgaruvchi borligini ko'rsatadi: "Sepal.Length",
"Sepal.Width", "Petal.Length", "Petal.Width" va "Turlar".](/data/documents/aa5d1b08-e43a-4109-8454-68f8b826ce40/page_4.png)
![Birinchi to'rtta o'zgaruvchi raqamli qiymatlarni o'z ichiga oladi va beshinchi
o'zgaruvchi bizning ma'lumotlarimizni turli gul turlariga guruhlaydi.
Keyingi bo'limlarda biz ushbu ma'lumotlarni tahlil qilamiz - Shuning uchun
o'qishda davom eting!
Ma'lumotlar to'plami uchun asosiy tavsiflovchi statistikani hisoblash uchun R
funksiyalaridan foydalanish
Quyidagi sintaksis ma'lumotlar to'plamidagi barcha o'zgaruvchilar
uchun tavsiflovchi statistik ma'lumotlar to'plamini qanday hisoblashni ko'rsatadi.
Ushbu vazifa uchun biz quyida ko'rsatilgandek xulosa funksiyasini qo'llashimiz
mumkin:
summary(iris) # Return summary statistics
Ushbu jadvalda bizning ma'lumotlarimizdagi raqamli ustunlar uchun minimal, 1-
kvantil, median, o'rtacha, 3-kvantil va maksimal qiymatlar va raqamli bo'lmagan
ustunlar uchun har bir toifaning hisobi mavjud.
Ushbu ma'lumot bizga o'zgaruvchilarimiz uchun ma'lumotlar taqsimoti haqida
umumiy ma'lumot beradi. Biroq, biz ma'lumotlarimizni batafsilroq tahlil qilishimiz
mumkin!
Tegishli xabarlar : Markaziy tendentsiya o'lchovlari va foizlar va kvartillarni
sharhlash
R yordamida guruh bo'yicha tavsiflovchi statistikani hisoblash
Oldingi bo'limlarda ko'rganingizdek, bizning ma'lumotlar to'plamimiz
kuzatishlarni uchta gul turi bo'yicha guruhlaydi: setoza, versicolor va
virginica. Shuning uchun, turli xil gul turlarining tavsifiy statistikasini solishtirish
qiziqarli bo'lishi mumkin .
Quyidagi R kodi Sepal.Length o‘zgaruvchisi uchun guruh bo‘yicha o‘rtachani
(ya’ni gul turlarini) hisoblash uchun agregat va o‘rtacha funksiyalardan
foydalanadi:](/data/documents/aa5d1b08-e43a-4109-8454-68f8b826ce40/page_5.png)
![aggregate(Sepal.Length ~ Species, iris, mean) # Return mean by group
Jadvalda ko'rsatilgandek, gul turlarining o'rtacha sepal uzunligi eng qisqa va
virginica turlarining sepal uzunligi eng uzun.
E'tibor bering, biz birinchi o'zgaruvchi uchun faqat guruh bo'yicha o'rtacha
qiymatni hisobladik. Biroq, biz boshqa o'zgaruvchilar uchun guruh bo'yicha
o'rtachani hisoblash uchun o'zgaruvchi nomini almashtirishimiz mumkin. Bundan
tashqari, biz o'rtacha o'rniga boshqa umumiy statistikani hisoblashimiz mumkin.
Ushbu o'rtacha farqlar statistik ahamiyatga ega yoki yo'qligini aniqlash uchun
siz bir tomonlama ANOVA ni bajarishingiz kerak .
R dasturlash yordamida korrelyatsiya matritsasi yaratish
O'zgaruvchilar o'rtasidagi munosabatlarni tushunish qo'shimcha foydali
ma'lumotlarni beradi. Ushbu ma'lumotni olish uchun ma'lumotlarimizning raqamli
o'zgaruvchilariga kor funktsiyasini qo'llash orqali korrelyatsiya matritsasini (ya'ni,
bir vaqtning o'zida bir nechta o'zgaruvchilar orasidagi
korrelyatsiya koeffitsientlarini ko'rsatadigan jadval) yaratishimiz mumkin:
cor(iris[
, 1:4]) # Return correlation matrix
Korrelyatsiya matritsasida siz, masalan, Petal.Width va Petal.Length o'rtasidagi
korrelyatsiya juda yuqori ekanligini ko'rishingiz mumkin, lekin Sepal.Width va
Sepal.Length o'rtasidagi korrelyatsiya nisbatan past.
Tegishli post : Korrelyatsiya koeffitsientlarini tushunish
Chiziqli regressiya modelini baholash uchun R dasturlash tilidan foydalanish
R dasturlash tili statistik modellarni baholash funktsiyalarini ham ta'minlaydi . Eng
ko'p ishlatiladigan model turlaridan biri chiziqli regressiyadir . R da lm va jamlama
funksiyalaridan foydalanib, biz ushbu modellarni taxmin qilishimiz va
baholashimiz mumkin.](/data/documents/aa5d1b08-e43a-4109-8454-68f8b826ce40/page_6.png)
![Quyidagi R sintaksisi Sepal.Length o zgaruvchisidan bog liq o zgaruvchi sifatidaʻ ʻ ʻ
va ma lumotlar to plamidagi qolgan o zgaruvchilardan mustaqil o zgaruvchilar
ʼ ʻ ʻ ʻ
sifatida foydalanadi:
summary(lm(Sepal.Length
~ ., iris)) # Results of linear regression
Boshqa ko'plab ko'rsatkichlardan tashqari, chiqish regressiya koeffitsientlari,
standart xatolar, t-qiymatlari va p-qiymatlarini ko'rsatadi. Chiqishning o'ng
tomonidagi yulduzlar ko'rsatganidek, barcha mustaqil o'zgaruvchilar bog'liq
o'zgaruvchiga sezilarli darajada ta'sir qiladi.
Tegishli post : Regressiya koeffitsientlari va ularning P-qiymatlarini sharhlash
R dasturlash yordamida tasodifiy raqamlarni yaratish
Hozirgacha biz iris gullari ma'lumotlar to'plamini tahlil qilish uchun R dan
foydalandik. Biroq, R dasturlash tili tasodifiy ma'lumotlarni yaratish uchun kuchli
funktsiyalarni ham ta'minlaydi .
Tasodifiy jarayonlar ishtirok etganda, tasodifiy urug'ni o'rnatish foydali
bo'ladi . Tasodifiy urug' - bu psevdor tasodifiy sonlar generatorini ishga
tushiradigan va boshqa tahlilchilarga bizning "tasodifiy" chiqishimizni
ko'paytirishga imkon beradigan raqam. Biz set.seed funksiyasidan foydalanib, R-
da tasodifiy urug'ni o'rnatishimiz mumkin:](/data/documents/aa5d1b08-e43a-4109-8454-68f8b826ce40/page_7.png)
![set.seed(101101) # Set a random seed
Keyinchalik, tasodifiy taqsimotdan tasodifiy sonlarni chizishimiz mumkin. rnorm
funktsiyasi normal taqsimotdan raqamlarni oladi :
x_small <- rnorm(20) # Generate small sample
Oldingi R kodi oddiy taqsimotdan keyin 20 ta tasodifiy sonni yaratdi. Biz tasodifiy
yaratilgan ma'lumotlarimizni histogrammada hist funktsiyasidan foydalanib
ko'rishimiz mumkin:
hist(x_small) # Draw histogram of small sample
Oldingi rasm tasodifiy ma'lumotlarimizni histogrammada tasvirlaydi. Ko'rib
turganingizdek, bizning ma'lumotlarimiz hali normal taqsimlanmagan ko'rinadi.
Tegishli xabarlar : Ma'lumotlaringizni tushunish va normallikni baholash uchun
histogrammalardan foydalanish: histogramma va QQ chizmalariga qarshi
Buning sababi shundaki, biz oddiy taqsimotdan atigi 20 ta tasodifiy sonni oldik va katta
sonlar qonuni tufayli normal taqsimotni taxmin qilish uchun kattaroq namunani olishimiz
kerak .
Buni rnorm funksiyasidagi sonni ko'paytirish orqali amalga oshirishimiz
mumkin. Quyidagi R kodi oddiy taqsimotdan 10000 ta tasodifiy sonni oladi:
x_large
<- rnorm(10000) # Generate large sample](/data/documents/aa5d1b08-e43a-4109-8454-68f8b826ce40/page_8.png)
![Keling, ushbu ma'lumotlarni gistogrammada chizamiz:
hist(x_large, breaks = 100) # Draw histogram of large sample
Kodni bajargandan so'ng, R quyidagi gistogrammani yaratadi.
Ko'rib turganingizdek, bizning ma'lumotlarimiz normal taqsimotga deyarli mos keladi.](/data/documents/aa5d1b08-e43a-4109-8454-68f8b826ce40/page_9.png)
R dasturlash tili Reja: R dasturlash tili ............................................................................................................................................ 1 R bilan tanishtirish ....................................................................................................................................... 2 R dasturlash tili uchun misol ma'lumotlari .................................................................................................. 4 R dasturlash yordamida korrelyatsiya matritsasi yaratish ........................................................................... 6 Chiziqli regressiya modelini baholash uchun R dasturlash tilidan foydalanish ............................................ 6 R dasturlash yordamida tasodifiy raqamlarni yaratish ................................................................................ 7
R bilan tanishtirish R - bu statistik hisoblash va grafika uchun til va muhit. Bu Jon Chambers va uning hamkasblari tomonidan Bell Laboratories (avvalgi AT&T, hozir Lucent Technologies) da ishlab chiqilgan S tili va muhitiga o'xshash GNU loyihasidir . R ni S ning boshqa amalga oshirilishi deb hisoblash mumkin. Ba'zi muhim farqlar mavjud, ammo S uchun yozilgan ko'p kod R ostida o'zgarmagan holda ishlaydi. R turli xil statistik (chiziqli va chiziqli bo'lmagan modellashtirish, klassik statistik testlar, vaqt-seriyalarni tahlil qilish, tasniflash, klasterlash, …) va grafik usullarni taqdim etadi va juda kengaytiriladi. S tili ko'pincha statistik metodologiya bo'yicha tadqiqot uchun tanlangan vositadir va R ushbu faoliyatda ishtirok etish uchun ochiq manba yo'nalishini taqdim etadi. R ning kuchli tomonlaridan biri bu yaxshi ishlab chiqilgan nashr sifatiga ega syujetlarni, jumladan matematik belgilar va kerak bo‘lganda formulalarni ishlab chiqarish qulayligidir. Grafikadagi kichik dizayn tanlovlari uchun standart sozlamalarga katta e'tibor berilgan, ammo foydalanuvchi to'liq nazoratni saqlab qoladi. R bepul dasturiy ta'minot sifatida Erkin dasturiy ta'minot jamg'armasining GNU General Public License shartlariga muvofiq manba kodi shaklida mavjud . U turli xil UNIX platformalari va shunga o'xshash tizimlar (jumladan, FreeBSD va Linux), Windows va MacOS larni kompilyatsiya qiladi va ishlaydi. R muhiti R - ma'lumotlarni manipulyatsiya qilish, hisoblash va grafik ko'rsatish uchun dasturiy ta'minot vositalarining o'rnatilgan to'plami. O'z ichiga oladi samarali ma'lumotlarni qayta ishlash va saqlash vositasi; massivlar, xususan matritsalar bo'yicha hisob-kitoblar uchun operatorlar to'plami; ma'lumotlarni tahlil qilish uchun oraliq vositalarning katta, izchil, integratsiyalashgan to'plami; ma'lumotlarni tahlil qilish va ekranda yoki qog'ozda ko'rsatish uchun grafik vositalar va yaxshi ishlab chiqilgan, sodda va samarali dasturlash tili bo'lib, u
shartli shartlar, tsikllar, foydalanuvchi tomonidan belgilangan rekursiv funktsiyalar va kirish va chiqish moslamalarini o'z ichiga oladi. "Atrof-muhit" atamasi uni boshqa ma'lumotlarni tahlil qilish dasturlarida bo'lgani kabi juda o'ziga xos va moslashuvchan vositalarning bosqichma-bosqich to'planishi emas, balki to'liq rejalashtirilgan va izchil tizim sifatida tavsiflash uchun mo'ljallangan. R, xuddi S kabi, haqiqiy kompyuter tili atrofida ishlab chiqilgan va u foydalanuvchilarga yangi funktsiyalarni belgilash orqali qo'shimcha funktsiyalarni qo'shish imkonini beradi. Tizimning ko'p qismi o'zi S ning R dialektida yozilgan bo'lib, bu foydalanuvchilarga algoritmik tanlovlarni kuzatishni osonlashtiradi. Hisoblash intensiv vazifalari uchun C, C++ va Fortran kodlari ulanishi va ish vaqtida chaqirilishi mumkin. Ilg'or foydalanuvchilar to'g'ridan-to'g'ri R obyektlarini boshqarish uchun C kodini yozishlari mumkin. Ko'pgina foydalanuvchilar R ni statistika tizimi deb bilishadi. Biz buni statistik usullar amalga oshiriladigan muhit sifatida ko'rishni afzal ko'ramiz. R paketlar orqali kengaytirilishi mumkin (osonlik bilan) . R tarqatish bilan ta'minlangan sakkizga yaqin paketlar mavjud va yana ko'plari zamonaviy statistikaning juda keng doirasini qamrab oluvchi Internet saytlarining CRAN oilasi orqali mavjud. R o'zining LaTeX-ga o'xshash hujjat formatiga ega bo'lib, u bir qator formatlarda ham, qog'oz nusxada ham on-layn rejimda keng qamrovli hujjatlarni taqdim etish uchun ishlatiladi. R dasturlash tili tahlilchilar tez-tez foydalanadigan kuchli va bepul statistik dasturiy vositadir. R dasturlash tili ochiq kodli dasturiy ta'minot bo'lib, u erda R hamjamiyati uni ishlab chiqadi va qo'llab-quvvatlaydi, foydalanuvchilar esa uni bepul yuklab olishlari mumkin. Ochiq manba bo'lish ko'plab afzalliklarni beradi, jumladan, quyidagilar: Yangi statistik usullar tezda mavjud, chunki R hamjamiyati keng va faoldir.
Har bir funktsiya uchun manba kodi bepul mavjud va uni hamma ko'rib chiqishi mumkin. R dasturlash tilidan foydalanish bepul! Bu SAS, STATA va SPSS kabi nisbatan qimmat statistik vositalar uchun muhim afzallikdir. Ushbu maqolada men R funksiyalaridan foydalangan holda haqiqiy ma'lumotlar to'plamiga asosiy statistik tushunchalarni qo'llash orqali R dasturlash tilining kuchli tomonlari haqida qisqacha ma'lumot beraman. Agar siz misollarga amal qilmoqchi bo'lsangiz, ushbu maqolada ko'rsatilgan kodlarni R yoki RStudio-ga nusxalashingiz va joylashtirishingiz mumkin. Barcha kodlar 100% takrorlanishi mumkin. Keling, unga sho'ng'iymiz! R dasturlash tili uchun misol ma'lumotlari Ushbu maqolaning birinchi qismida biz iris ma'lumotlar to'plamini R. Ronald Fisher, biolog va statistik 1936 yilda taqdim etgan iris gullari ma'lumotlar to'plamiga yuklaymiz. Unda gul o'lchovlari mavjud. Ma'lumotlar to'plamini yuklab olgandan so'ng, quyidagi kodni bajarish orqali uni R ga yuklang: data(iris) # Loading iris flower data as example data set Keyinchalik, bosh funksiyasidan foydalanib, iris gullari ma'lumotlarining tuzilishini tekshirishimiz mumkin. Head funktsiyasi ma'lumotlar to'plamining faqat birinchi olti qatorini qaytaradi: head(iris) # Printing first six rows of iris data set Ushbu jadval misol ma'lumotlarimizning dastlabki olti qatorini ko'rsatadi va bizning ma'lumotlarimizda beshta o'zgaruvchi borligini ko'rsatadi: "Sepal.Length", "Sepal.Width", "Petal.Length", "Petal.Width" va "Turlar".
Birinchi to'rtta o'zgaruvchi raqamli qiymatlarni o'z ichiga oladi va beshinchi o'zgaruvchi bizning ma'lumotlarimizni turli gul turlariga guruhlaydi. Keyingi bo'limlarda biz ushbu ma'lumotlarni tahlil qilamiz - Shuning uchun o'qishda davom eting! Ma'lumotlar to'plami uchun asosiy tavsiflovchi statistikani hisoblash uchun R funksiyalaridan foydalanish Quyidagi sintaksis ma'lumotlar to'plamidagi barcha o'zgaruvchilar uchun tavsiflovchi statistik ma'lumotlar to'plamini qanday hisoblashni ko'rsatadi. Ushbu vazifa uchun biz quyida ko'rsatilgandek xulosa funksiyasini qo'llashimiz mumkin: summary(iris) # Return summary statistics Ushbu jadvalda bizning ma'lumotlarimizdagi raqamli ustunlar uchun minimal, 1- kvantil, median, o'rtacha, 3-kvantil va maksimal qiymatlar va raqamli bo'lmagan ustunlar uchun har bir toifaning hisobi mavjud. Ushbu ma'lumot bizga o'zgaruvchilarimiz uchun ma'lumotlar taqsimoti haqida umumiy ma'lumot beradi. Biroq, biz ma'lumotlarimizni batafsilroq tahlil qilishimiz mumkin! Tegishli xabarlar : Markaziy tendentsiya o'lchovlari va foizlar va kvartillarni sharhlash R yordamida guruh bo'yicha tavsiflovchi statistikani hisoblash Oldingi bo'limlarda ko'rganingizdek, bizning ma'lumotlar to'plamimiz kuzatishlarni uchta gul turi bo'yicha guruhlaydi: setoza, versicolor va virginica. Shuning uchun, turli xil gul turlarining tavsifiy statistikasini solishtirish qiziqarli bo'lishi mumkin . Quyidagi R kodi Sepal.Length o‘zgaruvchisi uchun guruh bo‘yicha o‘rtachani (ya’ni gul turlarini) hisoblash uchun agregat va o‘rtacha funksiyalardan foydalanadi: