MASHINALI O’QITISHDA GRADIENTLI TUSHISH ALGORITMINI CHIZIQLI REGRESSIYA YORDAMIDA TADQIQ QILISH
MAVZU: MASHINALI O’QITISHDA GRADIENTLI TUSHISH ALGORITMINI CHIZIQLI REGRESSIYA YORDAMIDA TADQIQ QILISH MUNDARIJA KIRISH 3 BOB I GRADIENT TUSHISH USULIGA MATEMATIK NAZAR 1.1 Gradient tushish usuli: asosiy tushunchalar 7 1.2 Gradient tushish usuli algoritmi, misollar 13 1.3 Gradient tushish usuli uchun dasturiy vosita 19 BOB II CHIZIQLI REGRESSIA MODELIDA GRADIENT TUSHISH USULI 2.1 Mashinali o’qitishda chiziqli regressia 23 2.1.1 Bir o’zgaruvchili chiziqli regressia 24 2.1.2 Ko’p o’zgaruvchili chiziqli regressia 27 2.2 Gradient tushish usulining chiziqli regressiada qo’llanilishi: maqsad funksiya 28 2.3 Chiziqli regressia modeli yordamida uy-joy narxlarini o’rganish 31 2.3.1 Ma’lumot yig’ish va qayta ishlash 32 2.3.2 Ma’lumotlarni o’qitish, model parametrlarini aniqlash 34 2.4 Chiziqli regressiya modeli uchundasturiy vosita 36 Adabiyotlar ro’yxati 38 Ilovalar 39 1
Kirish Masalaning qo‘yilishi. Gradient tushush usuli va uning mashinali o’qitish algoritmlaridan biri bo’lgan chiziqli regressiyada qo’llanilishini o’rganish, bu algoritmlarni amaliy qo’llash uchun uy-joy narxlarini regression tahlil qilish hamda ushbu usul va algoritmlarga asoslangan dasturiy vositalar ishlab chiqish. Mavzuning dolzarbligi. Bugunguni kunda juda ko’plab sohalar (tavsiya tizimlari, tasvirlarni aniqlash, tabiiy tilni qayta ishlash va moliyaviy bashoratlar) dagi turli xil hayotiy masalalarni yechishda ularga oid tarixiy ma’lumotlar, mashinali o’qitish algoritmlari, jumladan chiziqli regressia algoritmi orqali tahlil qilinib, eng yaxshi yechim, tavsiya, bashorat yoki qarorlar qabul qilinmoqda. Chiziqli regressiya algoritmi bu nazoratli o’qitish algoritmi bo’lib, u kirish xususiyatlari va maqsadli o'zgaruvchi o'rtasidagi chiziqli munosabatni aniqlashdan iborat. Chiziqli resgressiya natijalarining aniqligi, chiziqli munosabat koeffisentlarining aniqligiga bo’gliq bo’lib, u odatda gradient tushish usullari orqali aniqlanadi. Shu nuqtai nazardan chiziqli regressiya modelini qurishda gradient tushish usulini tadqiq qilish va bu usulga asoslangan dasturiy vosita ishlab chiqish muhim hisoblanadi. Ishning maqsad va vazifalari. Bitiruv malakaviy ishning asosiy maqsad va vazifasi bu chiziqli regressiya modelini qurish jarayonida gradient tushish usumining o’rnini anglash va bu usulga asoslangan dasturiy vosita ishlab chiqishdan iborat. Ilmiy-tatqiqot usullari. Ushbu bitiruv malakaviy ishida, chiziqli regressiya modelini qurishda gradient tushish usulining qo’llanilishini tadqiq qilish uchun matematik analiz, ehtimollar nazaryasi va matematik statistika, mashinaviy o’qitish hamda python dasturlash tili kurslarining ba’zi tushuncha, usul va yondoshuvlaridan foydalanilgan. Mavzuning o‘rganilish darajasi. 2
Chiziqli regressiya 19-asr oxiri va 20-asr boshlarida Frensis Galton va Karl Pirson ishlariga borib taqaladigan boy tarixga ega. Uning uzoq vaqtdan beri qo'llanilishi va rivojlanishi uni to'liq tushunishga yordam berdi. Chiziqli regressiya modellari mashinali o'qitish va statistikada eng yaxshi o'rganilgan va fundamental usullardan biridir. Ularning keng qamrovli o'rganilishi va qo'llanilishi bir necha omillarga bog'liq: Oddiylik va tushunarlilik: Chiziqli regressiya modellarini tushunish va izohlash oson. Bog'liq va mustaqil o'zgaruvchilar o'rtasidagi bog'liqlik aniq bo'lib, model bashoratlarini tushuntirishni osonlashtiradi. Nazariy asos: Chiziqli regressiya mustahkam nazariy asosga ega. Eng kichik kvadratlarni baholash tamoyillari, chiziqli modelning taxminlari va baholovchilarning xususiyatlari yaxshi tasdiqlangan. Ushbu nazariy asoslash modelning xatti-harakati va cheklovlarini tushunishga yordam beradi. Keng qo'llanilishi: Chiziqli regressiya iqtisodiyot, biologiya, muhandislik va ijtimoiy fanlar kabi turli sohalarda qo'llanilishi mumkin. Uning ko'p qirraliligi uni turli sohalarda qimmatli vositaga aylantiradi. Kengaytmalar va variantlar: Chiziqli regressiya muayyan ehtiyojlarni qondiradigan ko'plab kengaytmalar va variantlarga ega: Bir va ko’p o’zgaruvchili chiziqli regressiya: oddiy chiziqli regressiyani bir nechta bashorat qiluvchilarga kengaytiradi. Ko’pxadli regressiya: Polinom atamalarini kiritish orqali chiziqli bo'lmagan munosabatlarni modellashtiradi. Ridge va Lasso regressiyasi: haddan tashqari moslashishning oldini olish uchun tartibga solishni joriy qiling. Dasturiy ta'minot va asboblarni qo'llab-quvvatlash: 3
Chiziqli regressiya R, Python (scikit-learn, statsmodels), MATLAB va SAS kabi ko'plab dasturiy vositalar va kutubxonalar tomonidan qo'llab-quvvatlanadi. Ushbu vositalar foydalanish uchun qulay dasturlarni taqdim etadi va model yaratish, baholash va diagnostika qilishni osonlashtiradi. Ta'lim maqsadlarida foydalanish: Chiziqli regressiya ko'pincha statistika va mashinali o'qitish kurslarida o'qitiladigan birinchi modellardan biridir. Uning soddaligi uni yanada murakkab modellar va texnikalarni o'rganish uchun ajoyib boshlanish nuqtasiga aylantiradi. Tadqiqotning ilmiy yangiligi. Bitiruv malakaviy ishida olingan natijalar amaliy-uslubiy xarakterga ega bo‘lib, ishda ko’p o’zgaruvchili qavariq funksiyalarning ekstremumlari (maksimum yoki minimum) ni topish uchun gradient tushish usuliga asoslangan dasturiy ta’minot yaratligan. Bu dasturiy ta’minot Python dasturlash tilida yaratilgan bo’lib u vizuallashgan qulay interfeysga ega. Tadqiqot predmeti va ob’ekti. Tadqiqotning predmeti “Mashinaviy o’qitish”, “Mashinaviy o’qitishda optimallashtirish usullari”, “Kompyuter ilmlarida statistik modellar”, “Ehtimollar nazaryasi va matematik statistika” , “Matematik analiz”, “Python dasturlash tili” va shu kabi fan sohalari bo‘lib, ob’ekti chiziqli regressiya modeli va gradient tushish usulidan iborat. Tatqiqotnig ilmiy va amaliy ahamiyati. Ishda olingan natijalar va unda qo‘llanilgan usullardan turli iqtisodiy, ijtimoiy sohalarning ko‘pgina amaliy masalalarini tadqiq qilishda, “Ehtimollar nazaryasi va matematik statistika”, “Matematik analiz”, “Kompyuter ilmlarida statistik modellar” va shu kabi fanlarning amaliy mashg‘ulotlari o‘quv jarayonlarida dasturiy vosita sifatida foydalanish mumkin. Ishning tuzilishi. Ushbu ish kirish, ikki bob, xulosa, foydalanilgan adabiyotlar ro‘yxati va ilovalardan iborat. I bob uchta paragrafdan iborat bo‘lib, uning birinchi va ikkinchi paragrafida adabyotlardan foydalanilgan holda, gradient tushish usuli haqida umumiy tushunchalar, usul algoritmi keltirilgan va bu usul yordamida misollar yechilgan. 4
Uchinchi paragrafda gradient tushish usuliga asoslanib ishlab chiqilgan dasturiy vosita haqida ma’lumotlar keltirilgan. II bob uchta paragrafdan iborat bo’lib birinchi paragraph ikkita qism paragrafdan iborat bo’lib, mos ravishda, bir o’zgaruvchili va ko’p o’zgaruvchili chiziqli regressiyalar haqida ma’lumotlar keltirilgan. Ikkinchi paragraf gradient tushish usilining chiziqli regressia modelida qo’llanilishiga bag’ishlangan bo’lib, maqsad funksiyani tanlash va uning parametrlarini aniqlashga e’tibor qaratilgan. Bu bobning uchinchi paragrafida mavzuda doir amaliy masala qaralgan, ya’ni chiziqli regressiya algoritmiga asoslanib uy-joy narxlarini bashorat qilish modelini ishlab chiqishga qaratilgan bo’lib u ikkita ta qism paragrafdan iborat. Birinchi qism paragrafda uy-joy narxlariga tegishli ma’lumotlarni to’lash va qayta ishlash qaralgan, ikkinchi qism paragrafda model parametrlarini aniqlash va model natijasining aniqligini baholashga qaratilgan. Olingan natijalarning qisqacha mazmuni. Bitiruv malakaviy ishida chiziqli regressiya modelini qurish jarayonida, gradient tushish usulining o’rni, qo’llanilishi o’rganildi va gradient tushish usuliga asoslangan dasturiy vosita ishlab chiqilgan. Chiziqli regrsssiya modelida gradient tshish usulini yanada yaxshiroq anglsh uchun amaliy masala yechilgan ya’ni uy-joy narxlari chiziqli regressiya algoritmi yordamida tahlil qililinib bashorat qilivchi model ishlab chiqilgan. 5