Overfitting və Underfitting Anlayışı
Maşın öyrənməsi modelləri bizə proqnozlar verməyə, məlumatları təsnif etməyə və böyük məlumat dəstlərindən dəyərli nəticələr çıxarmağa imkan verən güclü vasitələrdir. Lakin bu modelləri qurarkən və qiymətləndirərkən onların effektivliyini azalda biləcək iki ümumi problemi – overfitting (həddindən artıq uyğunlaşma) və underfitting (az uyğunlaşma) məsələlərini anlamaq çox vacibdir. Bu anlayışlar maşın öyrənməsi və məlumat elminin əsasını təşkil edir və model seçimi, təlim və qiymətləndirmə mərhələlərində mühüm rol oynayır. Bu bloqda overfitting və underfitting nədir, necə yaranır, nəticələri nələrdir və bunlardan necə qaçmaq olar suallarına cavab verəcəyik.
Overfitting nədir?
Overfitting modelin təlim məlumatlarını o qədər dəqiq öyrənməsi halıdır ki, artıq oradakı təsadüfi səs-küy və detallar belə yadda qalır. Bu, modelin təlim məlumatı üzərində çox yaxşı nəticə göstərməsi ilə yanaşı, yeni, görmədiyi məlumatlara tətbiq olunarkən zəif performans verməsinə səbəb olur. Model çox mürəkkəbləşir və yalnız təlim dəstinə uyğunlaŚraq ümumiləşdirilmə qabiliyyətini itirir.
Overfitting necə baş verir?
- Çox mürəkkəb model: Parametrləri çox olan bir model təlim məlumatındakı hər nöqtəyə uyğunlaşa bilər – hətta təsadüfi səs-küyə də.
- Az təlim məlumatı: Kiçik verilənlər bazası modelin konkret və ümumiləşməyən nəticələr çıxarmasına səbəb ola bilər.
- Çoxlu xüsusiyyətlər: Təlim nümunələrinin sayından çox sayda giriş xüsusiyyəti olduqda model məlumatları “əzbərləyir”.
Overfitting-in nəticələri
- Aşağı bias, yüksək dəyişkənlik: Model təlim məlumatına çox yaxşı uyğunlaunla\u015ır, amma yeni məlumatlara qarşı qeyri-sabitdir.
- Zəif ümumiləşmə: Təlim məlumatında əla performans göstərsə də, test və validasiya məlumatlarında uğursuz olur.
- Mürəkkəb və anlaşılmaz model: Modelin qərarları çatin izah olunur.
Overfitting-dən necə qaçmaq olar?
- Daha sadə model seçin.
- Cross-validation (k-fold kimi) tətbiq edin.
- Regularization (L1, L2) istifadə edin.
- Daha çox təlim məlumatı əldə edin.
- Neural network-lərdə early stopping tətbiq edin.
Underfitting nədir?
Underfitting modelin çox sadə olması və məlumatdakı əsas nünunələri belə tuta bilməməsi halıdır. Model həm təlim, həm də test məlumatlarında zəif performans göstərir, çünki real dünya əlaqələrini əhatə edə bilmir.
Underfitting necə baş verir?
- Sadə model: Mürəkkəb nünunələri tutmaq üçün yetersizdir.
- Az sayda xüsusiyyət: Yetərli məlumat verilmədikdə öyrənə bilməz.
- Aşırı regularization: Vacib əlaqələri öyrənməyə imkan vermir.
- Yetərsiz təlim: Model kifayət qədər öyrədilmədikdə öyrənməni tamamlaya bilmir.
Underfitting-in nəticələri
- Yüksək bias, aşağı dəyişkənlik: Model sabit və sadədir, amma zəif nəticələr verir.
- Zəif performans: Həm təlim, həm də test məlumatlarında qeyri-dəqiq nəticələr.
Underfitting-dən necə qaçmaq olar?
- Daha mürəkkəb model istifadə edin.
- Daha çox və uyğun xüsusiyyət əlavə edin.
- Təlim müddətini artırın.
- Regularization-u azaldın.
Bias-Variance tarazlığı
Modelin düzgün qurulması üçün bias və variance arasında balans tapmaq vacibdir.
- Bias – Modelin sadə fərziyyələrindən doğan səhv.
- Variance – Modelin kiçik dəyişikliklərə qarşı həssaslığı.
Hədəf: Aşağı bias və aşağı variance olan bir model qurmaq – yəni həm düzgün öyrənən, həm də ümumiləşdirə bilən model.
Vizual Anlayış
Sinus dalğası şəklində sünî məlumat dəsti ilə 3 fərqli model nümayiş etdirilir:
- Underfitting: Yalnız düz xətt – nünunəni tuta bilmir.
- Yaxşı uyğunlaşma: Orta səviyyəli polinom – əsas tendensiyanı tutaraq ümumiləşdirir.
- Overfitting: Yüksək dərəcəli polinom – hər detalı əzbərləyir, amma ümumiləşdirə bilmir.
Nəticə:
Maşın öyrənməsində overfitting və underfitting problemlərini anlamaq və aradan qaldırmaq düzgün model yaratmaq üçün əsas şərtdir. Bu problemləri aradan qaldırmaq üçün modelin mürəkkəbliyini tənzimləmək, daha çox məlumat toplamaq, regularization və cross-validation kimi üsullardan istifadə etmək lazımdır.