Вступ до ансамблевих методів машинного навчання

У цій статті ми побачимо конспект про ансамблеві методи машинного навчання. Ансамблеве навчання - це поєднання різноманітних технік машинного навчання в прогностичну модель для поліпшення прогнозування. Ансамблеве навчання набувається для зменшення розбіжності в прогнозних даних. Цей тип навчання призначений для мінімізації упередженості моделі. Ансамблеве навчання - це багатомодельна система, в якій різні класифікатори або методи стратегічно поєднуються для класифікації або прогнозування статистики складної проблеми з кращою точністю. Мета такого навчання - мінімізувати ймовірність поганого вибору з моделі. Він призначає впевненість у рішенні, прийнятому моделлю. Ідея вибору оптимальних особливостей реалізувалася в ансамблевому навчанні.

Типи ансамблевих методів у машинному навчанні

Методи ансамблю допомагають створити декілька моделей, а потім об'єднати їх для отримання поліпшених результатів. Деякі ансамблеві методи класифікуються на такі групи:

1. Послідовні методи

У такому методі ансамблю існують послідовно генеровані базові учні, в яких існує залежність даних. Усі інші дані базового учня мають певну залежність від попередніх даних. Отже, попередні помилкові дані налаштовуються виходячи з його ваги для покращення продуктивності загальної системи.

Приклад : Підвищення

2. Паралельний метод

У такому методі ансамблю базовий учень генерується в паралельному порядку, в якому залежності від даних немає. Усі дані базового учня формуються незалежно.

Приклад : укладання

3. Однорідний ансамбль

Такий метод ансамблю - це поєднання однотипних класифікаторів. Але набір даних різний для кожного класифікатора. Це змусить більш точно працювати комбіновану модель після узагальнення результатів від кожної моделі. Цей тип ансамблевого методу працює з великою кількістю наборів даних. У гомогенному методі метод вибору особливостей однаковий для різних даних тренувань. Це обчислювально дорого.

Приклад: Народні методи, такі як розфасування та підсилення, входять в однорідний ансамбль.

4. Гетерогенний ансамбль

Такий метод ансамблю - це поєднання різних типів класифікаторів або моделей машинного навчання, в яких кожен класифікатор будується на одних і тих же даних. Такий метод працює для невеликих наборів даних. У неоднорідному методі вибору особливостей для одних і тих же навчальних даних різний. Загальний результат цього ансамблевого методу здійснюється шляхом усереднення всіх результатів кожної комбінованої моделі.

Приклад : укладання

Технічна класифікація ансамблевих методів

Нижче наведена технічна класифікація методів ансамблю:

1. Сумка

Цей метод ансамблю поєднує дві моделі машинного навчання, тобто завантаження та агрегацію, в єдину модель ансамблю. Мета методу розфасовки - зменшити велику дисперсію моделі. Дерева рішень мають дисперсію та низький ухил. Великий набір даних є (скажімо, 1000 зразків) під вибіркою (скажімо, 10 під зразків кожен містить 100 зразків даних). Кілька дерев рішень будуються на кожному навчальному даному під-зразку. Незважаючи на удари даних про підбірку даних про різні дерева рішень, стурбованість переповненням навчальних даних щодо кожного дерева рішень зменшується. Для ефективності моделі кожне окреме дерево рішень вирощується в глибині, що містить дані про підбірку навчальних даних. Результати кожного дерева рішень узагальнюються, щоб зрозуміти остаточний прогноз. Дисперсія узагальнених даних зменшується. Точність прогнозування моделі в методі упаковки залежить від кількості використовуваного дерева рішень. Різні підвідбірки вибіркових даних вибираються випадковим чином із заміною. Вихід кожного дерева має високу кореляцію.

2. Підвищення

Підвищуючий ансамбль також поєднує різні класифікатори одного типу. Підвищення - це один із методів послідовного ансамблю, в якому кожна модель або класифікатор працює на основі функцій, які будуть використані наступною моделлю. Таким чином, метод прискорення забезпечує сильнішу модель для студентів із слабких моделей учнів шляхом усереднення їх ваги. Іншими словами, більш сильно навчена модель залежить від декількох слабко навчених моделей. Слабка модель, яка навчається, або модель, яка навчається зносу, дуже менш корелює з справжньою класифікацією. Але наступний слабкий учень трохи більше корелює з справжньою класифікацією. Поєднання таких різних слабких учнів дає сильного учня, що добре корелює з справжньою класифікацією.

3. Укладання

Цей метод також поєднує в собі декілька методів класифікації або регресії, використовуючи метакласифікатор або мета-модель. Моделі нижчих рівнів навчаються з повним набором навчальних даних, а потім комбінована модель навчається з результатами моделей нижчого рівня. На відміну від прискорення, кожна модель нижчого рівня проходить паралельну підготовку. Прогноз із моделей нижчого рівня використовується як вхід для наступної моделі як навчальний набір даних і утворює стек, у якому верхній шар моделі більш навчений, ніж нижній шар моделі. Модель верхнього шару має хорошу точність прогнозування, і вони побудовані на основі моделей нижчого рівня. Стек збільшується до тих пір, поки найкраще прогнозування не буде виконано з мінімальною помилкою. Прогнозування комбінованої моделі чи мета-моделі ґрунтується на прогнозуванні різних слабких моделей або моделей нижнього шару. Він фокусується на тому, щоб створити меншу модель зміщення.

4. Випадковий ліс

Випадковий ліс дещо відрізняється від мішковини, оскільки він використовує глибокі дерева, які розміщені на зразках завантажувальної машини. Вихід кожного тресу поєднується для зменшення дисперсії. Під час вирощування кожного дерева, замість того, щоб генерувати зразок завантаження на основі спостереження в наборі даних, ми також відбираємо набір даних на основі функцій і використовуємо лише випадковий підмножину такого зразка для побудови дерева. Іншими словами, вибірка набору даних проводиться на основі функцій, що зменшують співвідношення різних результатів. Випадковий ліс хороший для вирішення відсутніх даних. Випадковий ліс означає випадковий вибір підмножини вибірки, що зменшує шанси отримати відповідні значення прогнозування. Кожне дерево має різну будову. Випадковий ліс призводить до незначного збільшення зміщення лісу, але завдяки усередненню все менш пов'язаних прогнозів для різних дерев результуюча дисперсія зменшується та дає загальну кращу продуктивність.

Висновок

Багатомодельний підхід ансамблю реалізується за допомогою моделей глибокого навчання, в яких складні дані вивчалися та оброблялися за допомогою таких різних комбінацій класифікатора для кращого прогнозування чи класифікації. Прогнозування кожної моделі в ансамблевому навчанні повинно бути більш некорельованим. Це дозволить максимально знизити упередженість та дисперсію моделі. Модель буде більш ефективною і прогнозувати вихід при мінімальній помилці. Ансамбль є контрольованим алгоритмом навчання, оскільки модель попередньо тренується із набором даних для прогнозування. Для ансамблевого навчання кількість класифікаторів компонентів повинна бути такою самою, як етикетки класів для досягнення високої точності.

Рекомендовані статті

Це посібник із ансамблевих методів машинного навчання. Тут ми обговорюємо важливі типи ансамблевих методів машинного навчання разом з Технічною класифікацією. Ви також можете ознайомитися з іншими запропонованими нами статтями, щоб дізнатися більше -

  1. Вступ до ансамблевих методик
  2. Життєвий цикл машинного навчання з перевагами
  3. Алгоритми машинного навчання
  4. 24 найпоширеніших питання щодо машинного навчання

Категорія: