Відмінності між контрольованим навчанням та глибоким навчанням

У контрольованому навчанні дані про навчання, які ви подаєте в алгоритм, включають бажані рішення, які називаються мітками. Типовим контрольованим навчальним завданням є класифікація. Фільтр спаму є хорошим прикладом цього: він навчається з багатьма прикладними електронними листами разом зі своїм класом (спамом чи шинкою), і він повинен навчитися класифікувати нові електронні листи.

Глибоке навчання - це спроба імітувати активність у шарах нейронів у неокортексі, що становить близько 80% мозку, де відбувається мислення (У людському мозку є близько 100 мільярдів нейронів та 100 ~ 1000 трлн синапсів). Його називають глибоким, оскільки він має більше ніж один прихований шар нейронів, який допомагає мати кілька станів нелінійної трансформації ознак

Порівняння керівництва до контрольованого та глибокого навчання (Інфографіка)

Нижче наведено топ-5 порівнянь між контрольованим та поглибленим навчанням

Ключові відмінності між контрольованим навчанням та глибоким навчанням

Обидва контрольовані навчання проти глибокого навчання - це популярний вибір на ринку; обговоримо деякі основні відмінності між контрольованим навчанням та глибоким навчанням:

● Основні моделі -

Важливі контрольовані моделі -

k-Найближчі сусіди - використовуються для класифікації та регресії
Лінійна регресія - для прогнозування / регресії
Логістична регресія - для класифікації
Підтримка векторних машин (SVM) - використовується для класифікації та регресії
Tre Дерева рішень та випадкові ліси - завдання класифікації та регресії

Найпопулярніші нейромережі глибоких:

Багатошарові перцептрони (MLP) - Найбільш базовий тип. Ця мережа, як правило, є початковою фазою побудови іншої більш досконалої глибокої мережі і може бути використана для будь-яких контрольованих регресій або проблем класифікації

Автокодування (AE) - мережа має непідтримувані алгоритми навчання для вивчення функцій, зменшення розмірів та виявлення зовнішньої форми

Конвертна нейронна мережа (CNN) - особливо підходить для просторових даних, розпізнавання об'єктів та аналізу зображень за допомогою багатовимірних нейронних структур. Однією з головних причин популярності глибокого навчання останнім часом є завдяки CNN.

Рекурентна нейронна мережа (RNN) - RNN використовуються для аналізу послідовних даних, таких як часові ряди, аналіз настроїв, NLP, переклад мови, розпізнавання мови, підписи зображень. Один з найпоширеніших типів моделі RNN - це мережа Long Short-Term Memory (LSTM).

Дані про навчання - Як вже згадувалося раніше, контрольовані моделі потребують даних про навчання з етикетками. Але глибоке навчання може обробляти дані з мітками або без них. Деякі архітектури нейронної мережі можуть бути без нагляду, такі як автокодери та обмежені машини Больцмана

Вибір функції - Деякі наглядові моделі здатні аналізувати функції та вибраний підмножина функції для визначення цілі. Але більшу частину часу це стосується у фазі підготовки даних. Але в Deep Neural Networks з'являються нові функції, а небажані функції відкидаються у міру прогресу навчання.

Представлення даних - у класичних контрольованих моделях абстрагування вхідних функцій високого рівня не створюється. Кінцева модель намагається передбачити вихід, застосовуючи математичні перетворення на підмножині вхідних функцій.
Але у глибоких нейронних мережах абстракції вхідних ознак формуються всередині. Наприклад, під час перекладу тексту нейронна мережа спочатку перетворює вхідний текст у внутрішнє кодування, а потім перетворює це абстраговане представлення в мову, що перебуває на цілі.

Рамкові - Контрольовані ML-моделі підтримуються безліччю загальних фреймворків ML на різних мовах - Apache Mahout, Scikit Learn, Spark ML - деякі з них.
Більшості рамки глибокого навчання забезпечують зручну для абстракціоністів абстракцію, щоб легко створити мережу, подбати про розподіл обчислень та підтримувати GPUs.Caffe, Caffe2, Theano, Torch, Keras, CNTK, TensorFlow - популярні фрейми. Широко застосовується Tensorflow від Google тепер із активною підтримкою громади.

Таблиця порівняльного навчання та глибокого навчання

Нижче наведено кілька ключових порівнянь між контрольованим навчанням та глибоким навчанням

Основи порівняння між контрольованим навчанням та поглибленим навчанням Контрольоване навчання Глибоке навчання
Модельне навчанняОсновні завдання в навчанні -

  • Повторюйте навчальні екземпляри, в основному як міні-партії, і оновлюйте ваги, застосовані для функцій.
  • Напрямок оновлення ваги (приріст або зменшення) визначається деякими показниками, такими як градієнт похибки функції wrt вага.
  • Нарешті, ціль формулюється як перетворення на зважену суму ознак підмножини.
Основні завдання в навчанні -

  • Кількість ваг для оновлення дуже велика, якщо кількість прихованих шарів більше.
  • Помилка в цільовому значенні, обчисленому спочатку і передається назад до кожного шару
  • Знайдіть часткову похідну функції помилок wrt ваг і оновіть ваги, щоб зменшити помилку.
Потенціал системиВикористовується для вирішення відносно простих завдань, коли взаємозв'язок із вхідними функціями та ціллю виявляється людиною, а інженерія функцій є прямою. Наприклад:

  • Біноміальна або багатокласова класифікація подібно до класифікації клієнтів на основі їх взаємодії з веб-сайтом.
  • Прогнозуйте вартість нерухомості за допомогою зібраних аналогічних даних.
Глибоке навчання може виконувати такі розумні завдання, як

  • Класифікація зображень майже на рівні людини
  • Розпізнавання мовлення на рівні людини
  • Транскрипція рукописного тексту на рівні людини
  • Покращений машинний переклад
  • Цифрові помічники, такі як Google Now та Amazon Alexa
ГнучкістьМоделі більш гнучкі, що допомагає легко налаштувати модель ML. Існують чітко визначені методи, такі як пошук по сітці з перехресною валідацією, щоб знайти правильні гіперпараметриМенш гнучкими, оскільки існує багато гіперпараметрів, які можна налаштувати як кількість шарів, кількість нейронів на шар, тип функції активації, що використовується в кожному шарі, логіка ініціалізації ваги та багато іншого.
Представлення особливостейОтримані або абстрактні функції слід створювати явно. Наприклад, функції полінома як вхід для лінійної регресійної моделіАбстрактне представлення даних автоматично генерується у прихованих шарах. Ось чому навчена нейронна мережа CNN може виявити кота на зображенні.
Генеративні моделіНеможливо створити щось оригінальне, оскільки автоматичне абстрактне подання даних не відбуваєтьсяПісля навчання, певний тип глибокої нейронної мережі може генерувати нові зображення, пісні чи тексти. Вони називаються GNN (генеративна нейронна мережа) або GAN (генеративні змагальні мережі)

Деяка реалізація цього типу мережі використовується для створення навіть нових моделей дизайну

Висновок - Контрольоване навчання проти поглибленого навчання

Точність та працездатність DNN (Deep Neural Network) s значно зросла за останні кілька років. Ось чому зараз ДНЗ - це область активних досліджень, і, ми вважаємо, вона має потенціал для розвитку Загальної інтелектуальної системи. У той же час важко пояснити, чому DNN дає конкретний вихід, що робить точну настройку мережі справді складною. Отже, якщо проблему можна вирішити за допомогою простих моделей ML, настійно рекомендується використовувати її. Зважаючи на цей факт, проста лінійна регресія матиме актуальність навіть у тому випадку, якщо загальна інтелектуальна система буде розроблена з використанням DNN.

Рекомендована стаття

Це було керівництвом щодо основних відмінностей між контрольованим навчанням та глибоким навчанням. Тут ми також обговорюємо ключові відмінності між контрольованим навчанням та глибоким навчанням за допомогою інфографіки та таблиці порівняння. Ви також можете переглянути наступні статті -

  1. Контрольоване навчання проти навчання зміцненню
  2. Контрольоване навчання проти непідконтрольного навчання
  3. Нейронні мережі проти глибокого навчання
  4. Машинне навчання проти прогнозування Analytics
  5. TensorFlow vs Caffe: які відмінності
  6. Що таке контрольоване навчання?
  7. Що таке навчання підсиленням?
  8. Топ-6 порівнянь між CNN та RNN

Категорія: