Вступ до контрольованого навчання та без нагляду

Контрольоване навчання та непідконтрольне навчання - це завдання машинного навчання.
Контрольоване навчання - це просто алгоритм навчання навчального набору даних. Контрольоване навчання - це те, де у вас є вхідні змінні та вихідні змінні, і ви використовуєте алгоритм для вивчення функції відображення від введення до виводу. Метою є наближення функції відображення, щоб, коли ми маємо нові вхідні дані, ми могли передбачити вихідні змінні для цих даних.

Непідконтрольне навчання - це моделювання основної чи прихованої структури або розподілу даних, щоб дізнатися більше про дані. Навчання без нагляду - це те, де у вас є лише вхідні дані та відсутні відповідні вихідні змінні.

Набір навчальних даних: Набір прикладів, які використовуються для навчання, де відоме цільове значення.

Порівнювання «голова до голови» між контрольованим навчанням та непідконтрольним навчанням (Інфографіка)

Нижче наведено топ-7 порівнянь між контрольованим навчанням та непідконтрольним навчанням

Ключові відмінності між контрольованим навчанням та непідконтрольним навчанням

Нижче наведено списки пунктів, опишіть про ключові відмінності між контрольованим навчанням та непідконтрольним навчанням

1. Алгоритми машинного навчання виявляють закономірності у великих даних. Ці різні алгоритми можна класифікувати на дві категорії на основі того, як вони «дізнаються» про дані для прогнозування. Це контрольне та непідконтрольне навчання.

2. У контрольованому навчанні вчений виступає керівництвом, щоб вчити алгоритм, до яких висновків чи прогнозів він повинен придумати. У непідконтрольному навчанні немає правильної відповіді, немає вчителя, алгоритми залишаються власними, щоб виявити та представити цікаву приховану структуру в даних.

3. Модель навчання під наглядом використовує навчальні дані для вивчення зв’язку між входом та результатами.

4. Непідконтрольне навчання не використовує вихідних даних. При навчанні без нагляду їх попередні знання не матимуть ніяких міток, тоді як при контрольованому навчанні матимуть доступ до міток і матимуть попередні знання про набори даних

5. Контрольоване навчання: ідея полягає в тому, що навчання можна узагальнити і модель може бути використана на нових даних з деякою точністю.

6. Керовані алгоритми навчання: Підтримка векторної машини, Лінійна та логістична регресія, Нейронна мережа, Дерева класифікації та випадковий ліс тощо.

7. Непідтримувані алгоритми можна розділити на різні категорії: алгоритми кластера, K-засоби, ієрархічна кластеризація, алгоритми зменшення розмірів, виявлення аномалій тощо.

8. Класифікація та область регресії широко використовувані алгоритми в контрольованому навчанні. Підтримка векторних машин (SVM) - це керовані моделі машинного навчання з пов'язаними алгоритмами навчання, які можна використовувати як для класифікації, так і для регресії, але в основному використовуються для проблем класифікації.

9. У моделі SVM ми побудуємо кожен елемент даних як точку в n-мірному просторі (де n - це ознаки, які ми маємо), причому значення кожної функції є значенням певної координати. Потім проводиться класифікація шляхом знаходження гіперплана, який диференціює два класи.

10. Основна мета алгоритмів регресії - передбачити дискретні або тривалі значення. У деяких випадках передбачуване значення може використовуватися для ідентифікації лінійної залежності між атрибутами. На основі алгоритмів регресії різниці проблем можна використовувати. Деякі основні алгоритми регресії - це лінійна регресія, поліноміальна регресія тощо.

11. Кластеризація широко використовується у навчанні без нагляду. Кластеризація - це завдання розділити точки даних на кількість груп, так що однакові точки ознак будуть разом у вигляді кластера. Існує більше багатьох алгоритмів кластеризації; деякі з них - це моделі підключення, моделі центроїдів, моделі розподілу та моделі щільності.

12.Ієрархічна кластеризація підпадає під навчання без нагляду. Ієрархічна кластеризація, як випливає з назви, - це алгоритм, який будує ієрархію кластерів. Цей алгоритм починається з усіх точок даних, призначених власному кластеру. Потім два найближчі кластери об'єднуються в один кластер. Зрештою, цей алгоритм припиняється, коли залишився лише один кластер.

13.KMeans підпадає під непідконтрольний метод кластеризації. Дані будуть розподілені на k кластери, виходячи з їх особливостей. Кожен кластер представлений своїм центроїдом, визначеним як центр точок кластера. KMeans простий і швидкий, але він не дає однакового результату з кожним пробігом.

14.Щоб краще зрозуміти контрольоване навчання та непідконтрольне навчання, давайте приклади з реального життя. Контрольоване навчання: для прикладу візьмемо один із функцій Gmail, який представляє собою спам-пошту. На основі минулої інформації про спам-листи, відфільтрування нового вхідного електронного листа в папку "Вхідні" або "Небажана папка". У цьому сценарії Gmail моделюється функція відображення для поділу вхідної пошти на основі попередніх знань про електронні листи, це навчається під наглядом.

15. Непідконтрольне навчання: Припустимо, друг запрошує вас на її вечірку, де ви знайомите нових людей. Тепер ви класифікуєте їх, не використовуючи попередніх знань (Необслуговане навчання), і ця класифікація може бути за будь-якою ознакою. Це може бути вікова група, стать, одяг, освітня кваліфікація або будь-який інший спосіб. Оскільки ви не використовували жодних попередніх знань про людей та не класифікували їх, це піддається непідконтрольному навчанню.

Таблиця порівняльного навчання з контрольованим навчанням та без нагляду

Контрольоване навчанняНавчання без нагляду

Метод

Введені змінні та вихідні змінні.Даватимуться лише вхідні дані

Мета

Мета контрольованого навчання полягає в тому, щоб визначити функцію настільки добре, що при наданні нових вхідних даних можна передбачити вихід.Непідконтрольна мета навчання полягає в моделюванні прихованих шаблонів або базової структури в заданих вхідних даних, щоб дізнатися про дані.

Клас

Проблеми машинного навчання, обмін даними та нейронна мережа,Машинне навчання, обмін даними, проблеми та нейромережа

Приклади

  • Класифікація
  • Регресія
  • Лінійна регресія
  • Підтримка векторної машини
  • Кластеризація
  • Асоціація
  • k-означає
  • Асоціація
Хто використовуєДані вченихДані вчених

Екосистеми

Обробка великих даних, обробка даних тощо

Обробка великих даних, обробка даних тощо

Використання

Контрольоване навчання часто використовується для експортних систем для розпізнавання зображень, розпізнавання мови, прогнозування, фінансового аналізу та навчання нейронних мереж та дерев рішень тощо.

Непідконтрольні алгоритми навчання використовуються для попередньої обробки даних, під час дослідницького аналізу або попередньої підготовки алгоритмів навчання під контролем.

Висновок - Контрольоване навчання проти навчання без нагляду

Вибір використання алгоритму машинного навчання або під наглядом, або під наглядом, зазвичай залежить від факторів, пов’язаних зі структурою та обсягом ваших даних та випадком використання. Насправді, у більшості випадків науковці використовують спільний підхід під наглядом та без нагляду для вирішення випадку використання.

Рекомендована стаття

Це був посібник із наглядового навчання проти непідконтрольного навчання, їх значення, порівняння «голова до голови», ключових відмінностей, таблиці порівняння та висновку. Ви також можете переглянути наступні статті, щоб дізнатися більше -

  1. Найкраще 7 порівняння між контрольованим навчанням та навчальним підкріпленням
  2. 5 Найбільш корисна різниця між науковими даними та машинним навчанням
  3. Дізнайтеся 10 найкращих різниць між зменшенням карти та пряжі
  4. MapReduce vs Apache Spark - 20 корисних порівнянь для вивчення
  5. Що таке навчання підсиленням?

Категорія: