Вступ до кластеризації в машинному навчанні
Ми зрозуміємо спочатку машинне навчання. Ми можемо бачити, як дані швидко зростають навколо нас. Дані надходять у різних формах, як відео, аудіо, зображення тощо. Кластеризація в машинному навчанні використовує ці дані, щоб відповісти на питання. Наприклад (виявлення шкірних захворювань) лікар використовуватиме машинне навчання для розуміння позначки на шкірі і передбачить, що це за захворювання. Кластеризація - це не що інше, як групування безмечених даних. Візьмемо приклад вашого фільму (який ви хочете переглянути). Можливо, вам сподобаються романтичні фільми, але сестра любить комедійні фільми. Можливо, вам сподобаються романтичні фільми Боллівуду чи романтичні фільми Голлівуду. Але вашій сестрі подобаються комедійні фільми Telegu, тут ви можете побачити вас і у вашої сестри різний вибір фільмів. Ви обоє виявили глибинну інформацію про фільми. Тут ми згрупували немечений набір даних (фільмів) для перегляду фільму.
Як працює кластеризація в машинному навчанні?
Під час кластеризації ми групуємо безмітний набір даних, який відомий як навчання без нагляду. Коли ми вперше групуємо незазначені дані, нам потрібно знайти подібну групу. Коли ми створюємо групу, нам потрібно зрозуміти особливості наборів даних, тобто подібні речі. Якщо ми створимо групу за однією або двома ознаками, легко виміряти схожість.
- Приклад №1: Фільми режисера. Після кластеризації, кожному кластері присвоюється номер кластера, який відомий як ClusterID. Система машинного навчання, як YouTube, використовує clusterID для найпростішого представлення складних даних.
- Приклад №2: YouTube використовує нашу історію пошуку або історію перегляду та пропонує відео, які можуть нам сподобатися. Набір даних про функції Facebook містить людей, за якими ми стежимо, сторінки, які ми відстежуємо, коментарі, які ми вводимо, фотографії чи відео, які нам подобаються, зображення чи фотографії, на які ми тегуємо. Кластеризація відео чи фото у Facebook замінить набір функцій одним кластерним ID завдяки стисненню даних.
Топ-4 методи кластеризації в машинному навчанні
Нижче наведено методи кластеризації в машинному навчанні:
1. Ієрархічна
Кластеризація назв визначає спосіб роботи, цей метод формує кластер ієрархальним способом. Новий кластер формується за допомогою раніше сформованої структури. Нам потрібно зрозуміти відмінності між підрозділом та агломераційним підходом. Агломерація - це підхід знизу вгору, він починається з окремих точок у кластері та поєднує деякі довільні. Розділення починається з одного кластера, усі точки в кластері і ділить його на кілька кластерів.
2. На основі щільності
У цьому методі щільна область розглядається як кластер, який має деякі схожість. Він відрізняється від нижньої щільної області простору об'єкта. DBSCAN відомий як просторове кластеризація програм із шумом на основі щільності. Для орієнтації на об'єкт даних DBSCAN шукає деякий epsilon, ми встановлюємо деякий радіус epsilon і мінімальну кількість точок. Якщо в радіусі ми перевершимо деяку мінімальну кількість точок, то ми класифікуємо кластер високої щільності. Отже, таким чином ми можемо розглянути дані з областю високої щільності. DBSCAN відрізняється від центрального методу кластеризації, оскільки це не суворий підхід. Точки шуму - це точки на ділянках із низькою щільністю, які залишаються не маркованими або маркованими як застарілі. Ось чому ми не вимагаємо конкретного K. Ми можемо вказати мінімальні точки для області з високою щільністю та радіусом, яку ми хочемо, щоб область була чи кластери.
3. Розбиття
Коли ми маємо набір даних з N кількості об'єктів. Цей метод будує "K" як розділ даних. Цей розділ є кластером, тобто конструкцією K, розділом (K <= N).
Вимоги, яких необхідно виконати:
- Кожна група або набір даних повинен містити принаймні один об'єкт.
- Кожен об’єкт повинен належати лише одній групі.
Одним із прикладів розподілу є кластеризація K-засобів.
4. Сітка на основі
Об'єктний простір, кінцева кількість комірок утворює структуру сітки. Цей метод забезпечує швидку обробку кластерів. Вони не залежать від об'єктного простору.
Застосування кластеризації в машинному навчанні
Нижче наведено програми кластеризації в машинному навчанні:
1. Медичні
Для виявлення захворювання лікар може скористатися алгоритмом кластеризації. Візьмемо приклад захворювання щитовидної залози. Набір даних про захворювання щитовидної залози може бути ідентифікований за допомогою алгоритму кластеризації, коли ми застосовуємо без нагляду навчання на наборі даних, що містить набір даних про щитовидну та не щитовидну залози. Скупчення визначить причину захворювання і дасть успішний пошук результату.
2. Соціальна мережа
Ми покоління епохи Інтернету, ми можемо зустріти будь-яку людину або дізнатися про будь-яку індивідуальну особистість через Інтернет. Сайти в соціальних мережах використовують кластеризацію для розуміння вмісту, обличчя чи місцезнаходження користувача. Коли непідконтрольне навчання використовується в соціальному, це корисно для перекладу мови. Наприклад, Instagram та Facebook надають можливість перекладу мови.
3. Маркетинг
Ми можемо побачити або спостерігати, що поруч із нами росте різна технологія, і люди залучають використовувати такі технології, як хмара, цифровий маркетинг. Для залучення більшої кількості клієнтів кожна компанія розробляє прості у використанні функції та технології. Щоб зрозуміти клієнта, ми можемо використовувати кластеризацію. Кластеризація допоможе компанії зрозуміти сегмент користувача, а потім класифікувати кожного клієнта. Таким чином ми можемо зрозуміти клієнта та знайти схожість між клієнтами та згрупувати їх.
4. Банківська справа
Ми спостерігали, що шахрайство з грошима відбувається навколо нас, і компанія попереджає про це клієнтів. За допомогою кластеризації страхові компанії можуть виявити шахрайство, визнати клієнтів про це та зрозуміти політики, запроваджені клієнтом.
5. Google
Google - одна з пошукових систем, яку люди використовують. Візьмемо приклад, коли ми шукаємо таку інформацію, як зоомагазин у цьому районі, Google надасть нам різні варіанти. Це результат кластеризації, кластеризації подібного результату, який вам надається.
Висновок
Ми дізналися про кластеризацію та машинне навчання. Спосіб кластеризації працює в машинному навчанні. Інформація про непідконтрольне навчання. Використання в режимі реального часу навчання без нагляду. Методи кластеризації та як кожен метод працює в машинному навчанні.
Рекомендована стаття
Це посібник із кластеризації в машинному навчанні. Тут ми обговорюємо топ-4 методи кластеризації в машинному навчанні разом із додатками. Ви також можете ознайомитися з іншими запропонованими нами статтями, щоб дізнатися більше -- Рамки машинного навчання Топ-10
- K- означає алгоритм кластеризації з перевагами
- Введення в методи машинного навчання
- Моделі машинного навчання | Топ 5 видів
- Машинне навчання C ++ Бібліотека