Методи ядра - Як це працює - Типи ядра з відповідним рівнянням

Вступ до методів ядра

Ядра або методи ядра (їх також називають функціями ядра) - це набори різних типів алгоритмів, які використовуються для аналізу шаблонів. Вони використовуються для вирішення нелінійної задачі за допомогою лінійного класифікатора. Методи ядер використовуються в SVM (Support Vector Machines), які використовуються в задачах класифікації та регресії. SVM використовує те, що називається "трюком ядра", де дані трансформуються і знайдена оптимальна межа для можливих результатів.

Необхідність методу ядра та його робота

Перш ніж ми перейдемо до роботи методів ядра, важливіше зрозуміти векторні машини підтримки або SVM, оскільки ядра реалізовані у моделях SVM. Отже, Support Vector Machines - це керовані алгоритми машинного навчання, які використовуються при проблемах класифікації та регресії, таких як класифікація яблука до класу фруктів при класифікації Лева на тварину класу.

Для демонстрації нижче виглядає те, як виглядають векторні машини підтримки:

Тут ми можемо побачити гіперплан, який відокремлює зелені точки від синіх. Гіперплощина - на один вимір менше, ніж навколишня площина. Наприклад, на наведеному вище малюнку у нас є 2 виміри, що представляють собою навколишній простір, але одинокий, який розділяє або класифікує простір, на один вимір менше, ніж навколишній простір, і називається гіперпланом.

Але що робити, якщо у нас є такий вклад:

Вирішити цю класифікацію за допомогою лінійного класифікатора дуже важко, оскільки немає хорошої лінійної лінії, яка повинна мати можливість класифікувати червону та зелену точки, оскільки точки розподілені випадковим чином. Тут з'являється використання функції ядра, яка переносить точки на більш високі розміри, вирішує проблему там і повертає результат. Подумавши це таким чином, ми можемо побачити, що зелені крапки укладені в деякій області периметра, тоді як червона лежить поза нею, так само можуть бути й інші сценарії, коли зелені точки можуть бути розподілені на ділянці у формі трапеції.

Отже, ми робимо перетворення двовимірної площини, яку вперше було класифіковано одновимірною гіперплощиною ("або прямою лінією") в тривимірну область, і ось наш класифікатор, тобто гіперплан, буде не прямою, а двома -вимірна площина, яка виріже площу.

Для того, щоб отримати математичне розуміння ядра, давайте розберемось у рівнянні ядра Лілі Цзян, яке є:

K (x, y) = де,
K - функція ядра,
X і Y - розмірні входи,
f - карта від n-мірного до m-мірного простору;
- крапковий продукт.

Ілюстрація за допомогою прикладу.

Скажемо, що у нас є дві точки, x = (2, 3, 4) і y = (3, 4, 5)

Як ми бачили, K (x, y) =.

Давайте спочатку порахуємо

f (x) = (x1x1, x1x2, x1x3, x2x1, x2x2, x2x3, x3x1, x3x2, x3x3)
f (y) = (y1y1, y1y2, y1y3, y2y1, y2y2, y2y3, y3y1, y3y2, y3y3)
так,
f (2, 3, 4) = (4, 6, 8, 6, 9, 12, 8, 12, 16) і
f (3, 4, 5) = (9, 12, 15, 12, 16, 20, 15, 20, 25)
тому крапковий продукт,
f (x). f (y) = f (2, 3, 4). f (3, 4, 5) =
(36 + 72 + 120 + 72 +144 + 240 + 120 + 240 + 400) =
1444 рік
І,
K (x, y) = (2 * 3 + 3 * 4 + 4 * 5) 2 = (6 + 12 + 20) 2 = 38 * 38 = 1444.

Це, як ми з'ясували, f (x) .f (y) і K (x, y) дають нам однаковий результат, але колишній метод вимагав численних обчислень (через проектування 3 вимірів на 9 вимірів), використовуючи ядро, було набагато простіше.

Типи ядра та методи у SVM

Давайте подивимось деякі функції ядра або типи, які використовуються в SVM:

1. Лінійне ядро - Скажімо, що у нас є два вектори з іменами x1 та Y1, тоді лінійне ядро визначається крапковим добутком цих двох векторів:

K (x1, x2) = x1. х2

2. Поліномне ядро - Поліноміальне ядро визначається наступним рівнянням:

K (x1, x2) = (x1. X2 + 1) d,

Де,

d - ступінь многочлена, а x1 і x2 - вектори

3. Ядро Гаусса - Це ядро є прикладом ядра радіальної базисної функції. Нижче наведено рівняння для цього:

Дана сигма відіграє дуже важливу роль у продуктивності ядра Гаусса і її не слід ні завищувати, ні її недооцінювати, вона повинна бути ретельно налаштована відповідно до проблеми.

4. Експоненціальне ядро - Це в тісній залежності від попереднього ядра, тобто ядра Гаусса з єдиною різницею - квадрат норми видалено.

Функція експоненціальної функції:

Це також функція радіального базисного ядра.

5. Ядро Laplacian - Цей тип ядра менш схильний до змін і повністю дорівнює обговорюваному раніше ядру експоненціальної функції, рівняння ядра Laplacian подано як:

6. Гіперболічне або сигмоподібне ядро - Це ядро використовується в ділянках нейронної мережі машинного навчання. Функція активації сигмоподібного ядра є біполярною сигмоїдною функцією. Рівняння функції гіперболічного ядра:

Це ядро дуже використовується і користується популярністю серед підтримуючих векторних машин.

7. Ядро радіальної основи Anova - Це ядро, як відомо, дуже добре справляється з проблемами багатовимірної регресії так само, як ядра Гаусса та Лаплачія. Це також підпадає під категорію радіального базового ядра.

Рівняння для ядра Anova:

Існує набагато більше типів методу ядра, і ми обговорили найбільш використовувані ядра. Це суто залежить від типу проблеми, яка вирішить використовувати функцію ядра.

Висновок

У цьому розділі ми побачили визначення ядра та як воно працює. Ми спробували пояснити за допомогою діаграм про роботу ядер. Потім ми спробували дати просту ілюстрацію, використовуючи математику щодо функції ядра. У заключній частині ми побачили різні типи функцій ядра, які широко використовуються сьогодні.