Вступ до класифікації нейронної мережі

Нейронні мережі - це найефективніший спосіб (так, ви правильно це прочитали) для вирішення реальних проблем штучного інтелекту. В даний час це також одна з особливо широко досліджених областей інформатики, що нова форма нейронної мережі була б розроблена під час читання цієї статті. Існують сотні нейронних мереж для вирішення проблем, характерних для різних доменів. Тут ми проведемо вас через різні типи основних нейронних мереж у порядку збільшення складності.

Різні типи основ класифікації нейронних мереж

1. Дрібні нейронні мережі (спільна фільтрація)

Нейронні мережі складаються з груп Перцептрону для імітації нервової структури людського мозку. Дрібні нейронні мережі мають єдиний прихований шар перцептрона. Одним із поширених прикладів дрібних нейронних мереж є спільна фільтрація. Прихований шар перцептрона буде навчений представляти схожість між сутностями з метою формування рекомендацій. Система рекомендацій в Netflix, Amazon, YouTube тощо використовує версію спільної фільтрації, щоб рекомендувати свої продукти відповідно до інтересів користувачів.

2. Багатошаровий перцептор (глибокі нейронні мережі)

Нейронні мережі з більш ніж одним прихованим шаром називаються глибокими нейронними мережами. Спойлер попередження! Усі наступні нейронні мережі є формою глибокої нейронної мережі, налаштованої / вдосконаленої для вирішення проблем, пов'язаних з доменом. Загалом, вони допомагають нам досягти універсальності. Враховуючи достатню кількість прихованих шарів нейрона, глибока нейронна мережа може наблизитись, тобто вирішити будь-яку складну реальну проблему.

Теорема універсального наближення є ядром глибоких нейронних мереж для навчання та підгонки будь-якої моделі. Кожна версія глибокої нейронної мережі розробляється повністю зв'язаним шаром максимізованого продукту множення матриць, який оптимізований алгоритмами зворотного розповсюдження. Ми продовжуватимемо вивчати вдосконалення, що призводять до різних форм глибоких нейронних мереж.

3. Конволюційна нейронна мережа (CNN)

CNN - це найзріліша форма глибоких нейронних мереж для отримання найбільш точних, тобто кращих, ніж у людини результатів комп'ютерного зору. CNN складаються з шарів згортків, створених шляхом сканування кожного пікселя зображень у наборі даних. Коли дані отримують приблизний рівень за шаром, CNN починає розпізнавати шаблони і тим самим розпізнавати об'єкти на зображеннях. Ці об'єкти широко використовуються в різних програмах для ідентифікації, класифікації тощо. Останні практики, такі як навчання трансферу в CNN, призвели до значних поліпшень неточності моделей. Google Translator і Google Lens - це найсучасніший приклад CNN.

Застосування CNN є експоненціальним, оскільки вони навіть використовуються для вирішення проблем, які в першу чергу не пов'язані з комп'ютерним зором. Тут можна знайти дуже просте, але інтуїтивне пояснення CNN.

4. Повторна нейронна мережа (RNN)

RNN - це найновіша форма глибоких нейронних мереж для вирішення проблем в NLP. Простіше кажучи, RNN подають вихід декількох прихованих шарів назад до вхідного шару для агрегації та передачі наближення до наступної ітерації (епохи) вхідного набору даних. Це також допомагає моделі самостійно вчитися і швидше коригує прогнози. Такі моделі дуже корисні для розуміння семантики тексту в операціях NLP. Існують різні варіанти RNN, такі як Long Short Term Memory (LSTM), Reated Recurrent Unit (GRU) Gated тощо. На схемі нижче активація h1 та h2 подається відповідно на вхід x2 та x3.

5. Довга короткострокова пам'ять (LSTM)

LSTM розроблені спеціально для вирішення проблеми зниклих градієнтів з RNN. Зміна градієнтів трапляється з великими нейронними мережами, де градієнти функцій втрат, як правило, наближаються до нуля, роблячи призупинення нейронних мереж для навчання. LSTM вирішує цю проблему, запобігаючи функції активації в її періодичних компонентах і не змінюючи збережені значення. Ця невелика зміна значно покращила кінцеву модель, в результаті чого технічні гіганти адаптували LSTM у своїх рішеннях. Переглянувши «найпростішу пояснення LSTM»,

6. Мережі на основі уваги

Моделі уваги повільно переймають навіть нові RNN на практиці. Моделі уваги побудовані, орієнтуючись на частину підмножини інформації, яку вони надають, тим самим виключаючи переважну кількість фонової інформації, яка не потрібна для виконання завдання. Моделі уваги побудовані за допомогою комбінації м'якої та жорсткої уваги та облягання завдяки м'якій увазі, що поширюється ззаду Моделі з декількома увагами, складеними ієрархічно, називається Трансформер. Ці трансформатори ефективніше паралельно керувати стеками, так що вони дають найсучасніші результати із порівняно меншими даними та часом для навчання моделі. Розподіл уваги стає дуже потужним при використанні з CNN / RNN і може створювати опис тексту до зображення, як описано нижче.

Технічні гіганти, такі як Google, Facebook тощо, швидко адаптують моделі уваги для побудови своїх рішень.

7. Генеральна змагальна мережа (GAN)

Хоча моделі глибокого навчання дають найсучасніші результати, їх можуть обдурити набагато розумніші людські колеги, додавши шум до даних реального світу. GAN - це остання розробка в галузі глибокого навчання для вирішення подібних сценаріїв. GAN використовують непідконтрольне навчання, коли глибокі нейронні мережі навчаються з даними, згенерованими моделлю AI, а також з фактичним набором даних для підвищення точності та ефективності моделі. Ці змагальні дані в основному використовуються для того, щоб обдурити дискримінаційну модель з метою побудови оптимальної моделі. Отримана модель, як правило, є кращим наближенням, ніж може подолати такий шум. Інтерес до досліджень до GAN призвів до більш досконалих реалізацій, таких як Conditional GAN ​​(CGAN), Laplacian Pyramid GAN (LAPGAN), Super Resolution GAN (SRGAN) тощо.

Висновок - Класифікація нейронної мережі

Глибокі нейронні мережі штовхають межі комп'ютерів. Вони не обмежуються лише класифікацією (CNN, RNN) або прогнозами (Collaborative Filtering), але навіть генеруванням даних (GAN). Ці дані можуть відрізнятися від прекрасної форми мистецтва до суперечливих глибоких підробок, але вони щодня перевершують людей завданням. Отже, ми також повинні враховувати етику та вплив ШІ, працюючи над тим, щоб наполегливо працювати над створенням ефективної моделі нейронної мережі. Час для акуратної інфографіки про нейронні мережі.

Рекомендовані статті

Це посібник з класифікації нейронної мережі. Тут ми обговорили різні типи основних нейронних мереж. Ви також можете переглядати наші статті, щоб дізнатися більше -

  1. Що таке нейронні мережі?
  2. Алгоритми нейронної мережі
  3. Інструменти мережевого сканування
  4. Повторні нейронні мережі (RNN)
  5. Топ-6 порівнянь між CNN та RNN

Категорія: