Як встановити NLTK?

У наступній статті Встановити NLTK наведено контур для встановлення NLTK. NLTK - це набір бібліотек для обробки природних мов. Це платформа для побудови програм Python для обробки природного мови. NLTK написаний мовою програмування Python. Його розробили Стівен Берд та Едвард Лопер. Він підтримує дослідження та викладання в НЛП або близько пов'язаних з ними областях, включаючи когнітивну науку, емпіричну лінгвістику, пошук інформації, штучний інтелект та машинне навчання. NLTK забезпечує простий у користуванні інтерфейс.

NLTK (Інструментарій з природних мов)

  • Обробка природних мов (НЛП) - це частина штучного інтелекту, яка обробляє мову, якою розмовляють люди. Таким чином, це допомагає людині взаємодіяти з комп'ютерами, навіть якщо вони не мають знань, як ним користуватися. Використовуючи NLP, люди просто повинні продиктувати команду комп'ютерам. Завдяки машинному навчанню, обробка природних мов стає популярною та легшою у здійсненні. Це в основному техніка взаємодії з людьми та виконання дій над голосовими командами.
  • Це дозволяє використовувати пристрої навіть новачок, який не знає технології. Але здійснити природну обробку мови непросто, оскільки мова, якою розмовляють люди, не має певної структури. Це неоднозначно і залежить від контекстних слів, які можуть мати інше значення.
  • У NLTK є понад 50 корпоративних та лексичних джерел, таких як WordNet, Corpus Penns Treebank Corpus та ін. Він також пропонує путівник, в якому пояснюються поняття обробки мови за допомогою інструментарію та програмних основ Python, що полегшує людей. які не мають глибоких знань з програмування. Він має широкий спектр пакетів, що робить його одним із потужних наборів інструментів для NLP. Токенізація, лематизація, кодування, розбір символів, кількість символів, пунктуація, кількість слів - деякі з цих пакетів.

Встановіть NLTK для Windows

Нижче наведено інструкції щодо встановлення NLTK у Windows. Вони ґрунтуються на припущенні, що Python не встановлений у системі. NLTK вимагає версій Python 2.7, 3.5 і вище.

Крок 1. Завантажте останню версію Python для Windows із нижньої посилання

https://www.python.org/downloads/

Крок 2. Клацніть на завантажений .exe, щоб запустити його.

Крок 3: Виберіть налаштування установки.

Крок 4: Перевірте всі функції, особливо "pip", оскільки це допомагає встановити NLTK і натиснути на Далі.

Крок 5: На наступному екрані виберіть розширені параметри, виберіть шлях та натисніть на встановити.

Крок 6: Після того, як установка буде успішною, закрийте вікно.

Крок 7: Скопіюйте шлях папки Scripts, щоб встановити NLTK в ту ж папку.

NLTK можна легко встановити за допомогою інсталятора "pip". Також нам потрібно встановити “numpy”.

Крок 8: Щоб встановити NLTK, відкрийте командний рядок і введіть команду нижче.

Переконайтеся, що установка пройшла успішно.

Після успішної установки зараз прийшов час використовувати NLTK для обробки природних мов.

Крок 9: Відкрийте Python Shell і введіть нижче команду.

Якщо він імпортований без будь-якої помилки, це означає, що NLTK встановлений належним чином.

Встановіть NLTK для Mac / Linux

На відміну від Windows, системи Linux придумують встановлений у ній Python. Для встановлення NLTK в Linux / Mac використовується інсталятор пакета Piphon. Щоб встановити pip або оновити його, введіть нижче команди в командному рядку.

Для встановлення python в Linux використовуйте команди нижче.

Крок 1. Для оновлення індексу пакета використовуйте команду нижче.

Крок 2. Щоб встановити Python в системі Linux, використовуйте нижче.

Крок 3: Введіть команду нижче, щоб встановити “pip” для Python 3.

Крок 4: Після успішного встановлення “Pip” використовуйте наступні команди для установки NLTK.

Набір даних NLTK

NLTK має багато наборів даних для обробки природних мов, наприклад, WordNet, WikiCorpus, Gutenberg, Opinion Lexicon, Tweebank тощо. Ці набори даних називаються корпораціями. В основному, набір даних NLTK містить набір файлів або документів. Кожен файл / документ містить сукупність слів, букв чи текст однією мовою. Таким чином, корпус - це переважно бібліотеки для розуміння / вивчення мови. Він має правила граматики та структури мови.

Після успішної установки NLTK, ви можете імпортувати його, а також завантажити його корпуси за допомогою наступної команди.

Завантажувач NLTK відкриває вікно для завантаження наборів даних. Розмір набору даних великий, тому знадобиться час. Щоб перевірити, чи правильно встановлені набори даних, спробуйте імпортувати набір даних і використовувати його.

Обробка НЛТК

Існує 5 основних процесів обробки природної мови. Це кроки, пов'язані з обробкою будь-якого тексту.

  1. Виявлення EOS : виявлення кінця мови розбиває текст на збірку змістовних речень. Він ділить довгий текст на частини, які мають певне значення.
  2. Токенізація : Цей крок розділяє речення на лексеми. Токени не містять лише слів, але також містять пробіли, перерви у реченні.
  3. Позначення POS : POS означає мовлення. Тут інформація призначається маркеру. Ці відомості говорять про те, який тип мови це як натяг, дієслово, прикметник, іменник тощо.
  4. Chunking : Chunking означає збирання тексту на основі тегів.
  5. Видобуток: видобуток - це тривалий процес перегляду фрагментів та позначення їх як названих об'єктів, таких як люди, місця, організації тощо

Висновок:

NLTK використовується для класифікації тексту, підпису зображень, розпізнавання мови, відповіді на питання, моделювання мови, узагальнення документів та багатьох інших операцій. Існує багато інших інструментів для обробки природних мов. Але NLTK має широкий спектр бібліотек, що робить його одним із потужних засобів обробки природних мов. Він більш точний, ніж будь-який інший інструмент, але через велику кількість бібліотек він трохи повільний. Отже, все залежить від вимог користувача. Якщо користувач хоче швидкості, то він також може віддавати перевагу іншим інструментам, але тоді їм доведеться йти на компроміс з точністю вмісту. Але якщо точність є пріоритетним, тоді вони обов'язково повинні відповідати NLTK.

Рекомендовані статті:

Це керівництво для встановлення NLTK. Тут ми обговорюємо основну концепцію та різні кроки для встановлення NLTK на Windows та Linux \ Mac. Ви також можете переглянути наступні статті, щоб дізнатися більше -

  1. Встановіть панель приладів Kubernetes
  2. Як встановити JDK
  3. Встановити Docker
  4. Як встановити Magento?
  5. Версії Magento | Особливості Magento Versions