Як встановити Apache

Перш ніж ввести, як встановити частину Apache, ми спочатку мали б загальний огляд Apache та як він використовується в науці даних.

Що таке Apache?

Веб-сервер Apache - це сервер HTTP, який представляє веб-сайти відвідувачам, які відвідують ваш сервер. Отже, якщо ви хочете розгорнути веб-сайт для бізнесу або вашої організації, ви, швидше за все, використовуєте Apache для цього.

Там є інші сервери HTTP, такі як IIS, але Apache - це стандарт, яким користуються більшість людей, будь то в Linux, Windows або Mac. Apache - це за замовчуванням, до якого звертається більшість людей, тому що це добре відомо, це дуже надійно і безкоштовно.

Однак, з Apache потрібно усвідомити, що, оскільки це HTTP-сервер, тож якщо ви встановите це на Linux або Windows або Mac, все, що вам дозволить зробити, це представити статичні веб-сайти відвідувачам, які приходять на ваш сервер. Отже, якщо ви кодуєте веб-сайт HTML, в якому немає інших мов програмування, крім JavaScript, ви можете використовувати його лише з сервером Apache. Ви можете підключити всі свої теги до сервера Apache і подати їх своїм відвідувачам.

Як Apache використовував у Data Science?

Наука даних є найбільш затребуваною сферою вивчення в сучасному світі. Data Scientist вважається найсексуальнішою роботою в 21 столітті з професіоналами різних дисциплін, які хочуть вчитися і стати науковцем даних. Apache відіграє вирішальну роль у будь-якого ентузіаста з наукових даних, оскільки їм потрібні достатні знання про екосистему Apache Hadoop.

Екосистема Apache Hadoop

Найперше, що екосистема Hadoop - це не один інструмент. Це не мова програмування або єдина рамка. Це група інструментів, які використовуються разом різними компаніями в різних областях для виконання декількох завдань. Ми переглянемо кожен інструмент по одному нижче: -

  • Apache HDFS (розподілена файлова система Hadoop) - це блок пам'яті Hadoop, який може зберігати структуровані, напівструктуровані та неструктуровані дані. HDFS має метадані, які підтримують файл журналу про збережені дані. Він має два компоненти - NameNode та DataNode.
  • Apache пряжа - це переговорник ресурсів, який виконує всі операції з обробки, такі як завдання планування, розподілу ресурсів тощо. У неї є два сервіси. Другий - Менеджер вузлів, який контролює використання ресурсів .
  • Зниження Apache Map - це компонент обробки даних Hadoop, який обробляє великі набори даних за допомогою розподілених та паралельних обчислень на основі функцій Map, Sort and Shuffle та Reduce. Функція карти фільтрує дані, потім проводиться сортування та перетасування, а наприкінці зменшення функції агрегує та підсумовує результат.
  • Свиня Apache використовується в основному в ETL. Вона має дві частини - Свиня Латинська та Свиня. Pig Latin - це мова, яка використовується для обробки даних за допомогою запиту, тоді як час виконання Pig - середовище виконання. Один рядок латинської свині майже дорівнює 100 рядків коду зменшення карти. Процес включає спочатку завантаження даних, а потім групування, сортування, фільтрування та збереження їх у форматі HDFS.
  • Apache Hive використовує SQL-подібний запит для аналізу даних у розподіленому середовищі. Він має два компоненти - командний рядок вулика та сервер JDBC / ODBC, а використовувана мова називається HiveQL.
  • Apache Mahout - це бібліотека машинного навчання, написана на Java та використовується для створення програм машинного навчання, таких як кластеризація, класифікація чи регресія. Він має різні алгоритми, вбудовані для різних випадків використання.
  • Apache HBase - це база даних NoSQL, написана на Java, що працює над Hadoop. Він побудований на основі BigTable Google і здатний обробляти всі типи даних.
  • Apache Sqoop - це інструмент прийому даних, який використовується для об'ємної структурованої передачі даних між RDBMS та Hadoop.
  • Apache Flume - ще один інструмент прийому даних, який використовується для напівструктурованої та неструктурованої передачі даних між Hadoop та іншими джерелами даних.
  • ZooKeeper - координатор, який забезпечує координацію між різними інструментами в екосистемі Hadoop.
  • Apache Ambari - це менеджер кластерів, який забезпечує управління кластерами Hadoop, а також контролює їх здоров'я та стан.
  • Apache Tez - новий інструмент в екосистемі Hadoop, який прискорює обробку запитів Hadoop.
  • Apache Presto - це розроблений SQL запит із відкритим кодом, що забезпечує можливість запиту між платформами.
  • Apache HCatalog - це система управління метаданими та таблицями для Hadoop, яка дозволяє взаємодіяти через інструменти обробки даних. Він також допомагає користувачам вибирати найкращі інструменти для свого середовища.
  • Apache Spark є найбільш широко використовуваною та популярною основою серед Data Scientist. Це високошвидкісна кластерна обчислювальна система, яка оптимізує використання ресурсів у випадку багатьох ітеративних завдань. Це дає гнучкість як для пакетної обробки, так і для аналізу даних у режимі реального часу.

Нижче наведено етапи встановлення Apache

Поки ми дізналися про Apache та про те, як це корисно для всіх, хто хоче вивчити Data Science або Big Data Analytics. Тепер ми підемо вниз і встановимо apache на windows на основі наведених нижче кроків.

  • Перейдіть на сторінку https://httpd.apache.org/ і натисніть посилання Завантажити в розділі Apache httpd 2.4.38 Випущений.

  • Він перенесе вас на наступну сторінку, а потім натисніть на Файли для Microsoft Windows.

  • Клацніть на Apache Lounge.

  • Ви можете завантажити 32-бітний або 64-бітний zip-файл на основі вашої операційної системи Windows. Тут ми завантажимо 64-бітну версію. Клацніть відповідне посилання .zip для завантаження.

  • Тепер для нього потрібна C ++ перерозподільна Visual Studio 2017. Отже, ми завантажимо її з відповідного 32-бітного або 64-бітного посилання

  • Після завантаження обох файлів ми спочатку перейдемо до завантаженого місця та встановимо спочатку C ++ Redistributable Visual Studio 2017. Двічі клацніть файл .exe.

  • Поставте прапорець "Я згоден" та натисніть кнопку Встановити.

  • Встановлення Apache триває.

  • Як тільки воно буде завершено, ви отримаєте таке повідомлення. Клацніть Закрити, щоб закінчити встановлення.

  • Тепер перейдіть до папки, куди завантажуєте поштовий файл Apache. Клацніть на ньому правою кнопкою миші та виберіть тут витяг.

  • Тепер у нас буде створена папка Apache24. Скопіюйте цю папку на диск C, і тоді ми додамо шлях до змінних системного середовища.

Перейдіть до Властивості системи -> вкладка Додаткові -> Натисніть кнопку Змінні середовища.

  • У змінних знайдіть Шлях та натисніть Редагувати.

  • Клацніть Огляд -> Перейти до папки C приводу Apache24 -> Вибрати папку бін -> Клацніть ОК.

  • Ми встановимо Apache як службу Windows. Запустіть командний рядок як адміністратор. Введіть httpd –k встановити та натисніть клавішу enter.

  • Ми перевіримо службу встановлення Apache. Клацніть піктограму Windows та введіть служби. Клацніть на додаток Сервіси та знайдіть службу з назвою Apache24.

  • Щоб запустити сервер Apache, клацніть правою кнопкою миші та натисніть кнопку Пуск. Статус зміниться на "Запуск".

  • Ми можемо протестувати за допомогою браузера. Відкрийте веб-переглядач та перейдіть до http: // localhost та натисніть клавішу Enter. Повідомлення про те, що "Це працює!" з'явиться, щоб підтвердити успішну установку Apache.

Рекомендовані статті

Це керівництво про те, як встановити Apache. Тут ми обговорили Інструкції та різні кроки для встановлення Apache. Ви також можете переглянути наступну статтю, щоб дізнатися більше -

  1. Питання для інтерв'ю Apache
  2. Apache Spark vs Apache Flink
  3. Apache Hadoop проти Apache Spark
  4. Apache Kafka vs Flume
  5. Кафка проти Кінесіса | Основні відмінності

Категорія: