Введення в пакети R

Пакет - це сукупність функцій та наборів даних. Пакети допомагають розширити функціональні можливості мови програмування. Якщо ми хочемо зберігати та обробляти бази даних (тобто SQL, подібні до функціональних можливостей, використовуючи кадри даних), тоді ми можемо використовувати пакет dplyr в R. Пакети також надають документацію щодо використання функцій та наборів даних у даному пакеті.

Де ми знаходимо пакунки?

Пакети доступні в Інтернеті через різні джерела. Однак є певні надійні сховища, з яких ми можемо завантажити пакети.

Ось два важливі сховища, які доступні в Інтернеті.

  • CRAN (Комплексна мережа архівів R): це офіційна спільнота R із мережею FTP та веб-серверів, яка містить останній код та документацію R. Перед тим, як ви розміщуєте ваші пакунки в Інтернеті, вона проходить ряд тестів, які дотримуються політики CRAN .
  • GitHub: GitHub - це ще одне відоме сховище, але не характерне для R.The. Інтернет-спільнота може ділитися своїми пакетами з іншими людьми, і це добре використовується для контролю версій. GitHub є відкритим кодом і не має жодного процесу перегляду.

Список корисних пакетів R

У R є декілька пакетів, які можна завантажити з CRAN або GitHub. Нижче наведено пакунки, які можна використовувати для конкретних цілей.

1. Завантаження даних із зовнішніх джерел

  • Хейвен: R читає і записує дані з SAS.
  • DBI: T o встановити зв'язок між реляційною базою даних та R.
  • RSQlite: використовується для зчитування даних із реляційних баз даних.

2. Маніпуляція даними

  • Dplyr: Він використовується для маніпулювання даними, як підмножина, забезпечує ярлики для доступу до даних та генерує sql запити.
  • Tidyr - використовується для перетворення даних у крихітні формати.
  • stringr - маніпулює виразами рядків та рядками символів.
  • змащувати- Для роботи з даними та часом.

3. Візуалізація даних

  • Rgl: для роботи над 3D-візуалізаціями.
  • ggvis: для створення та побудови граматики графіки.
  • googlevis: використовувати інструменти візуалізації google у Р.

4. Веб-пакети

  1. XML: для читання та запису XML-документів у Р.
  2. Httpr: робота з http-підключеннями.
  3. Jsonlite: для читання таблиць даних json.

Отримання R-пакетів

Ми можемо перевірити наявні пакети, які є в R, використовуючи наведений нижче код.

  • available.packages (): У мережі CRAN доступно приблизно 5200 пакетів.

CRAN має перегляди завдань, які групують пакети під певну тему.

Встановлення пакетів R

Ми можемо встановлювати пакети безпосередньо через IDE або через команди. Для установки пакетів ми використовуємо наступну функцію та вказуємо назву пакета.

Синтаксис:

install.packages()

Код:

install.packages(“ggplot2”)

Вищевказаний код встановлює пакет ggplot2 та його залежні пакети, якщо такі є.

Ми можемо встановити кілька пакетів одночасно, вказавши імена пакета під символьним вектором.

Синтаксис:

install.packages(c(“package 1”, ”package 2”, ”package 3”))

Код:

install.packages(c(“ggplot2”, ”slidify”, ”deplyr”))

Встановлення за допомогою R Studio

Перевагою використання студії R є те, що це GUI (графічний інтерфейс користувача). Ми можемо вибрати пакети для встановлення та джерело його.

Ми можемо перейти до інструментів -> Встановити пакети.

Завантаження пакетів R

Після встановлення пакету R нам потрібно завантажити їх у R, щоб почати використовувати встановлені пакети.

Нижче ми використовуємо функцію для завантаження пакетів.

Синтаксис:

library(package name)

Примітка. Назва пакета не потрібно вказувати в лапках.

Код:

library(ggplot2)

Існують певні пакети, які відображають повідомлення при завантаженні. Деякі з них, ні. Ми можемо побачити деталі встановленої бібліотеки за допомогою наведеного нижче коду.

Код:

library(ggplot2)
search()

Вихід:

"Пакунок: решітка", "пакет: ggplot2", "пакет: зсуви"

"Package: knitr" "package: slidify" "tools: rstudio"

Створення власного пакету

Перш ніж ми створимо власний пакет. Ми повинні мати на увазі контрольний список нижче, перш ніж приступити до створення пакету.

  • Організація коду - одна з найважливіших речей під час написання коду в пакет. Ми втрачаємо половину часу на пошук місця розташування коду, а не покращення коду. Помістіть усі файли в папку, яка є легкодоступною.
  • Документування коду допомагає зрозуміти призначення коду. Коли ми часто не переглядаємо код, ми забуваємо, чому ми написали код певним чином. Це також може допомогти людям краще зрозуміти ваш код, коли вони поділяться з ними.
  • Спільний доступ до сценаріїв електронною поштою став архаїчним. Найпростіший спосіб - завантажити свій код і поширити його на GitHub. Можливо, ви отримаєте відгуки, які допоможуть вам покращити код.

Щоб створити власний пакет, ми повинні встановити пакет devtools.

Код:

install.packages("devtools")

Щоб допомогти з документацією, ми можемо використовувати пакет нижче.

Код:

install.packages("roxygen2")

Після встановлення пакета devtools. Ви можете створити власний пакет.

Код:

devtools::create ("packagename")

На місці "ім'я пакета" ви можете вказати ім'я, яке бажаєте. Тепер ви можете додати свої функції в цей пакет.

Ви можете створити те саме ім’я файлу, що і ім’я функції.

Синтаксис:

Devtools:create(“firstpackage”)

Розподільний пакет

Ви можете поширити свій пакет на github, використовуючи пакет devtools.

Ми використовуємо наведений нижче код для розповсюдження нашого пакету на github.

Код:

devtools::install_github("yourusername/firstpackage")

Ви можете вказати своє ім’я користувача github та ім’я пакета, яке ви створили вище.

Ось необхідні файли для пакета

  • Функції
  • Документація
  • Дані

Коли ми маємо всі перераховані вище файли, ми добре розмістити їх у сховищі.

Рекомендовані статті

Це посібник щодо пакетів R. Тут ми обговорюємо перелік корисних пакетів R, встановлюємо пакунки за допомогою R studio та створюємо власний пакет тощо. Ви також можете переглянути наступні статті, щоб дізнатися більше -

  1. Що таке мова програмування R?
  2. Кар'єра в програмуванні R
  3. R Програмування проти Python
  4. MySQL проти SQLite
  5. Список пакетів R

Категорія: