Вступ до Scatterplot в R

  • R - мова програмування з відкритим кодом, що використовується для статистики даних та аналізу даних. Зі збільшенням популярності наукових даних R також набула популярності. Він використовується в основному статистиками даних та шахтарями даних для вилучення цінних даних з даних. R - інтерпретована мова та має інтерфейс командного рядка, але існує багато графічних інтерфейсів користувача для спрощення завдань розробника. R пропонує велику різноманітність бібліотек для впровадження статистики та графічних методів. R пропонує статичну графіку; це дозволяє користувачеві будувати шаруватий графік. Таким чином, він створює графіки якості публікації та забезпечує кращу поданість інформації.
  • R пропонує величезний набір бібліотек для графічної реалізації, але найпопулярнішим є "ggplot2". GGPlot2 - реалізація "Граматики графіки", яка робить створення складних графіків простим. Він надає програмний інтерфейс для вказівки змінних, їх положення, кольору графіка, типів графіка та інших властивостей візуалізації. Це дозволяє створювати графіки поетапно, дозволяючи створювати шари для великої гнучкості та якості публікації.
  • Одним з таких типів графа є Scatterplot в R. Scatterplot в R, який також називають діаграмою розсіювання, що є типом графа, який показує кореляцію між двома змінними. Він показує точки даних у вигляді крапок. Він може бути проведений між суцільною незалежною змінною та іншою змінною, що залежить від попередньої змінної або двох безперервних незалежних змінних. Кореляція може бути позитивною, негативною або недійсною. Якщо нахил графіка знаходиться зліва вліво вгорі праворуч, кореляція позитивна. Якщо нахил знаходиться зліва вліво праворуч, кореляція від’ємна або іншими словами збільшення значення однієї змінної зменшиться на значення іншої змінної.

Синтаксис: У R для графіків існує багато пакетів, тому існує багато функцій для створення Scatterplot в R. Найбільш основна і проста функція:

сюжет (х, у)

де

x позначає горизонтальну вісь або незалежну безперервну змінну.

y позначає вертикальну вісь або залежну змінну.

Існує багато інших параметрів для побудови функції, щоб зробити графік легким для розуміння.

Нижче наведено декілька з визначенням:

  • головний: додає в графі заголовок
  • xlab: додайте мітку до осі x
  • ylab: додає мітку до осі y
  • xlim: задає діапазон осі x
  • ylim: задає діапазон осі y
  • pch: вказує форму точок на ділянці розкидання
  • cex: вказує розмір балів
  • col: визначає колір очок

Scatterplot в R може бути створений і за допомогою пакету ggplot2. Для цього нам спочатку потрібно встановити та завантажити пакет ggplot2. Після додавання пакету до поточного сеансу нижче команда може бути використана для створення Scatterplot в R.

ggplot (набір даних, aes (x, y, колір, форма)) + geom_poin () + labs (x, y, title)

де

  • набір даних - це набір даних, для якого потрібно створити розсіювач.
  • aes () - естетичне відображення у графі. Він описує, як змінні відображаються на графіку.
  • x - горизонтальна вісь або незалежна безперервна змінна.
  • y - вертикальна вісь або залежна змінна.
  • color - це додавання кольору до точок на основі змінної групування.
  • форма використовується для встановлення форми на основі групування змінної.
  • знак + вказує на те, що команда продовжується.
  • geom_point () - функція для розсіяння ділянки.
  • лабораторії (x, y, назва): додайте x label, y label та title у графік.

Створіть Scatterplot In R

Щоб створити Scatterplot в R, спочатку потрібно завантажити набір даних. Тут ми використовуємо набір даних (mtcars), наданий R. Спочатку завантажте набір даних у поточний сеанс за допомогою команди нижче

дані (райдужка)

Після завантаження набору даних перегляньте дані, щоб отримати базове розуміння типу даних та стовпців у ньому за допомогою команди нижче.

ірис

Отримавши базове розуміння даних, давайте створимо простий розсіювач за допомогою функції сюжету

сюжет (iris $ Sepal.Length, iris $ Sepal.Width, xlim = c (4.0, 9.0), ylim = c (2.0, 5.0))

Додавання міток, щоб зробити графік читабельним

сюжет (iris $ Sepal.Length, iris $ Sepal.Width, xlim = c (4.0, 9.0), ylim = c (2.0, 4.0), xlab = «Довжина Sepal», ylab = «Ширина Sepal», main = «Ширина проти довжини ”)

Додавання ще якогось параметра, щоб зробити графік привабливішим

сюжет (iris $ Sepal.Length, iris $ Sepal.Width, xlim = c (4.0, 9.0), ylim = c (2.0, 4.0), xlab = «Довжина Sepal», ylab = «Ширина Sepal», main = «Ширина проти довжини ", pch = 8, cex = 1, 5, col = 6)

Крім цих 2-D графіків, матричні та 3-D графіки також можуть бути створені в Р.

Матриці розсіювання

Коли в наборі даних є більше двох змінних і ми хочемо знайти кореляцію кожної змінної з усіма іншими змінними, тоді використовується матриця розсіювання. Найбільш основна і проста команда для матриці розсіювання:

пари (~ Sepal.Length + Sepal.Width + Petal.Length + Petal.Width, data = iris, main = ”Матриця Scatterplot”)

Наведений вище графік показує залежність між вагою, миль / год, dsp та циліндром.

Scatterplot 3D

Іноді тривимірний графік дає краще розуміння даних. Для цього R надає кілька пакунків, один з них - "scatterplot3d". Нижче наводяться команди встановити "scatterplot3d" в робочу область R і завантажити його в поточному сеансі

install.packages ("scatterplot3d")

бібліотека (scatterplot3d)

Після завантаження бібліотеки виконання наведених нижче команд створить 3-D розсіювач.

кріплення (райдужка)

scatterplot3d (Sepal.Length, Sepal.Width, Petal.Length, main = "3D Scatterplot")

Крім цього, існує багато інших способів створення тривимірного. Користувачі також можуть додавати деталі, такі як колір, заголовки, щоб покращити графік. Користувач також може створити інтерактивний 3D-розсіювач за допомогою функції "plot3D (x, y, z)", наданої пакетом "rgl". Ця функція створює обертовий 3D-розсіювач, який можна обертати за допомогою миші. Таким чином, дається повне уявлення про співвідношення змінних.

Висновок

R - одна з найвідоміших мов для впровадження графічних прийомів, що використовуються науковцями. Він надає широкий спектр пакетів і бібліотек для графіки та кращого розуміння даних. "Gglpot2", "ggvis", "rgl", "plot3d", "решетування", "анімація", "gganimate", "cairo" - деякі з пакетів, наданих Р.

Діаграма розкидання - це найпростіший спосіб покращити розуміння даних. Використовуючи цю візуалізацію, користувач може дізнатися, як змінні пов'язані між собою, як зміна значення однієї змінної змінить значення інших змінних тощо. Нахил діаграми говорить про позитивний і негативний зв’язок між змінними.

Рекомендовані статті

Це посібник із Scatterplot в Р. Тут ми обговорюємо вступ, матриці розсіювання, 3D-схеми розсіювання, як створити розсіювач? разом з відповідними прикладами. Ви також можете ознайомитися з іншими запропонованими нами статтями, щоб дізнатися більше -

  1. Що таке GraphQL
  2. Scrum Framework
  3. R Питання для співбесіди
  4. Вступ до біноміального розподілу в R

Категорія: