Вступ до гістограми в R

У цій статті ми почнемо з основної гістограми в реалізації та налаштуваннях R. Гістограма відіграє важливу роль в аналізі даних для візуалізації даних. Програмування R - це особливе середовище для статистичних обчислень та основи наукових даних. У програмуванні R набори даних та функції групуються у вигляді пакетів. Більшість програм візуальної аналітики використовують гістограми і використовують ширину відрізків за замовчуванням. Вони дозволяють швидко зрозуміти інформацію, яка є основною в науці даних. Тут ми побудуємо гістограму за допомогою R-команд.

Що таке гістограма?

Гістограма - це зображальне зображення розподілу набору даних, за допомогою якого ми могли б легко проаналізувати, який фактор має більший об'єм даних і найменший обсяг даних. Іншими словами, гістограма дозволяє робити кумулятивні графіки частоти на осі x і y. Власне, гістограми беруть і групувані, і негруповані дані. Для згрупованих даних гістограма будується з урахуванням меж класу, тоді як для негрупованих даних необхідно сформувати згрупований розподіл частот. Вони допомагають ефективно аналізувати діапазон та розташування даних. Під час розповсюдження даних застосовується якась загальна структура гістограм, як звичайні, перекошені, обриви.

На відміну від бруска, гістограма гістограми не має проміжків між брусками, а смужки тут позначаються як бункери, з якими дані представлені в рівних інтервалах. Гістограма Бере безперервну змінну і розбивається на проміжки, необхідно вибрати правильну ширину бункера. Основна різниця між гістограмою та гістограмою полягає в тому, що колишні використовують номінальні набори даних для побудови графіку, а гістограма побудує безперервні набори даних. R використовує функцію hist () для створення гістограм. Ця функція hist () використовує вектор значень для побудови гістограми. Гістограма складається з діапазону безперервних значень осі x, графік осі y часто визначає значення даних по осі x з смугами змінних висот.

Синтаксис:

Синтаксис створення гістограми є

hist (v, main, xlab, xlim, ylim, breaks, col, border)
where v – vector with numeric values
main – denotes title of the chart
col – sets color
border -sets border color to the bar
xlab - description of x-axis
xlim - denotes to specify range of values on x-axis
ylim – specifies range values on y-axis
break – specifies the width of each bar.

Створення гістограми в R

Для аналізу для цільової гістограми потрібен деякий вбудований набір даних для імпорту в R. R, а її бібліотеки мають різноманітні графічні пакети та функції. Тут ми використовуємо набір даних швейцарських та повітряних пасажирів. Для обчислення гістограми для заданого значення даних функція hist () використовується разом із знаком $ для вибору певного стовпця даних із набору даних для створення гістограми.

Наступний приклад обчислює гістограму значення даних у стовпці Експертиза набору даних на ім'я Swiss.

Приклад 1: Створимо просту гістограму

Код:

hist (swiss $Examination)

Вихід:

Історія створена для швейцарських наборів даних при дослідженні стовпців. це просто накреслює бункер з частотою та осі x.

Приклад 2: Гістограма з більшою кількістю аргументів

Щоб краще зрозуміти гістограми, нам потрібно додати більше аргументів до функції hist, щоб оптимізувати візуалізацію діаграми. Зміна міток x і y на діапазон значень Аргументи xlim та ylim додаються до функції.

Приклад:

hist (Air Passengers, xlim=c (150, 600), ylim=c (0, 35))
In the above example x limit varies from 150 to 600 and Y – 0 to 35.
// Adding breaks
hist (AirPassengers,
main="Histogram with more Arg",
xlab="Name List",
border="Green",
col="Orange",
xlim=c (100, 600),
ylim=c(0, 40),
breaks=5)

Вихід:

Наведений вище код наводить гістограму значень із набору даних Air Passengers, дає назву "Гістограма для більше аргументів", мітку осі x як "Список імен", із зеленою облямівкою та жовтим кольором на смуги, обмежуючи значення значення як 100 до 600, значення, надруковані на осі y на 2, а ширина відростка до 5.

Додавання до бару двох різних кольорів

hist (swiss$Examination, col=c ("violet”, "Chocolate2"), xlab="Examination”, las =1, main=" color histogram")

Вихід:

Додавання більше гістограм до гістограми

hist (swiss$Education, breaks=40, col="violet", xlab="Education", main=" Extra bar histogram")

Вихід:

Приклад 3: Гістограма в R Повертає значення

Air <- AirPassengers
hist (Air)
h <- hist (Air)
h
$breaks

Вихід:

Приклад 4: Використання аргументу перерви для зміни ширини контейнера

Щоб мати більше точок розриву між шириною, бажано використовувати значення в функції c ().

hist (AirPassengers, breaks=c (100, seq (200, 700, 150)))

Вихід:

Наведений вище графік приймає ширину смуги через значення послідовності.

Приклад 5: Реалізація кривої нормального розподілу у гістограмі

Ми будемо використовувати набір даних 'swiss' для значень даних, щоб намалювати графік. Тут функція крива () використовується для відображення лінії розподілу.

Код:

curve (dnorm(x, mean=mean(swiss$Education), sd=sd(swiss$Education)), add=TRUE, col="red")

Вихід:

Приклад 6: Розподіл ймовірностей графіку

hist (AirPassengers,
main="Histogram ",
xlab="Passengers",
border="Yellow",
col="pink",
xlim=c(100, 600),
las=2,
breaks=6,
prob = TRUE)

Створення графіків щільності в гістограмі в R

Розподіл змінної створюється за допомогою функціональної щільності (). Нижче наводиться приклад з набором даних mtcars. Ділянки щільності допомагають у розподілі форми.

density () // this function returns the density of the data
library(ggplot2)
d <- density (mtcars $qsec)
plot (d, main=" Density of Miles Per second")
polygon (d, col="orange",>

Вихід:

Using Line () function
hist (swiss$Examination, freq = FALSE, col=c ("violet”, "Chocolate2"),
xlab="Examination”, las =1, main=" Line Histogram")
lines(density(swiss$Examination), lwd = 4, col = "red")

Наступна гістограма в R відображає висоту як обстеження на вісь x, а щільність побудована на осі y.

Вихід:

Висновок

Це все про гістограму, і саме гістограма є найпростішим способом зрозуміти дані. Як ми бачили за допомогою гістограми, ми могли малювати поодинокі, декілька діаграм, використовуючи ширину відрізку, корекцію осі, зміну кольорів тощо. Гістограма допомагає візуалізувати різні форми даних. Нарешті, ми побачили, як гістограма дозволяє аналізувати набори даних, а середні точки використовуються як мітки класу. Гістограма допомагає змінювати інтервали для створення розширеного опису даних і працює, особливо з числовими даними. гістограми є більш переважними в аналізі через перевагу відображення великого набору даних. Виходячи з результатів, ми могли б візуально перекривити дані та легко зробити деякі припущення.

Рекомендовані статті

Це був посібник з гістограми в Р. Тут ми обговорили концепцію, синтаксис та спосіб створення гістограми в R за допомогою прикладів. Ви також можете переглянути наступні статті, щоб дізнатися більше -

  1. Приклади гістограми
  2. Кар'єра в програмуванні R
  3. Діаграма Ганта в Тато
  4. Кар'єра в галузі комп’ютерного програмування
  5. Як створити лінійний графік в R?

Категорія: