Вступ до інструментів візуалізації даних:

Візуалізація даних - це ключ до розуміння результатів будь-якого рішення незалежно від домену. Він приносить більше статистичних висновків від розуміння даних, вивчення різних моделей серед даних і більше до модельного розуміння результатів. Інструменти візуалізації даних - одна з головних сфер, де будь-яка людина може потрапити в основне розуміння відносин. На сьогоднішній день він більш широко використовується на ділових зустрічах, зацікавлені сторони, які змушують їх легко визначити основну цінність продукту.

Що таке інструменти візуалізації даних?

Існують численні інструменти візуалізації даних, такі як Tableau, QlikView, FusionCharts, HighCharts, Datawrapper, Ploty, D3.js тощо. Хоча є візуалізовані засоби візуалізації даних, що застосовуються в повсякденному житті при візуалізації даних, один з найпопулярніших інструментів побудови графіків. є matplot.pyplot.

Причини, чому Matplotlib з інструментів візуалізації даних найбільш широко використовується -

  1. Matplotlib - одна з найважливіших графічних бібліотек python.
  2. Весь модуль побудови графіків надихається інструментами для побудови графіків, які доступні в MATLAB.
  3. Основна причина - багато людей походять з областей математики, фізики, астрономії та статистики, і багато інженерів та дослідників використовуються для MATLAB.
  4. MATLAB - популярний набір інструментів для обчислень, особливо для наукових обчислень. Тож, коли люди, починаючи бібліотеку для побудови машинного навчання, спеціалізовану для пітону / Наукові дані / Штучний інтелект, вони надихнулися MATLAB і створили бібліотеку під назвою matplotlib
  • matplotlib.pyplot -

matplotlib.pyplot широко використовується для створення фігур з площею, побудови ліній, і ми можемо привабливо візуалізувати сюжети.

Давайте зануримось безпосередньо до дуже простих прикладів -

імпортувати matplotlib.pyplot як plt

plt.plot ((2, 4, 6, 4))

Наведене вище - список, plt.plot побудує ці елементи списку Y-осі, яка індексується 0, 1, 2, 3 як їх відповідна вісь X.

plt.ylabel ("Числа")

plt.xlabel ("Індекси")

Якщо ми подивимось на вищевказані 2 рядки коду, він позначає вісь Y та вісь X відповідно. (тобто називання обох осей.)

plt.title ("MyPlot")

Вищенаведений рядок коду дасть назву сюжету. Заголовок розповідає про те, про що йдеться у сюжеті.

plt.show ()

Існує одна проблема з вищевказаним сюжетом (скріншот 1), якщо ви помітили, ми не бачимо структури, подібні до сітки. Сітка допомагає читати значення з графіку набагато простіше. Тепер давайте подивимося, як отримати сітку.

plt.plot ((1, 2, 3, 4), (1, 4, 9, 16))

Подивіться на вищезазначений рядок коду, замість того, щоб давати один масив, у нас є два списки, які стають нашою осі X та Y-осі. Тут ви можете помітити, що якщо наше значення осі x дорівнює 2, це відповідне значення осі y дорівнює 4, тобто значення осі y - це квадрати значень осі x.

plt.ylabel ("квадрати")

plt.xlabel ('числа')

plt.grid () # сітка на

Щойно ви дасте це, ви отримаєте сюжет із вбудованою сіткою, як показано на скріншоті 2

plt.show ()

Тепер замість лінійної лінії ми побудуємо інший сюжет з іншим прикладом.

plt.plot ((1, 2, 3, 4), (1, 4, 9, 16), 'ro')

Кожна пара X, Y має такий параметр, як колір і форма, яку ми можемо надати відповідно, використовуючи функціональність аргументу пари ключових слів python.

У цьому випадку "ro" вказує на червоний колір та крапки у формі o (як показано на знімку 3).

plt.grid ()

plt.show ()

Скажімо, lib matplot працює лише зі списком, тоді ми не можемо широко використовувати його при обробці чисел. Ми можемо використовувати пакет NumPy. Також все перетворюється внутрішньо як масив NumPy

Давайте трохи поглянемо на різний сюжет:

імпортувати numpy як np

t = n.аранжевий (0., 5., 0.2)

У верхньому рядку створюються значення від 0 до 5 з інтервалом 0, 2.

plt.plot (t, t ** 2, 'b–', label = '2') # 'rs', 'g ^')

plt.plot (t, t ** 2.2, 'rs', label = '2.2 ′)

plt.plot (t, t ** 2, 5, 'g ^', label = '2, 5 ′)

У вищевказаних рядках коду 'b - -' позначаються блакитні тире, 'rs' позначає червоні квадрати, 'g ^' позначає зелені трикутники (див. Знімок екрана 4)

plt.grid ()

plt.legend ()

Вищевказаний рядок коду додає легенди на основі онлайн-етикетки. Легенди роблять сюжет надзвичайно читабельним.

plt.show ()

Давайте розберемося ще з деякими властивостями. Якщо ми хочемо, щоб ширина лінії була більшою, тоді це може зробити простий параметр, який називається ширина лінії.

x = (1, 2, 3, 4)

y = (1, 4, 9, 16)

plt.plot (x, y, ширина лінії = 5, 0)

plt.show ()

Існує багато інших різноманітних параметрів, які ви можете мати в документації функції сюжету в matplotlib.pyplot (https://matplotlib.org/api/pyplot_api.html).

Інша цікава річ - це встановити властивості.

x1 = (1, 2, 3, 4) y1 = (1, 4, 9, 16)

Значення Y1 - це квадрат X1

x2 = (1, 2, 3, 4) y2 = (2, 4, 6, 8)

Значення Y2 вдвічі перевищують значення X2

рядки = plt.plot (x1, y1, x2, y2)

Використовуючи вищевказаний рядок, ми можемо побудувати ці значення в одному рядку. Отже, що тут відбувається - це побудувати графік X1 проти Y1 і X2 проти Y2, і ми зберігаємо їх у змінній, що називається рядками. Також ми можемо змінити властивості цих рядків, використовуючи аргументи ключових слів.

plt.setp (рядки (0), color = 'r', ширина лінії = 2, 0)

Тут set називається властивостями набору, рядки (0), відповідні X1, Y1 відповідно, колір і ширина лінії - це аргументи. Наведений рядок коду записується за допомогою аргументів ключового слова (див. Знімок екрана 6).

plt.setp (рядки (1), 'color', 'g', 'linewidth', 2.0)

Вищевказаний рядок коду представляє синтаксис matlab.

Тут рядки (1) відповідають X2, Y2 відповідно. У нас також є дві пари аргументів "колір", "g" і "linewidth", "2.0" (див. Знімок екрана 6).

Будь-який спосіб ми зможемо побудувати лінію.

  • Перший спосіб - це рідний спосіб того, як ми використовуємо в python.
  • Другий спосіб переважно використовується людьми з походження MATLAB.

plt.grid ()

put.show ()

Висновок - Інструменти візуалізації даних

У цій статті інструментів візуалізації даних ми виявили вступ до візуалізації даних у Python. Щоб бути більш конкретними ми бачили

  • Як графік даних за допомогою графіків ліній
  • Як узагальнити взаємозв'язок змінних із графіками розкидання

Рекомендовані статті

Це було керівництвом щодо інструментів візуалізації даних. Тут ми вивчили основні поняття та засоби візуалізації даних на їх прикладах. Ви також можете переглянути наступні статті, щоб дізнатися більше -

  1. Візуалізація даних проти аналітики даних
  2. Data Scientist vs Data Mining
  3. Програмне забезпечення Big Data Analytics
  4. . Питання для співбесіди з даними
  5. Matplotlib In Python
  6. Розсилки сюжетів в Матлабі

Категорія: