Вступ до дизайну сховищ даних

Склад загальним словом означає, що зберігати щось в одному місці та подібні випадки в галузях, щоб зберігати складний обсяг даних в одному місці. Business Intelligence (BI) дозволяє запитувати дані з джерел даних, і довіру можна зробити лише тоді, коли є гарний дизайн сховища даних.

Склад даних інтегрує декілька джерел даних і зробить хорошу підтримку для аналізу та аналітичної звітності. Якщо у вас поганий дизайн сховища даних, це вплине на ріст вашої організації, отримавши неточні дані запитів.

Візьмемо приклад популярності веб-магазину Amazon, замовивши товар, і його можна доставити у нас на порозі. Коли клієнт заходить на сайт електронної комерції та шукає наявний товар у магазині. Потім ми вибрали та замовили товар, як тільки постачальник приймає та негайно відправляє. Тут ми можемо заощадити свій час на придбання потрібного товару.

Аналогічний випадок і з цим сховищем даних, вони можуть зберігатись та купуватись із системи транзакцій. Склад даних як дві основні концепції

  • OLAP - Інтернет-аналітична обробка
  • OLTP - Інтернет-транзакційна обробка

Обидві є системами онлайн-обробки, але мають деякі відмінності. OLTP управляє транзакційними додатками, такими як банкомат, OLAP використовує для аналітичної обробки, наприклад звітування, прогнозування тощо.

Збір вимог

  • Збір вимог - одна фаза в дизайні сховищ даних. Потрібно визначити критерії та успішно їх впровадити. Існують дві стратегії, що використовуються для проектування сховища даних, одна називається бізнес, а інша називається технічною.
  • Бізнес-стратегія орієнтована на перспективу бізнесу та сприяє збільшенню прибутку для зростання. Вимога технічної стратегії базується на звітності користувачів, аналізі, виборі обладнання, методі розробки, техніці тестування, середовищі впровадження та навчанні користувачів.
  • Коли ми визначали бізнес-технічну стратегію, нам також потрібно розробити план BCP (Recovery Recovery). Коли внаслідок катастрофи трапляються люди чи люди, ми повинні мати план для швидкого відновлення даних та забезпечення втрати даних. Розробка плану відновлення стихійних лих є одним із складних і викликає довіру до організації.

Налаштування навколишнього середовища

  • Після того як ми зібрали дані для проектування сховища даних, нам потрібно зробити належну настройку середовища для розробки, тестування та виробництва. Переважно повинна бути окрема система для додатків, бази даних, а також окрема для звітування / ETL.
  • Коли ми будуємо окреме середовище для кожного, гарантуємо, що всі зміни можуть бути розроблені / протестовані, а потім перейти до виробництва.
  • Якщо у нас є єдине середовище, розроблене для всіх цих заходів, це може закінчитися проблемою та втратою даних. Наприклад, коли в системі стався інцидент, ми не змогли орієнтуватися та з'ясувати спосіб виправлення, і це робить його складнішим.

Моделювання даних

  • Після того, як буде створено збір вимог та навколишнє середовище, наступним є розробка способів підключення джерела даних, обробки та зберігання у сховищі даних. Ця методика називається моделюванням даних. Це може бути аналіз об’єкта та взаємозв'язку між іншими.
  • При проектуванні сховища даних інженери розробили, як і де потрібно зберігати дані. У той же час ми також повинні визначити можливий спосіб отримання даних зі сховища даних. Після визначення джерела команда може побудувати логіку та створити подання структури структури.

Типи моделі даних

Існує три типи

  • Концептуальні
  • Логічні
  • Фізичні

Нижче згадуються три типи моделі даних:

1. Концептуальна: в ній сказано, що містить система, і її розробили бізнес-архітектори, щоб визначити сферу ділової стратегії.

2. Логічні. Це визначає, ЯК логіка може бути створена в СУБД; вона буде розроблена Business Analyst та Data Architect для створення набору правил для зберігання / отримання даних.

3. Фізичний: це визначає, як система може бути реалізована.

Використання дизайну сховищ даних

Хороший дизайн сховища даних може забирати багато часу при отриманні даних. Кожен крок повинен ефективно виконувати, щоб зробити систему гарною. Це допоможе організації обробляти складні типи даних та підвищити продуктивність на основі аналізу тенденцій. Тому кожен крок у дизайні архітектури DWH є важливим та більш усвідомленим у методі вибору. Організація вступає в кожен потік згодом і призводить до успішної реалізації сховища даних.

Є декілька важливих застосувань у хранилищі даних

1. Банківська галузь: Більшість банків використовує сховище даних для зберігання великої кількості даних про трансакції та можливість швидшого отримання даних запитів. Ними можна керувати, як дані про клієнтів, тенденції на ринку, звіти, аналіз тощо,

2. Фінансова галузь: вона схожа на банківську діяльність, але єдиною метою є покращення фінансових змін шляхом аналізу даних про клієнтів

3. Уряд: На сьогодні уряд управляє великою кількістю даних в Інтернеті та зберігає у реляційній базі даних. Кожні дані мають стосунки один з одним, як Aadhaar, PAN пов'язаний з багатьма джерелами.

4. Охорона здоров'я: Менеджери охорони здоров’я та служби так багато інформації. Він підтримує клінічні деталі, записи клієнтів та допомагає передбачати результати, аналізує зворотний зв'язок та формує звіти.

5. Страхування: Страхова компанія в основному використовується для моделей даних, тенденції клієнтів та ведення обліку.

6. Виробнича та розповсюджувальна промисловість: вона найбільш широко використовується у всіх галузях промисловості для зберігання інформації про товари та допомагає їм передбачити позицію попиту на виробництво та продаж. Аналіз проданого товару, що дає кращі методи прийняття рішень.

7. Послуги роздрібної торгівлі: Роздрібні торговці є посередником між виробником та замовником. Склад даних допомагає їм просувати акції та тенденції купівлі товарів.

8. Телефонна індустрія: телефонна індустрія керує великою кількістю історичних даних, що сприяє формуванню даних про клієнтів та націлюванню на просування рекламних кампаній.

Переваги сховища даних

  • Покращена бізнес-розвідка
  • Забезпечує якість та послідовність даних
  • Економить час і гроші
  • Відстежує історично інтелектуальні дані
  • Створює високу рентабельність інвестицій

Несприятливість Data Warehouse

  • Додатковий звіт Робота
  • Гнучкість та гомогенізація даних
  • Проблеми щодо власності
  • Попит на великі обсяги ресурсів
  • Приховані питання вимагають часу

Рекомендовані статті

Це посібник з дизайну сховищ даних. Тут ми обговорюємо техніку проектування сховища даних, збір вимог, налаштування навколишнього середовища, використання, перевагу / Dis-перевагу. Ви також можете переглянути наступну статтю, щоб дізнатися більше -

  1. Переваги сховища даних
  2. Реалізація сховищ даних
  3. Моделювання сховищ даних
  4. Інструменти для зберігання даних
  5. Топ-4 різних типів моделей даних

Категорія: