Вступ до питань тестування інтерв'ю ETL

Інформація та дані про бізнес - це найважливіші речі будь-якого бізнесу в наші дні. Аналіз усіх даних та інтеграція цих результатів набув величезного потенціалу на ринку. Існує багато інструментів тестування ETL, які допомагають організувати та простіший процес. Тестування ETL повинно мати чітко визначену стратегію, яка полегшує весь цей процес. Процес включає аналіз вимоги, оцінку валідації та тестування, планування тестування та проектування тестового середовища, підготовку та виконання тестових даних та створення зведеного звіту. Процес вилучення, перетворення та завантаження потребує набору аналізів і, як результат, потребує належного тестування. Наступні питання дадуть вам зрозуміти всі питання, які можна задати в інтерв'ю.

Тепер, якщо ви шукаєте роботу, пов’язану з тестуванням ETL, тоді вам потрібно підготуватися до питань інтерв'ю для тестування ETL 2019 року. Це правда, що кожне інтерв'ю відрізняється за різними профілями роботи. Тут ми підготували важливі запитання та відповіді про тестування ETL, які допоможуть вам досягти успіху в інтерв'ю.

У цій статті про тестування інтерв'ю ETL в 2019 році ми представимо 10 найважливіших і найчастіше використовуваних питань інтерв'ю ETL Testing. Ці питання поділяються на дві частини:

Частина 1 - Питання інтерв'ю для тестування ETL (основні)

Ця перша частина охоплює основні запитання та відповіді на тестування ETL

Q1. Що таке ETL та поясніть, чому потрібно тестування ETL?

Відповідь:
ETL - це абревіатура для отримання, перетворення та завантаження. Цей процес робиться для даних, які використовуються для аналізу та прогнозування майбутнього будь-якого бізнесу. Вилучення означає розташування даних та видалення з вихідного файлу всіх даних. Трансформація - це процес транспортування даних до будь-якого необхідного файлу та завантаження цього файлу до цільової системи у форматі, який запитується чи застосовується. Необхідність тестування ETL виникає, оскільки нам потрібно вести облік даних, які трансформуються з однієї системи в іншу. Нам також потрібно перевірити ефективність і швидкість усього цього процесу. Тестування ETL гарантує, що всі дані, які впроваджуються, відповідають вимогам клієнта та забезпечують необхідний вихід.

Q2. Що таке сурогатний ключ?

Відповідь:
Сурогатний ключ можна сказати як унікальний ідентифікатор, який може бути використаний для моделювання об'єкта чи об'єкта. Це може бути унікальний ключ, значення якого полягає в тому, щоб бути первинним ідентифікатором будь-якого об'єкта чи сутності, який не походить з будь-якої іншої бази даних і не може бути використаний як первинний ключ. Сурогатний ключ може бути унікальним послідовним номером. Сурогатний ключ не завжди є первинним ключем, і він зазвичай залежить від бази даних. Він вибирає, чи є база даних поточною чи тимчасовою. Коли база даних є поточною, вона зберігає поточні дані і повинна мати відношення один до одного в даних. Якщо мова заходить про тимчасову базу даних, то між первинним і сурогатним ключами може бути зв'язок від багатьох до одного.

Перейдемо до наступних питань про тестування інтерв'ю ETL.

Q3. Поясніть, що таке розділення та поясніть типи розділів?

Відповідь:
Для підвищення продуктивності наявні транзакції поділяються, і цей процес відомий як розділення. Розмежування допомагає серверу Informatica створити різні підключення до різних його джерел. Типи розділів:
Розбиття круглих роботів: Усі дані розподіляються рівномірно між усіма розділами. У всіх цих розділах, коли кількість рядків приблизно однакова, використовується цей розділ.
Розбиття хеша : У цьому розділі всі ключі секціонування, згруповані між розділами, застосовують хеш-функцію. Він використовується для забезпечення оброблюваної групи рядків, що мають один і той же ключ розділу, мають однакові розділи.

Q4. Які способи оновлення таблиці при використанні SSIS?
Відповідь:
Це поширені питання тестування інтерв'ю ETL, задані в інтерв'ю. Нижче наведено різні таблиці, які підтримуються ETL-тестуванням. Для оновлення таблиці за допомогою SSIS можна виконати наступні дії:

  • Використовуйте команду SQL
  • Використовуйте таблицю інсценізації для зберігання даних про етапи
  • Використовуйте кеш для зберігання даних, які використовують обмежений простір і потребують частого оновлення
  • Використовуйте сценарії для планування завдань
  • Використовуйте повне ім’я бази даних для оновлення MSSQL.

Q5. Що таке місце постановки та яке його призначення?

Відповідь:
Постановка даних - це звичайно сукупність процесів, які використовуються для підготовки вихідних даних системи. Потім ці дані завантажуються у сховище даних. Постановка даних включає наступні етапи:

Вилучення вихідних даних та трансформація даних, коли дані реструктуруються відповідно до вимог замовника. Перетворення даних включає процес очищення даних та перетворення значень. Він також включає процес сурогатних ключових завдань.

Частина 2 - Питання інтерв'ю для тестування ETL (розширено)

Давайте зараз ознайомимось із розширеними питаннями інтерв'ю для тестування ETL.

Q6. Поясніть різницю між тестуванням ETL та тестуванням баз даних?

Відповідь:
Різниця між тестуванням ETL та тестуванням баз даних полягає в наступному:

  • Тестування ETL зазвичай зосереджується на звітності про бізнес-аналітику, тоді як тестування баз даних включає інтеграцію даних.
  • Інструменти, які використовуються для тестування ETL, - це Cognos, QuerySurge і Informatica, тоді як QTP і селен використовуються для автоматизації тестування баз даних.
  • Аналіз даних в ETL має потенційний вплив на дані. Звичайне тестування бази даних впливає на архітектурну реалізацію
  • Тестування ETL має деформовані дані, тоді як тестування баз даних використовує нормалізовані дані.

Q7. Що таке факт? Поясніть види фактів?

Відповідь:
Факт є центральною складовою багатовимірної моделі, яка складається з заходів, що підлягають аналізу. Факти пов'язані з різними вимірами.

Типи фактів наведені нижче:
Добавка: міра може виконувати арифметичні обчислення, використовуючи всі або деякі виміри.
Напівдобавка: у цьому типі міра може виконувати арифметичний обчислення, використовуючи лише деякі розміри.
Недобавка: міра не може брати участь у арифметичних функціях, використовуючи розмірність.

Перейдемо до наступних питань про тестування інтерв'ю ETL.

Q8. Чим відрізняється сурогатний ключ від основного ключа?

Відповідь:
Кажуть, що ключ сурогату має послідовно генеровані числа, які не мають значення. Він просто використовується для того, щоб однозначно визначити наявні рядки. Первинний ключ, з іншого боку, використовується для однозначної ідентифікації рядків. Він видимий користувачам і може змінюватися відповідно до вимог.

Q9. Визначте термін повільно мінливий вимір.
Відповідь:
Це найбільш запитувані питання тестування інтерв'ю ETL в інтерв'ю. Повільно змінюються розміри - це ті, що мають тенденцію змінюватися дуже повільно. Дані в цих вимірах повільно змінюються. Прикладом цього виміру може бути місто чи працівник.
Рядки в цих даних у розмірах можна або повністю замінити, не маючи запису треків, або створити або вставити новий рядок. Використовуючи це, можна також відстежити повільні зміни.

Q10. Поясніть поняття очищення даних?

Відповідь:
Видалення фрагмента даних зі сховища даних відомо як очищення даних. Ці дані, які видаляються, зазвичай це дані, що мають рядки з нульовими значеннями або пробіли, які потребують очищення. У цьому процесі відбувається очищення цього виду сміття чи мотлоху.

Рекомендована стаття

Це посібник для переліку питань та відповідей про тестування ETL-інтерв'ю, щоб кандидат міг легко розбити ці запитання щодо інтерв'ю ETL. Тут, у цій публікації, ми вивчили основні питання про тестування інтерв'ю ETL, які часто задаються в інтерв'ю. Ви також можете переглянути наступні статті, щоб дізнатися більше -

  1. 10 питань інтерв'ю з істотною потужністю
  2. Питання щодо інтерв'ю PowerShell - найкорисніше
  3. Топ-10 питань щодо інтерв'ю MicroStrategy
  4. Питання щодо інтерв'ю JIRA