Формула випускників (Зміст)

  • Формула випускників
  • Приклади формули випускників (із шаблоном Excel)

Формула випускників

У статистиці Outliers - це дві надзвичайно віддалені незвичні точки у даних наборах даних. Надзвичайно високе значення та надзвичайно низькі значення - це зовнішні значення набору даних. Це дуже корисно для пошуку будь-яких недоліків чи помилок. Просто, як видно з назви, Outliers - це значення, які лежать назовні від решти значень у наборі даних. Наприклад, розгляньте студентів-інженерів і уявіть, що в класі були гноми. Тож гноми - це люди, які мають надзвичайно низький зріст у порівнянні з іншими нормально зрослими людьми. Отож, це значення більше, ніж у цьому класі. Зовнішні значення можна обчислити за допомогою методу Tukey.

Формула для Outliers -

Lower Outlier = Q1 – (1.5 * IQR)
Higher Outlier= Q3 + (1.5 * IQR)

Приклади формули випускників (із шаблоном Excel)

Візьмемо приклад, щоб краще зрозуміти розрахунок формули Outliers.

Ви можете завантажити цей шаблон Outliers тут - Шаблон Outliers

Формула випускників - приклад №1

Розглянемо наступний набір даних і обчислимо видатки для набору даних.

Набір даних = 5, 2, 7, 98, 309, 45, 34, 6, 56, 89, 23

Порядок зростання за набором даних:

Медіана набору даних про зростаюче замовлення обчислюється як:

У цьому наборі даних загальна кількість даних становить 11. Отже n = 11. Медіана = 11 + 1/2 = 12/2 = 6. Отже, значення, яке знаходиться в 6- му положенні в цьому наборі даних, є медіаною.

Отже, середнє значення = 34.

Розділіть набір даних на 2 половини за допомогою медіани.

Медіана набору даних нижньої та верхньої половини обчислюється як:

  • У нижній половині 2, 5, 6, 7, 23, якщо ми знайдемо медіану на зразок того, як ми знайшли на кроці 2, середнє значення було б 6. Отже Q1 = 6.
  • У верхній половині 45, 56, 89, 98, 309, якщо ми знайдемо медіану, як, як ми знайшли на кроці 2, середнє значення було б 89. Отже Q3 = 89.

IQR розраховується за формулою, наведеною нижче

IQR = Q3 - Q1

  • IQR = 89 -6
  • IQR = 83

Нижній Аутлієр розраховується за формулою, наведеною нижче

Нижній розмір = Q1 - (1, 5 * IQR)

  • Нижній розмір = 6 - (1, 5 * 83)
  • Нижній розмір = -118, 5

Вищий Outlier розраховується за формулою, наведеною нижче

Вищий вищий показник = Q3 + (1, 5 * IQR)

  • Вищий показник = 89 + (1, 5 * 83)
  • Вища Outlier = 213, 5

Тепер отримайте ці значення в наборі даних -118, 5, 2, 5, 6, 7, 23, 34, 45, 56, 89, 98, 213, 5, 309. Значення, які опускаються нижче в нижньому бічному значенні і вище у вищій стороні є зовнішньою цінністю. Для цього набору даних 309 - це більше.

Формула випускників - Приклад №2

Розглянемо наступний набір даних і обчислимо видатки для набору даних.

Набір даних = 45, 21, 34, 90, 109.

Порядок зростання за набором даних:

Медіана набору даних про зростаюче замовлення обчислюється як:

У цьому наборі даних загальна кількість даних становить 5. Отже, n = 5. Медіана = 5 + 1/2 = 6/2 = 3. Отже, значення, яке знаходиться в 3-му положенні в цьому наборі даних, є медіаною.

Отже, середнє значення = 45.

Розділіть набір даних на 2 половини за допомогою медіани.

Медіана набору даних нижньої та верхньої половини обчислюється як:

  • Q1 = 27, 5
  • Q3 = 89

IQR розраховується за формулою, наведеною нижче

IQR = Q3 - Q1

  • IQR = 99, 5 - 27, 5
  • IQR = 72

Нижній Аутлієр розраховується за формулою, наведеною нижче

Нижній розмір = Q1 - (1, 5 * IQR)

  • Нижній розмір = 27, 5 - (1, 5 * 72)
  • Нижній розмір = -80, 5

Вищий Outlier розраховується за формулою, наведеною нижче

Вищий вищий показник = Q3 + (1, 5 * IQR)

  • Вищий показник = 99, 5 + (1, 5 * 72)
  • Вища Outlier = 207, 5

Пояснення

Крок 1: Впорядкуйте всі значення в заданому наборі даних у порядку зростання.

Крок 2: Знайдіть середнє значення для впорядкованих даних. Медіану можна знайти за допомогою наступної формули. Наступний розрахунок просто дає вам місце середнього значення, яке знаходиться в наборі дати.

Медіана = (n + 1) / 2

Де n - загальна кількість доступних даних у наборі даних.

Крок 3: Знайдіть нижнє четверте значення Q1 з набору даних. Щоб знайти це, за допомогою серединного значення розділіть набір даних на дві половини. З набору значень нижньої половини знайдіть медіану для нижнього набору, який є значенням Q1.

Крок 4: Знайдіть верхнє четверте значення Q3 з набору даних. Це точно, як описаний вище крок. Замість нижньої половини ми повинні дотримуватися тієї ж процедури верхньої половини набору значень.

Крок 5: Знайдіть значення IQR міжквартирного діапазону. Щоб знайти значення вирахування Q1 з Q3.

IQR = Q3-Q1

Крок 6: Знайдіть значення Внутрішній Екстрім. Кінець, що виходить за межі нижньої сторони, яку також можна назвати незначною стороною. Помножте значення IQR на 1, 5 і відніміть це значення від Q1 дає вам Внутрішню нижню крайність.

Нижній розмір = Q1 - (1, 5 * IQR)

Крок 7: Знайдіть зовнішнє значення. Кінець, що випадає за межі вищої сторони, яку також можна назвати великою стороною. Помножте значення IQR на 1, 5, а підсумовуючи це значення з Q3, ви отримаєте Зовнішній вищий крайній край.

Вищий вищий показник = Q3 + (1, 5 * IQR)

Крок 8: Значення, що виходять за межі цих внутрішніх і зовнішніх крайнощів, є зовнішніми значеннями для даного набору даних.

Актуальність та використання вигідних формул

Отримані люди дуже важливі для будь-якої проблеми з аналітикою даних. Зовнішній вигляд показує непослідовність у будь-якому наборі даних, оскільки він визначається як нечасті віддалені значення в наборі даних від одного до іншого. Це дуже корисно для пошуку будь-яких недоліків, що мали місце в наборі даних. Тому що, коли ви розміщуєте помилку в наборі даних, це впливає на середнє значення і медіану, отже, можуть отримати великі відхилення в результаті, якщо Outliers є в наборі даних. Отож, важливо дізнатись, що виграли з набору даних, щоб уникнути серйозних проблем у статистичному аналізі.

Рекомендовані статті

Це було керівництвом до формули Outliers. Тут ми обговорюємо, як обчислити випускників разом із практичними прикладами та шаблоном Excel, який можна завантажити. Ви також можете переглянути наступні статті, щоб дізнатися більше -

  1. Керівництво до формули середнього рівня
  2. Приклади формули зарплати
  3. Калькулятор для формули DPMO
  4. Як розрахувати розподіл T?
  5. Формула кватертичного відхилення | Приклади