Формула коефіцієнта кореляції (Зміст)
- Формула
- Приклади
Що таке формула коефіцієнта кореляції?
У статистиці є певні результати, які мають пряме відношення до інших ситуацій чи змінних, а коефіцієнт кореляції є мірою прямої асоціації двох змінних чи ситуацій. Ці змінні виявляють позитивний коефіцієнт кореляції, коли вони рухаються в одному напрямку в той же час. Аналогічно, якщо вони рухаються в іншому і протилежному напрямку, вони, як кажуть, мають негативний коефіцієнт кореляції. Наприклад: Якщо процентна ставка на ринку знизиться, кредити для корпорацій будуть дешевшими, а економіка зросте. Тож процентна ставка та зростання економіки мають позитивний коефіцієнт кореляції. Значення коефіцієнта кореляції визначає силу взаємозв'язку між змінними. Максимальне значення коефіцієнта кореляції коливалося від +1 до -1. Якщо коефіцієнт кореляції дорівнює +1, то змінні ідеально позитивно співвідносяться, і якщо це значення дорівнює -1, то воно називається ідеально негативно корельованим.
Припустимо, у нас є 2 набори даних, задані X (X1, X2 … Xn) і Y (Y1, Y2 … Yn).
Формула для коефіцієнта кореляції задана:
Correlation Coefficient = Σ ((X – X m ) * (Y – Y m )) / √ (Σ (X – X m ) 2 * Σ (Y – Y m ) 2 )
Де:
- X - Точки даних у наборі даних X
- Y - Точки даних у наборі даних Y
- X m - середнє значення набору даних X
- Y m - середнє значення набору даних Y
Ця формула здається дуже трудомісткою і спочатку заплутаною.
Є ще один спосіб обчислити коефіцієнт кореляції просто за допомогою функції CORREL () у excel. Я поясню обидві формули коефіцієнта кореляції, використовуючи приклади.
Приклади формули коефіцієнта кореляції (із шаблоном Excel)
Візьмемо приклад, щоб краще зрозуміти обчислення коефіцієнта кореляції.
Ви можете завантажити цей шаблон шаблону формули коефіцієнта кореляції тут - Шаблон формули коефіцієнта кореляції Формула ExcelФормула коефіцієнта кореляції - приклад №1
Скажімо, у нас є два набори даних X&Y і кожен містить 20 випадкових точок даних. Обчисліть коефіцієнт кореляції для набору даних X & Y.
Рішення:
Середнє значення обчислюється як:
- Середнє значення набору даних X = 15.6
- Середнє значення набору даних Y = 13, 8
Тепер нам потрібно обчислити різницю між точками даних та середнім значенням.
Аналогічно обчисліть для всіх значень набору даних X.
Аналогічно обчисліть для всіх значень набору даних Y.
Обчисліть квадрат різниці для обох наборів даних X і Y.
Помножте різницю X на Y.
Коефіцієнт кореляції розраховується за формулою, наведеною нижче
Коефіцієнт кореляції = Σ ((X - X m ) * (Y - Y m )) / √ (Σ (X - X m ) 2 * Σ (Y - Y m ) 2 )
Коефіцієнт кореляції = 0, 343264
Отже, це означає, що обидва набори даних мають позитивну кореляцію і задаються 0, 343264 .
Формула коефіцієнта кореляції - приклад №2
Скажімо, ви хочете інвестувати гроші на фондовий ринок, і ви хочете інвестувати дві акції і хочете вибрати ці акції таким чином, щоб ваш портфель був диверсифікований. Це означає, що якщо один дає вам негативну віддачу, інші допоможуть вам отримати позитивну віддачу і навпаки. Тому в основному ви хочете інвестувати в акції, які мають негативну кореляцію. У вас є 2 запаси і ви отримали інформацію про їх історичні прибутки за останні 15 років.
Рішення:
Коефіцієнт кореляції розраховується за формулою excel.
Коефіцієнт кореляції = -0, 45986
Тут ми використали функцію CORREL () excel, щоб побачити коефіцієнт кореляції для 2 запасів. Ви бачите, що функція кореляції має значення негативного значення, що означає, що обидва запаси мають негативну кореляцію. Тож ваш вибір підходить відповідно до ваших вимог.
Пояснення
Ми знаємо і обговорюємо, що коефіцієнт кореляції - це міра ступеня співвідношення двох змінних, але суть тут полягає в тому, що він може вимірювати лише співвідношення, яке є лінійним. Цей інструмент не є ефективним у фіксації нелінійних зв’язків. Також є кілька інших властивостей коефіцієнта кореляції:
- Коефіцієнт кореляції - це інструмент без одиниць. Це дуже корисна властивість, оскільки дозволяє порівнювати дані, які мають різні одиниці. Наприклад, ціни на акції залежать від різних параметрів, таких як інфляція, процентні ставки тощо. Тому ми можемо використовувати публічну інформацію для визначення співвідношення між ними.
- Як було сказано вище, його значення лежить між + 1 до -1. Тож +1 ідеально позитивно співвідноситься, а -1 ідеально негативно корелює.
Відповідність та використання формули коефіцієнта кореляції
Коефіцієнт кореляції допомагає нам краще зрозуміти набори даних та їх взаємозв'язок і має багато застосувань у галузі фінансів та економіки. Фінансові інститути, банки, компанії та навіть уряди використовують коефіцієнт кореляції для того, щоб відслідковувати історичні дані та отримувати змістовну інформацію та ефективно прогнозувати тенденції на ринку. Коефіцієнт кореляції є дуже потужним інструментом, але його не слід використовувати в силосі і застосовувати разом з іншими інструментами. Причина цього проста: ми не можемо просто покластися на дані, а дані іноді дають нам незрозумілу повну інформацію. Наприклад: Якщо ви зібрали інформацію і вам довелося знати, що існує позитивна кореляція між дощем та смертю собак. Це означає, що в рік, коли дощу було більше, загинула кількість собак. Хоча існує кореляція, яка взагалі не має сенсу. Це називається хибною кореляцією. Тому будьте дуже обережні, приймаючи рішення лише на основі даних.
Рекомендовані статті
Це було керівництвом щодо формули коефіцієнта кореляції. Тут ми обговорюємо, як обчислити коефіцієнт кореляції за формулою разом з практичними прикладами та шаблоном Excel, який можна завантажити. Ви також можете переглянути наступні статті, щоб дізнатися більше -
- Керівництво щодо коефіцієнта формули визначення
- Формула для обчислення відрегульованого R квадрата
- Як обчислити коваріацію за допомогою формули?
- Приклади кореляційної формули з шаблоном Excel