Огляд двосторонньої ANOVA в R
Двосторонній ANOVA (Аналіз варіації) допомагає нам зрозуміти зв’язок між однією безперервною залежною змінною та двома категоричними незалежними змінними. У цій темі ми збираємося дізнатися про Двосторонній АНОВА в Р.
Нижче наведена гіпотеза інтересу за двостороннім ANOVA
- H₀: Назвіть це головним ефектом, який є першим фактором, який залежить від безперервної змінної
- H₀: Основний ефект також полягає у впливі на другу змінну на залежну безперервну змінну.
- H₀: Взаємодія - це комбінований ефект обох змінних першого, другого фактора на залежну змінну
Нижче наведені норми, яким повинна задовольнятися двостороння ANOVA.
- Спостереження повинні бути незалежними
- Спостереження слід нормально розподіляти.
- У спостереженнях має бути однакова дисперсія
- Відсутні дизайнери в дизайні
- Помилки повинні бути незалежними.
Примітка
Нам потрібно трансформувати наші дані, якщо порушується нормальність і однакова дисперсія.
Приклад двосторонньої ANOVA в R
Давайте виконаємо тест ANOVA на наборі даних про рівень раку, який містить 48 рядків і 3 змінних даних:
Взятий час: час виживання тварини
Різні рівні раку 1 - 3
Лікування: лікування, що застосовується від 1-3
Перш ніж тестувати, нам потрібні наступні дані.
- Імпорт даних
- Видаліть непотрібну змінну
- Перетворити змінні (рівні Раку) як упорядкований рівень.
Нижче набір даних.
Спостереження: 48
Змінні: 3
час виживання 0, 31, 0, 45, 0, 46, 0, 43, 0, 36, 0, 29, 0, 40, 0, 23, 0, 22, 0…
рівні раку 1, 1, 1, 1, 2, 2, 2, 3, 3, 3, 3, 1, 1, 1, 1, 2, 2, 2 …
Лікування A, A, A, A, A, A, A, A, A, A, A, B, B, B, B, B, B, …
Цілі
- H₀: немає зміни середнього часу виживання між групою
- H₀: час виживання відрізняється принаймні для однієї групи.
Кроки
- Перевірте рівень раку. Ми можемо бачити три значення символів, оскільки перетворюємо їх у фактори з мутаційним дієсловом.
levels(df$cancerlevels)
output: (1) "1" "2" "3"
- Обчисліть як середнє, так і стандартне відхилення
df % > %
group_by(cancerlevels) % > %
summarise(
count_ cancerlevels = n(),
mean_time = mean(time, na.rm = TRUE),
sd_time = sd(time, na.rm = TRUE)
)
Вихід:
Таблиця: 3 х 4
рівень раку count_cancerlevels mean_time sd_time
1 1 16 0, 617500 0, 20942779
2 2 16 0, 544375 0, 28936641
3 3 16 0, 276250 0, 06227627
- На етапі третьому можна графічно перевірити, чи є різниця між розподілами. Зауважте, що ви включаєте воркшированную крапку.
- Запустіть тест за допомогою команди AOV.
aov(formula, data)
Arguments:
- formula: The equation you want to estimate
- data: The dataset used
Синтаксис:
y ~ X1 + X2 +… + Xn (X1 + X2 +… відноситься до незалежних змінних)
у ~. Використовуйте всі інші змінні як незалежні змінні
Не забудьте зберегти модель та надрукувати резюме.
Код
- aov (час ~ рак, рівні = df): запустіть тест ANOVA за такою формулою
- Короткий огляд (anova_one_way): друкуйте резюме тесту
Df сума Sq середнє значення S F F Pr (> F)
Cancerlevels 2 1.033 0.5165 11.79 7.66e-05 ***
Залишків 45 1.972 0.0438
-
Сигнаф. коди: 0 '***' 0, 001 '**' 0, 01 '*' 0, 05 '.' 0, 1 '' 1
Значення р нижче порогового значення 0, 05. Статистична різниця вказується символом "*" у вищенаведеному випадку.
Односторонній тест на двосторонній Anova в R
Давайте подивимось, як односторонній тест можна поширити на двосторонню ANOVA. Тест схожий на однобічну ANOVA, але формула відрізняється і додає до формули ще одну змінну групи.
y = x1 + x2
- H0 : Засоби рівні для обох змінних (коефіцієнт змін)
- Н3 : Засоби різні для обох змінних
Ви додаєте змінні обробки в нашу модель. Ця змінна вказує на лікування, призначене пацієнту. Вам цікаво дізнатись, чи існує статистична залежність між рівнем раку та лікуванням пацієнта.
Ми коригуємо наш код, додаючи частування з іншою незалежною змінною.
Df сума Sq середнє значення S F F Pr (> F)
Рівень раку 2 1.0330 0.5165 20.64 5.7e-07 ***
Лікуйте 3 0, 9212 0, 3071 12, 27 6, 7e-06 ***
Залишки 42 1.0509 0.0250
І рівень раку, і лікування статистично відрізняються від 0. Цим ми можемо відкинути гіпотезу NULL. Також підтвердьте, що зміна лікування або типу раку впливає на час виживання.
Тест
Одностороння ANOVA: H3- середня величина принаймні для однієї групи
Двостороння ANOVA: H3- Середня величина для обох груп.
Різниця між одностороннім та двостороннім ANOVA
Відмінності між одностороннім ANOVA і двостороннім ANOVA
Одностороння ANOVA | Двостороння ANOVA |
Розроблений, щоб увімкнути тестування рівності між трьома або більше засобами | Призначений для оцінки взаємозв'язку двох незалежних змінних залежної змінної. |
Залучає одну незалежну змінну | Залучає дві незалежні змінні |
Проаналізовано в 3 і більше категоріальних групах. | Порівняє кілька груп з двох факторів |
Має задовольняти двом принципам - реплікації та рандомізації | Має задовольняти трьом принципам: реплікація, рандомізація та локальний контроль. |
Переваги двостороннього ANOVA
- У наведеному вище прикладі вік і стать у нашому прикладі - допомагає зменшити відхилення від помилок, роблячи дизайн більш ефективним.
- Двостороння ANOVA дозволяє нам перевірити дію двох факторів одночасно.
Застосування ANOVA
- Порівнюючи пробіг різних транспортних засобів, видів палива та доріг.
- Знайомство з впливом температури, тиску чи концентрації хімічних речовин на деякі хімічні реакції (енергетичні реактори, хімічні установки тощо)
- Вплив різних каталізаторів на швидкість хімічної реакції
- Розуміння впливу рекламних роликів та різної кількості відгуків клієнтів.
- Вплив продуктивності, якості та швидкості виготовлення в біології (процес заснований на кількості клітин, на які вони діляться)
Рекомендовані статті
Це посібник щодо Двосторонньої ANOVA в Р. Тут ми обговорюємо приклади, цілі, кроки та різницю між АНОВА та Двостороння. Ви також можете переглянути наступні статті, щоб дізнатися більше -
- АНОВА в Р
- Як інтерпретувати результати за допомогою тесту ANOVA
- Регресія проти ANOVA
- GLM в R