Як попарне видалення обробляє відсутні дані?

Попарне видалення виникає, коли статистична процедура використовує випадки, які містять деякі відсутні дані. Процедура не може включати певну змінну, якщо вона має відсутнє значення, але вона все одно може використовувати цей регістр під час аналізу інших змінних з непропущеними значеннями. 16 квітня 2020 р.

Попарне видалення зменшує статистичну потужність і збільшує ризик зміщення подібним чином, щоб завершити аналіз справи.

Недоліком використання попарного видалення є те, що стандарт помилок, обчислений більшістю пакетів програмного забезпечення, використовує середній розмір вибірки для всіх аналізів. Це, як правило, створює стандартні помилки, які недооцінені або переоцінені.

У варіанті попарного видалення сайти, які містять відсутні дані або прогалини у вирівнюванні, видаляються з аналізу, якщо виникає потреба (наприклад, попарне обчислення відстані). Це на відміну від варіанту повного видалення, у якому всі такі сайти видаляються до аналізу.

Видалення даних. Маючи справу з відсутніми даними, дослідники обробки даних можуть використовувати два основні методи вирішення помилки: імпутація або видалення даних. Метод імпутації замінює відсутні дані обґрунтованими припущеннями. Це найбільш корисно, коли відсоток відсутніх даних низький.

Попарне видалення виникає, коли статистична процедура використовує випадки, які містять деякі відсутні дані. Процедура не може включати певну змінну, якщо вона має пропущене значення, але вона все одно може використовувати цей випадок під час аналізу інших змінних з непропущеними значеннями.

Оцініть статтю