Повторные измерения Дисперсионного Анализа

Довольно часто аналитики используют одни и те же тесты для нескольких субъектов повторно через определенный период времени. Необходимость подобного исследования возникает обычно при выявлении различий у одного субъекта. Подобные планы называются планами с повторными измерениями.

Представьте, что необходимо исследовать увеличение знаний по алгебре у студентов после двух месяцев обучения. В конце первого месяца обучения студентам предлагается контрольная работа (первый уровень фактора с повторными измерениями), а в конце второго месяца студенты выполняют аналогичный тест (второй уровень фактора с повторными измерениями). Таким образом, фактор с повторными измерениями (Time) имеет 2 уровня.

Предположим, что баллы, полученные за эти два теста (то есть значения переменных Y1 и Y2 на уровнях Time 1 и Time 2, соответственно) преобразуются в значения новой составной переменной с использованием линейного преобразования

T = YM

где M - ортонормальная матрица контрастов. Например, если

то разница между средним значением T1 и 0 говорит об увеличении полученных баллов по 2 уровням переменной Time.

Пример: План Дисперсионного Анализа с повторными измерениями.

Обзор. Этот пример иллюстрирует задание плана с повторными измерениями, содержащего более одного фактора, и использование анализа контрастов в интерпретации эффектов взаимодействия. Вопрос о сферичности будет рассмотрен, когда альтернативный многомерный критерий взаимодействия статистически не значим, в то время, как обычный одномерный критерий оказывается значимым. Результаты Greenhouse-Geisser и Huynh-Feldt корректировок будут сравниваться с многомерным критерием. В конце концов будут найдены природа и причины нарушения предположения о сферичности.

Задача исследования

Обзор. Этот пример основан на (вымышленных) данных, взятых в Winer (1962, стр. 324). Предположим, вы хотите узнать, насколько отличается воздействие на человека шума в виде посторонней информации ("осмысленного шума") от воздействия белого шума.

Например, операторы сложного промышленного оборудования (к примеру, на атомной электростанции) должны непрерывно наблюдать за показаниями различных датчиков и задавать необходимые параметры. Необходимо изучить влияние белого шума (который можно представить, как шум приемника, настроенного на частоту между двумя радиостанциями) и "осмысленного шума" (если приемник настроен на частоту станции) на эффективность выполнения человеком такой работы.

Можно провести эксперимент, в котором человеку нужно настроить параметры одного из трех различных приборов, в то время, как соответствующий датчик показывает значимое отклонение от спецификации. Несколько человек выполняют эту задачу в условиях белого шума, остальные - в условиях "осмысленного шума" (например, передача по радио). Измеряется число ошибок (когда человек не смог задать правильные параметры за короткий промежуток времени), допущенных в течение трех последовательных 10-ти минутных интервалов.

Итоги плана. Итоговый план - 2 (тип шума) x 3 (временные периоды по 10 минут каждый) x 3 (приборы; три прибора) анализ дисперсии. Последние два фактора - это факторы с повторными измерениями, так как они представляют повторные измерения для одного человека; первый фактор является межгрупповым, так как шумовые условия для работы испытуемого человека определяются произвольным образом.

Создание таблицы исходных данных. Для создания таблицы исходных данных анализа с повторными измерениями, нужно задать межгрупповой фактор (тип шума), т.е. переменную, содержащую коды, которые однозначно определяют, в каких шумовых условиях работал каждый человек. Затем каждое повторное измерение помещается в различные переменные.

В нашей таблице данных определено 6 испытуемых (по 3 в каждой группе), а переменные упорядочены так, что для каждого последовательного периода времени, измерения для каждого прибора находятся рядом друг с другом.

Рисунок 1. Таблица исходных данных.

В данном примере два фактора с повторными измерениями: (1) три последовательных 10-ти минутных временных периода и (2) три прибора.

Если посмотреть на файл данных, то самый медленно меняющийся индекс в списке переменных задает уровни фактора Time. Разъясним термин "индекс," Если в таблице данных двигаться от переменной Tim1_Dl1 и говорить про себя "раз два три раз два три раз два три," то каждый "раз" относится к переменной, содержащей данные для первой шкалы (Dl1), каждый "второй" - для второй шкалы (Dl2), и каждый "третий" - для третьей шкалы (Dl3). Таким образом, самое быстрое изменение индекса у фактора Dial.

Результаты.

Рисунок 1. Таблица всех эффектов.

В таблице присутствуют три значимых эффекта (помеченные символом * по p-уровню) нашего анализа: главный эффект для Time, взаимодействие Time*Noise, главный эффект для Dials. Теперь посмотрим на значимое взаимодействие.

Рисунок 2. Таблица маргинальных средних для взаимодействия Time*Noise.

Наиболее легким способом интерпретации взаимодействий является построение их на графике.

Рисунок 3. График маргинальных средних.

Кажется, что при обоих условиях шума, производительность операторов улучшилась, т.е., они сделали меньше ошибок в следующем 10-минутном испытании. Однако две линии, обозначающие два условия шума, отклоняются, начиная с периода 2 (level_2). Кажется, что операторы сделали меньше ошибок в условиях белого шума, чем в условиях осмысленного шума в Times 2 и 3, но не в Time 1.

Главный эффект. Аналогичным способом можно построить на графике главный эффект для фактора Dials. Этот эффект просто показывает, что по какой-то причине, люди сделали больше ошибок на третьем измерительном устройстве, чем на втором, и еще больше ошибок на втором приборе, чем на первом. Этот эффект отражает различия между различными измерительными инструментами, используемых в эксперименте, но не представляет никакого теоретического интереса. Следовательно перейдем к эффекту взаимодействия.

Изучение взаимодействия: Анализ контрастов. Исследуем взаимодействие с помощью Анализа контрастов. Контрасты задаются в терминах положительных и отрицательных целых чисел, которые в некоторой степени сохраняются как веса. В анализе будут сравниваться ячейки, в которых храняться числа разных знаков.

Рисунок 4. Таблица Одномерный критерий значимости для сплан. сравнения.

Очевидно, что различия (белый и осмысленный шум) в Time 2 не являются статистически значимыми. Можно также попробовать сравнить эти две группы в Time 3. Это сравнение также не будет значимым.

Как уже было показано, нельзя сказать, что шум приводит к значимым различиям ошибок в Time 2 или 3. Тем не менее общее взаимодействие статистически значимо, и если вернуться к графику взаимодействий, то это будет выглядеть так, что в основном изменение разности от Time 1 к Time 2 отвечает за это взаимодействие. Проверим значимость взаимодействия между Noise и Time (не учитывая третий уровень Time, т.е. Time 3).

Рисунок 5. Таблица Одномерный критерий значимости для сплан. сравнения.

Этот контраст статистически значим. Хотя значимое взаимодействие между Noise и Time можно пронаблюдать через изменение разности числа ошибок от Time 1 к Time 2 в условии белого шума, этот контраст сравнивался с условием осмысленного шума. В первом измерении производительность увеличилась больше, чем в последующих.

Многомерный метод. В некоторых научных дисциплинах многомерный метод анализа повторных измерений с тремя уровнями и больше быстро завоевал популярность, как единственно приемлемого способа анализа таких планов, потому что многомерный подход не придерживается предположения сферичности и сложной структуры.

Одномерный критерий значимости повторных измерений считает, что изменения по уровням не коррелируют с изменениями по операторам. В большинстве случаев используется это предположение. В нашем примере совершенно ясно, что операторы, которые намного уменьшили число ошибок от Time 1 к Time 2, достигли предела их точности, чем от Time 2 к Time 3. Представленное предположение о сферичности для одномерного критерия было нарушено, если взлянуть на многомерные статистики.

Многомерные критерии эффекта взаимодействия. Теперь обратимся к результатам многомерных критериев.

Рисунок 6. Таблица результатов многомерных критериев.

Критерии Лямбда Уилкса, Пиллая, Хотеллинга и Роя показывают, что взаимодействие не значимо на уровне .05! Следовательно мы имеем дело со случаем нарушения предположения о сферичности, что приводит к ошибочному рассмотрению эффекта взаимодействия, как статистически значимого.

Скорректированные одномерные критерии. Перед тем, как многомерный метод стал популярен, некоторые исследователи предложили корректировки для одномерного F для учета нарушений, например корректировки Greenhouse-Geisser (Greenhouse and Geisser, 1958, 1959) и Huynh-Feldt (Huynh and Feldt, 1976).

Обратите внимание на то, что корректировки представляют аппроксимации, и лучше использовать многомерный метод вместо любых других. Тем не менее, в некоторых научных дисциплинах эти корректировки по прежнему используются.

Рисунок 7. Таблица скорректированных одномерных критериев для повторного измерения.

В этой Таблице представлены скорректированные одномерные критерии. Как вы видите, корректировка Greenhouse-Geisser делает "хорошую" защиту от ошибочного принятия взаимодействия как статистически значимого на уровне .05. Фактически p-уровень для этого критерия (.057) очень похож на уровень значимости многомерного критерия (p = .062). Корректировка Huynh-Feldt в этом плане практически не помогает.

Итог. Сделаем выводы из анализа этого примера. Взаимодействие между Noise и Time появляется между Time 1 и Time 2 (первый и второй 10-минутные интервалы), операторы в условиях белого шума делают меньше ошибок, чем операторы, которые находятся в условиях осмысленного шума. Однако различия в числе ошибок (между группами) не являются статистически значимыми в любой момент времени. Дальнейший анализ обнаружил серьезные нарушения предположения о сферичности, подвергнув серьезным сомнениям первоначальные выводы. Многомерный критерий взаимодействия между Noise и Time также, как и скорректированный одномерный критерий Greenhouse-Geisser, не смог достичь статистической значимости на уровне .05. На этом примере были показаны преимущества использования многомерного метода анализа повторных измерений с тремя и более уровнями (на повторных измерениях).




(c) Copyright StatSoft, Inc., 1984-2003
STATISTICA является торговой маркой StatSoft, Inc.