Однофакторный Дисперсионный Анализ
План с простым категориальным предиктором называется планом однофакторного ДА. Например, анализ 4 различных типов удобрений на различных заводах можно провести с помощью однофакторного ДА с четырьмя уровнями для фактора Fertilizer.
В общем, рассмотрим один категориальный предиктор A с 1 наблюдением в каждой из 3 категорий. При использовании сигма-ограниченного кодирования А по 2 переменным, матрица межгруппового плана X будет иметь вид:
Это означает, что наблюдениям в группах A1, A2 и A3 присваивается значение 1 для переменной X0 (свободный член), наблюдению в группе A1 присваивается значений 1 для переменной X1 и значение 0 для переменной X2, наблюдению в группе A2 присваивается значений 0 для переменной X1 и значение 1 для переменной X2, и наблюдению в группе A3 присваивается значение -1 для переменной X1 и значение -1 для переменной X2. Конечно, любые дополнительные наблюдения в любой из 3 групп будут закодированы аналогично. Если в группе A1 будет 1 наблюдений, в группе A2 - 2 наблюдения, и в группе A3 - 1 наблюдение, то матрица плана X будет иметь вид:
где первый нижний индекс A обозначает количество наблюдений в каждой группе. Для краткости, эти индексы обычно не отображаются при работе с матрицами планов ДА.
Отметим, что в однофакторных планах с равным количеством наблюдений в каждой группе сигма-ограниченное кодирование создает X1 ... Xk переменных, причем все из них имеют среднее значение равное 0.
При использовании сверхпараметризованной модели для представления A, матрица плана X примет вид:
Эти простые примеры показывают, что
матрица X нужна
для решения двух задач:
(1) для кодирования уровней исходных переменных в матрице X
,
(2) для выявления природы, числа и порядка переменных X, которые составляют
межгрупповой план.
Данный пример основывается на данных, представленных в работе Milliken и Johnson (1992, стр. 6). Данные взяты из эксперимента, проводимого с целью выяснить степень влияния шести различных типов производственных работ на уровень пульса рабочего. В данном эксперименте 78 мужчин были случайным образом распределены по 6 различным типам работ (13 рабочих были приписаны ко всем типам работ). В силу усталости некоторых рабочих, только 68 рабочих полностью завершили эксперимент. Был заранее определен день, на протяжении которого проводились измерения уровня пульса рабочих (число ударов за 20 секунд) после того, как рабочие выполняли свою работу в течение часа.
Milliken и Johnson (1992) провели однофакторный ДА и несколько запланированных сравнений эффектов Task - Тип работы на Pulse - Пульс.
Результаты. Ниже представлена таблица результатов однофакторного ДА всех эффектов переменной Task на Pulse.

Рисунок 1. Таблица всех эффектов.
Таблица ДА отображает общий значимый эффект Task, действующий на Pulse, p<.01.
Milliken и Johnson (1992) провели несколько спланированных сравнений эффектов (различных типов работ на Pulse). Они так же построили 90% доверительный интервал для сравнений среднего Task 1 на Pulse со средними Task 3 - Task 6 на Pulse.
Milliken и Johnson (1992) сделали спланированные сравнения
(1) Task 4 среднее на Pulse с Task 5 средними на
Pulse,
(2) Task 1 среднее на Pulse
с средним Task 2 через Task
4 средние на Pulse и
(3) Task 1 среднее на Pulse со средним Task 3 через
Task 6 средние на Pulse.
Приведенная ниже таблица Оценки контрастов содержит результаты критерия значимости и доверительный интервалы для каждого сравнения.

Рисунок 2. Таблица результатов спланированных сравнений.
Результаты показывают значимость только первого сравнения, p<.001. Значение 0.0 находится внутри 90% доверительного интервала для последних двух спланированных сравнений, что не противоречит соответствующим уровням значимости p>.10 для этих сравнений.
(c) Copyright StatSoft, Inc., 1984-2003
STATISTICA является торговой маркой StatSoft, Inc.