Ковариационный анализ
Основные идеи
Ковариационный анализ часто используется при "управлении" эффектами внешних переменных. Например, аналитик может использовать коэффициент IQ студентов в качестве ковариаты в плане при исследовании эффективности различных методов обучения.
В ANOVA Основные идеи кратко описана идея "контроля" за факторами и как включение дополнительных факторов может уменьшить ошибку SS и увеличить статистическую мощность (чувствительность) Вашего плана. Эту идею можно распостранить на напрерывные переменные, и когда такие непрерывные переменные включаются в план как факторы, то они называются ковариатами.
Предположим, что мы хотим сравнить математические способности студентов, которым произвольно выдали одну из двух книг. Предположим, что у нас есть данные по интелектуальному развитию (IQ) каждого студента. Мы будем ожидаем, что IQ связано со способностями в математике, и мы будем использовать эту информацию, чтобы сделать наш критерий чувствительнее. Дополнительно вообразим, что в каждой из двух групп мы можем вычислить коэффициент корреляции между IQ и математическими способностями. Помните, что после того, как мы вычислили коэффициент корреляции, можно оценить выличину дисперсии математических способностей, которая объясняется IQ, и величину (остаток) дисперсии, которая не объясняется IQ. Мы можем использовать эту остаточную дисперсию в ANOVA как оценку ошибки SS после управления IQ. Если корреляция между IQ и математическими способностями значима, то может быть достигнуто существенное уменьшение ошибки SS.
Эффект от ковариаты в F критерии. В F критерии, чтобы оценить статистическую значимость межгрупповых различий, вычислим отношение межгрупповой дисперсии (MSeffect) и дисперсии ошибки (MSerror). Если MSerror становится меньше, из-за объянительной мощности IQ, то итоговое F значение станет больше.
Несколько ковариат. Логику случая с одной ковариатой (IQ) можно лугко распостранить на случай с несколькими ковариатами. Например, дополнительно к IQ мы можем включить измерения мотивации и т.д. и вместо простой корреляции вычислим множественную корреляцию (см. Множественная регрессия).
Когда F значение становится меньше. При работе с ковариатами может случится, что значение F действительно становится меньше (менее значимое) после включения в план ковариат. Это обычно указывает на то, что ковариаты не только коррелируют с зависимой переменной (например, математические способности), но и с межгрупповыми факторами (например, двумя различными книгами). Например, представим, что мы измерили IQ в конце семестра, после того, как студенты из различных экспериментальных групп учились по соответствующим книгам почти год. Возможно, что даже если студенты выбрали произвольно одну из двух книг, и эти книги настолько различались, что и математические способности, и IQ стали сильно различаться в двух группах. В этом случае ковариата это не только часть дисперсии от дисперсии ошибки, но также это часть дисперсии, обусловленная межгрупповым фактором. Рассмотрим другой случай, после контроля за различиями в IQ, которые были вызваны двумя книгами, математические способности не имеют этих различий. И третий случай, путем "устранения" эффектов от IQ, мы нечаянно устранили эффект от книг, влияющий на математические способности студентов.
Скорректированные средние. Когда мы имеем дело с последним случаем, т.е., когда на ковариату воздействует межгрупповой фактор, то уместно вычислить так называемые скорректированные средние. Это средние, которые получаются после удаления всех различий, объясняемых ковариатой.
Взаимодействия между ковариатами и факторами. Теперь, так как мы можем проверить взаимодействия между факторами, мы можем также также проверить взаимодействия между ковариатами и межгрупповыми факторами. Представим, что одна из книг особенно подходит для умных студентов, в то время как другая надоедает этим студентам, но которая больше подходит для более слабых студентов. В результате мы можем обнаружить положительную корреляцию в первой группе (более сильные студенты, которые быстро усваивают материал), и нулевую или отрицательную корреляцию во второй группе (сильные студенты, но они хуже развили свои математические способности из этой книги). В некоторых старых учебниках по статистике это условие обсуждалось как случай, где предположения анализа ковариат были нарушены. Тем не менее, т.к. GLM использует очень обобщенный подход к анализу ковариат, то вы можете более точно оценить статистическую значимость взаимодействий между факторами и ковариатами.
Ковариационный анализ
В общем, планы ковариационного анализа - это межгрупповые планы, которые содержат категориальные и непрерывные предикторы. Однако обычно планами ковариационного анализа называют специальные планы, в которых рассматриваются эффекты первого порядка для одного или нескольких непрерывных предикторов, оценивая при этом эффекты для одного или нескольких категориальных предикторов.
Например, предположим, что аналитик хочет оценить влияние категориального предиктора A с 3 уровнями на итоговый результат. При этом доступны измерения непрерывного предиктора P. Если данные для этого Анализа имеют вид

то сигма-ограниченная матрица X для плана, содержащего отдельные эффекты первого порядка для P и A будет иметь вид

Коэффициенты
и
в регрессионном
уравнении
![]()
обозначают влияние членов групп на категориальный предиктор A в зависимости
от влияния значения на непрерывный предиктор P. Аналогично, коэффициент
представляет
влияние значений на P в зависимости от влияния членов групп на A.
Этот стандартный ковариационный анализ является более чувствительным критерием,
позволяющим определить уровень влияния A на то, как P уменьшает
предсказанную ошибку, которая выражается остатками для итоговой переменной.
Матрица X для этого же плана с использованием сверхпараметризации будет иметь вид

Интерпретация в этом случае не изменяется, за исключением того, что влияние
членов групп на категориальные предикторы A в регрессионном уравнении
представлено коэффициентами
,
и ![]()
![]()
![]()
(c) Copyright StatSoft, Inc., 1984-2003
STATISTICA является торговой маркой StatSoft, Inc.