Дисперсионный анализ в матема­тике

ДИСПЕРСИОННЫЙ АНАЛИЗ в математике, статистический метод, предназначенный для выявления влияния отдельных факторов на результат эксперимента, а также для последующего планирования экспериментов.

Если значения неизвестных постоянных а1,..., aI  могут  быть  измерены с помощью различных методов или измерительных средств М1,..., MJ и в каждом случае так называемая систематическая ошибка bij может, вообще говоря, зависеть как от выбранного метода Mj, так и от неизвестного измеряемого значения ai , то результаты таких измерений представляют собой суммы вида

xijk = ai + bij + yijk,

i = 1, ... , I,  j = 1, ... , J,  k = 1, ... , К,

где К - число независимых измерений неизвестной величины ai - методом Mj, а yijk - случайная ошибка k-го измерения величины ai методом Mj. При этом предполагается, что все yijk - независимые одинаково распределённые случайные величины, имеющие нулевое математическое ожидание. Такая линейная модель называется двухфакторной схемой дисперсионного анализа; первый фактор - истинное значение измеряемой величины, второй - метод измерения, причём в данном случае для каждой возможной комбинации значений первого и второго факторов осуществляется одинаковое число К независимых измерений (в более сложных моделях дисперсионного анализа от последнего предположения иногда отказываются).

Реклама

Например, пусть в соревнованиях участвуют I спортсменов, мастерство которых оценивается J судьями, причём каждый участник соревнований выступает К раз (имеет К попыток). В этом случае ai - истинное значение показателя мастерства спортсмена с номером i, bij - систематическая ошибка, вносимая в оценку мастерства i-го спортсмена судьёй с номером j, xijk - оценка, выставленная j-м судьёй i-му спортсмену за k-ю попытку, а yijk- случайная погрешность. Подобная схема типична для так называемой субъективной экспертизы качества нескольких объектов, осуществляемой группой экспертов. Другой пример - статистическое исследование урожайности сельскохозяйственной культуры в зависимости от одного из I сортов почвы и J методов её обработки, причём для каждого сорта почвы i и каждого метода обработки с номером j осуществляется К независимых экспериментов. В этом примере можно считать, что величины ai равны нулю, bij - истинное значение урожайности для i-го сорта почвы при j-м методе обработки, xijk - соответствующая экспериментально наблюдаемая урожайность в k-м опыте, а yijk - её случайная ошибка, возникающая из-за тех или иных случайных причин.

Пусть

Пусть, кроме  того,

Идея дисперсионного анализа  основана  на тождествах

i = 1, ... , I,  j = 1, ... , J.

В примере, связанном со спортивными соревнованиями, функция δij выражает отношение j-го судьи к i-му спортсмену (положительное значение δij означает подсуживание, т. е. систематическое завышение j-м судьёй оценки мастерства i-го спортсмена, а отрицательное значение δij - засуживание, т. е. систематическое снижение оценки). Равенство всех δij нулю - обычное требование, которое предъявляют к работе группы экспертов. В случае агрономических опытов такое равенство рассматривается как гипотеза, подлежащая проверке по результатам экспериментов. Если эта гипотеза верна, то выявление наилучших почвы и обработки может быть осуществлено раздельно, что приводит к существенному сокращению числа экспериментов.

В ситуации спортивных соревнований функция γj может трактоваться как систематическая ошибка, допускаемая j-м судьёй по отношению ко всем спортсменам, т. е. γj - характеристика строгости или либеральности j-го судьи. В реальных условиях γj могут иметь ненулевые значения, что  приходится  учитывать  при подведении итогов экспертизы. Сумма двух оставшихся функций α + βi зависит лишь от i и поэтому может быть использована для оценки мастерства i-го спортсмена. Однако следует учитывать, что величина α + βi ≠ ai оценивает не только мастерство i-го спортсмена, но в той или иной мере отношение экспертов к его мастерству.

Истинные значения функций α, βi, γj и δij неизвестны и выражаются в терминах неизвестных функций cij. Поэтому первый этап дисперсионного анализа заключается в отыскании статистических оценок для cij по результатам наблюдений xijk. Несмещённая и имеющая минимальную дисперсию оценка для cij выражается формулой

Несмещённые оценки

для функций  α, βi, γj, δij,  имеющие   минимальные дисперсии, получаются в результате замены аргументов cij соответствующими  оценками

На основе этих оценок строится второй этап дисперсионного анализа, посвящённый выявлению влияния первого и второго факторов на результаты эксперимента (в агрономических опытах первый фактор - сорт почвы, второй - метод обработки). Статистическими методами проверяется гипотеза отсутствия   взаимодействия  факторов, которая соответствует  равенству

а также гипотезы

и

Дальнейшие этапы дисперсионного анализа существенно зависят не только от реального содержания конкретной задачи, но также и от результатов статистической проверки гипотез на втором этапе. Например, в условиях  агрономических  опытов  справедливость гипотезы

позволяет  более экономично спланировать дальнейшие эксперименты  (если  помимо  гипотезы

справедлива также и гипотеза

то  это означает, что урожайность зависит лишь от сорта почвы).

Справедливость гипотезы

даёт основание для упорядочивания сравниваемых  объектов (например,  спортсменов) по значениям величин

Первоначально дисперсионный анализ был предложен Р. Фишером (1925) для обработки результатов агрономических опытов по выявлению условий, при которых испытываемый сорт сельскохозяйственной культуры даёт максимальный урожай. Современные приложения дисперсионного анализа охватывают широкий круг задач экономики, социологии, биологии и техники и трактуются обычно в терминах статистической теории выявления систематических различий между результатами измерений, выполненных при тех или иных меняющихся условиях. Смотри также Математическая  статистика.

Лит.: Хальд А. Математическая статистика с техническими приложениями. М., 1956; Снедекор Дж. У. Статистические методы в применении к исследованиям в сельском хозяйстве и биологии. М., 1961; Шеффе Г. Дисперсионный анализ. 2-е изд. М., 1980.

Л. Н. Большев.