Проверка адекватности регрессионной модели: После вычисления коэффициентов для проверки пригодности модели,

Содержание
  1. Проверка адекватности регрессионной модели и значимости показателей тесноты корреляционной связи
  2. Проверка адекватности регрессионной модели
  3. Лекция 26 Проверка адекватности и работоспособности регрессионной модели Планы второго порядка Регрессионный анализ результатов вычислительного эксперимента на детерминированной теоретической модели Проверка адекватности и работоспособности
  4. Планы второго порядка
  5. Регрессионный анализ результатов вычислительного эксперимента на детерминированной теоретической модели
  6. БИБЛИОГРАФИЧЕСКИЙ СПИСОК
  7. Обработка результатов эксперимента, Метод наименьших квадратов, Регрессионный анализ, Проверка адекватности модели, Проверка значимости коэффициентов
  8. Метод наименьших квадратов
  9. Регрессионный анализ
  10. Проверка адекватности модели
  11. Проверка значимости коэффициентов
  12. Проверка адекватности регрессионной математической модели

Проверка адекватности регрессионной модели и значимости показателей тесноты корреляционной связи

Проверка адекватности регрессионной модели: После вычисления коэффициентов для проверки пригодности модели,

Информация, содержащаяся в эмпирических данных, извлекается с большей полнотой, чем полученная традиционными методами описательной статистики, и, что самое важное, может быть представлена с разных точек зрения. Тем самым перед исследователем открывается обширная область для теоретических выводов, формирования новых представлений и гипотез.

Особое внимание необходимо обратить на интерпретацию и оценку параметров уравнения. Параметры уравнения регрессии следует проверить на их значимость.

Для того чтобы получить оценку значимости коэффициентов регрессии при линейной зависимости у от х, и х2, используют t-кри- терий Стьюдента.

Значимость коэффициентов линейного уравнения регрессии а0 и ах оценивается с помощью -критерия Стьюдента (п< 30):

/-критерий Стьюдента при линейной однофакторной связи рассчитывают по формуле

где (/7 — 2) — число степеней свободы при заданном уровне значимости а и объеме выборки п.

Оценку значимости коэффициентов регрессии с помощью /-критерия Стьюдента используют для завершения отбора существенных факторов и в процессе многошагового регрессионного анализа при (п — т — 1) степенях свободы:

Значения а1 и а2 берутся по модулю. Параметры признаются значимыми, если /эмп > /табл с уровнем значимости 0,05 и числом степеней свободы (п-т- 1).

Уравнение признают окончательным и применяют в качестве модели изучаемого показателя для последующего анализа в том случае, если в данном уравнении все коэффициенты регрессии значимы.

Показатели множественной регрессии и корреляции могут оказаться подверженными действию случайных факторов, поэтому только после проверки адекватности уравнения оно может быть пригодно.

Прежде всего, следует установить, соответствуют ли полученные данные тем гипотетическим представлениям, которые сложились в результате анализа, и показывают ли они причинно-следственные связи, которые ожидались. Для оценки адекватности модели можно вычислить отклонение теоретических данных от эмпирических, остаточную дисперсию, а также ошибку аппроксимации, которая определяется по формуле:

1) для однофакторной регрессионной модели:

2) для многофакторной регрессионной модели:

Общая оценка адекватности уравнения может быть получена с помощью дисперсионного F-критерия Фишера, на основании которого проводят проверку значимости регрессии:

1) для однофакторной регрессионной модели:

где т — число параметров в уравнении регрессии; п — число единиц наблюдения;

2) для многофакторной регрессионной модели:

Распределение Фишера [Рональд Фишер (1890—1968) — английский ученый] — двухпараметрическое распределение неотрицательной случайной величины, являющейся в частном случае, при т= 1, квадратом случайной величины, распределенной по Стьюденту. Для распределения Фишера имеются таблицы критических значений, зависящих от чисел степеней свободы т и п- т — I, при различных уровнях значимости.

Считается, что влияние факторного признака статистически существенно, для принятого уровня значимости 0,05 или 0,01, если Fp (расчетное) >FT (табличное), то влияние факторного признака считается существенным и данное уравнение регрессии будет статистически значимым.

FT зависит от трех параметров:

  • 1) определяет достоверность выводов (называется уровнем значимости). Для социологических и экономических задач FT — 0,05 — определяет вероятность отвергнуть правильную гипотезу в 5 случаях из 100;
  • 2) определяется количеством значений факторного признака
  • (т-1);
  • 3) определяется объемом выборки, уменьшенным на количество значений факторного признака (п — т).

FT определяется по таблице критических значений критерия Фишера.

Вернемся к примеру 10.1.

Проведем оценку адекватности регрессионной модели:

выражающей зависимость между производительностью труда и выполнением плана реализации, с помощью F-критерия Фишера:

Эмпирическое значение Fбольше табличного, следовательно, уравнение регрессии можно признать адекватным.

Оценим значимость параметров уравнения регрессии с помощью /-критерия Стьюдента:

Табличное значение /-критерия с уровнем значимости 0,05 и числом степеней свободы (п — 2) равно 2,307. Так как /эмп > /табл, то параметры уравнения регрессии признаются значимыми.

Значимость коэффициента корреляции оценим с помощью /-критерия Стьюдента по формуле

Эмпирическое значение / больше табличного, следовательно, коэффициент корреляции можно признать значимым.

Вычислим ошибку аппроксимации по формуле

На основании данных расчетов можно сделать заключение, что построенная регрессионная модель зависимости производительности труда от выполнения плана реализации может быть использована для анализа и прогноза.

Итак, в общем виде многообразие видов регрессионных моделей порождается формой связи изучаемых признаков (линейной или нелинейной) и представлениями о распределении остатков (ошибки, шума) модели. Кроме того, модели более высокого уровня включают не одно, а систему регрессионных уравнений.

Поиск решений для множества моделей приводит исследователя к задаче преобразования этих моделей и получения форм с хорошо известными и реализуемыми алгоритмами оценивания, как, например, в описанном выше случае с нелинейными моделями.

Реформирование моделей производится при помощи трансформационных изменений переменных (отклика предикторов) или введением особых ограничений на признаковые или параметрические значения.

Благодаря своей разработанности и гибкости метод регрессионного анализа в настоящее время широко распространен в аналитической практике. Он становится также неотъемлемой частью или обычным логическим дополнением многих методов многомерной статистики в факторном, дискриминантном анализе, методе канонических корреляций, многомерном шкалировании, кластерном анализе и т. д.

Дальнейшее развитие теории регрессионного анализа, прежде всего, видится в разработке новых нелинейных форм, позволяющих с высокой степенью адекватности описывать реальные процессы, расклассификации многочисленных регрессионных моделей и методов их решения, ориентированной на конкретные группы исследовательских задач, определении перспектив использования регрессионного анализа в сочетании с другими методами статистического анализа.

Пример 10.3. По территории регионов имеются следующие данные:

№ регионаПрожиточный min в день одного трудоспособного, руб.Среднедневная заработная плата, руб.
178133
282148
387134
479154
589162
6106195
767139
888158
973152
1087162
1176159
12115173

Требуется:

  • 1) построить уравнение парной регрессии;
  • 2) рассчитать линейный коэффициент парной корреляции и среднюю ошибку аппроксимации;
  • 3) определить статическую значимость коэффициента корреляции.

Решение.

1. Для определения параметров уравнения линейной регрессии у(х) = а0 +ахх построим расчетную таблицу:

л:Ухух2(х-х)2O'-о2УхO', -ух)?%
17813310 374608457,8519,84149,0216,0212
28214812 136672412,9660,84152,584,583,2
38713411 65875691,96475,24157,0323,0317,2
47915412 166624143,563,24149,914,092,7
58916214 418792111,5638,44158,813,191,96
610619520 67011 236416,161536,64173,9421,0610,8
76713993134489345,96282,24139,230,230,17
88815813 90477445,764,84157,920,080,05
97315211 0965329158,7614,44144,577,434,9
108716214 09475691,9638,44157,034,973,07
117615912 084577692,1610,24147,2411,767,4
1211517319 89513 225864,36295,84181,958,955,2
Итого10271869161 80889 9072012,923280,28186968,6

x = итого х/2 х — 86,5; у = итого у/12 у — 155,8; ху ~ итого ху/12 ху = 13 484.

Зс2 = итого л/12 Зс2 = 7492,2.

Определим дисперсию х:

Определим среднеквадратичное отклонение: Определим дисперсию у:

Определим параметры уравнения регрессии:

Коэффициент регрессии а, = 0,89 показывает, что с увеличением среднедушевого прожиточного минимума на 1 руб. среднедневная заработная плата возрастает на 0,89 руб.

2. Определим тесноту связи с помощью линейного коэффициента парной корреляции:

13 484-58,6-155,8 147,52

г =-=-= 0,69 — связь прямая высокая.

12,95-16,5 213,68 ’ V

Шкала степени тесноты связи:

  • 0—0,3 — слабая;
  • 0,31—0,5 — умеренная;
  • 0,51—0,8 — высокая;
  • 0,81—1 — тесная.

Определим коэффициент детерминации:

Коэффициент детерминации показывает, что вариация результативного признака у на 48 % зависит от вариации факторного признака х.

Определим среднюю ошибку аппроксимации:

Данный показатель отражает, что изучаемая модель является качественной и пригодной для анализа.

3. Определим статистическую значимость коэффициента корреляции с помощью /-критерия Стьюдента.

Для этого сравним расчетные и табличные значения /-критерия.

При заданных степенях свободы /?7 = я- 2 = 12-2 = 10и уровне значимости а = 0,05 = 5%, /табл = 2,3.

Так как /раСч > табл.» то коэффициент корреляции признается статистически значимым и надежным, следовательно, подтверждается гипотеза о наличии связи между изучаемыми показателями х и у.

Источник: https://studref.com/591350/ekonomika/proverka_adekvatnosti_regressionnoy_modeli_znachimosti_pokazateley_tesnoty_korrelyatsionnoy_svyazi

Проверка адекватности регрессионной модели

Проверка адекватности регрессионной модели: После вычисления коэффициентов для проверки пригодности модели,

Использование регрессионных моделей для решения практических задач возможно лишь в случае, если они отражают существенные связи. Поэтому так важна проверка адекватности таких моделей, цель которой выяснить, не являются ли параметры полученного уравнения регрессии результатом действия случайных причин.

Значимость параметров парной линейной регрессии применительно к совокупностям объемом не больше 30 проверяют с помощью Г-критерия Стыодснта. Для достаточно больших совокупностей используют таблицу интеграла вероятностей нормального закона распределения.

Фактические (расчетные) значения Г-критерия для а{) и ал определяются по следующим формулам:

* /Х2

где п — объем совокупности; аост = . —— ——среднее квадратическое

V п

отклонение фактических значений результативного признака от его расIl(xi-xy fox? (xx,)2

четных значении; cY = A—— -или a.. = J-——- — среднее

V n ]j n n )

квадратическое отклонение фактических значений факторного признака от его среднего уровня.

Рассчитанные по формулам (9.3) значения t сравниваются с критическим значением t, определяемым но таблице Стыодента с учетом уровня значимости1 а и числом степеней свободы2 v.

В социально-экономических исследованиях а обычно пронимают равным 0,05. Параметр признается значимым, если ?расч > ?табл. В этом случае отклоняется гипотеза о том, что значения а0 и ах обусловлены только случайными причинами и связь между X и У не носит закономерного характера.

Пример 9.2

Рассмотрим продолжение примера 9.1. Проверим значимость параметров уравнения.

Расчетные величины, используемые при оценке адекватности регрессионной модели

НомеррабочегоY -Y 11 Л1Ъ-У{Y,~Y)2Y,-YO'-У)2
1234567
1-2,234,97-9,6392,74-7,454,76
2-2,234,97-9,4388,92-7,251,84
32,204,84-1,732,99-3,9315,44
41,682,82-1,432,04-3,119,67
50,360,13-1,732,99-2,094,37
61,662,76-0,430,18-2,094,37
7-0,370,14-1,432,04-1,061,12
80,010,00-0,030,00-0,040
91,612,591,773,130,160,03
10-0,410,170,370,400,780,61
И-0,110,010,870,760,980,96
12-0,630,401,371,882,004,00
130,150,022,777,672,626,86
140,240,063,2710,693,039,18
  • 1 Уровню значимости соответствует вероятность, с которой может быть опровергнута та или иная гипотеза. Уровню значимости 0,05 (5%) и 0,01 (1%) соответствуют вероятности 0,95 и 0,99.
  • 2 Число степеней свободы о = п — (k + 1), где к — число факторных признаков в уравнении.
НомеррабочегоY-Y 11 Л1(У-У)2у-У(У-У)2у-у(У-У)2
15-1,371,886,7745,838,1466,26
16-0,390,158,5773,448,9680,28
ИтогоX7139071202483

Для расчета оост используем данные графы 7, полученные как разность граф 3 и 7 из таблицы примера 9.1:

Расчет о Y выполним по данным в графах 2 и 4:

Расчетные значения f-критерия Стыодента:

Уровню значимости а = 0,05 при v = 14(16 — 2) соответствует критическое значение -критерия: f.rafu =2,145.

Таким образом, расчетные значения t„Q незначительно превосходят табличное значение критерия. Это означает, что оба параметра уравнения значимы и связь между заработной платой и выработкой рабочих в исследуемой совокупности не случайна.

Проверка адекватности регрессионной модели, как правило, дополняется определением тесноты корреляционной связи между результативным и факторным признаками.

Для решения этой задачи используется теоретическое корреляционное отношение:

где ст2 — общая дисперсия результативного признака, отображающая совокупное влияние всех факторов на вариацию результативного признака У, определяется по формуле

82 — факторная дисперсия результативного признака, отображающая вариацию результативного признака У только иод воздействием изучаемого фактора X, определяется по формуле

В результате формула (9.4) принимает вид

Теоретическое корреляционное отношение применяется для измерения тесноты связи между результативным и факторным признаками при линейной и криволинейной корреляционной зависимости. Значение его может находиться в пределах от нуля до единицы, т.е. О < Г| < 1. Чем ближе корреляционное отношение к единице, тем теснее связь между изучаемыми признаками.

Рассчитаем г| как меру тесноты связи между заработной платой и выработкой рабочих (см. пример выше). Для этого воспользуемся данными примера 9.2:

Качественная интерпретация теоретического корреляционного отношения осуществляется на основе шкалы Чеддока:

Л0,1-0,30,3-0,50,5-0,70,7-0,90,9-0,99
ХарактеристикасвязиСлабаяУмереннаяЗаметнаяВысокаяВесьмавысокая

Следовательно, изучаемые нами признаки: заработная плата и выработка рабочих — связаны достаточно тесно.

Квадрат теоретического корреляционного отношения г2 называется коэффициентом детерминации. В нашем примере он равен 0,927 и означает, что 92,7% вариации заработной платы рабочих обусловлено колеблемостью выработки продукции в натуральном выражении.

При линейной форме связи помимо теоретического корреляционного отношения для измерения тесноты связи может быть использован линейный коэффициент корреляции, предложенный английским математиком К. Пирсоном:

где п — число наблюдений;

При небольшом числе наблюдений (п

Источник: https://studme.org/211161/matematika_himiya_fizik/proverka_adekvatnosti_regressionnoy_modeli

Лекция 26 Проверка адекватности и работоспособности регрессионной модели Планы второго порядка Регрессионный анализ результатов вычислительного эксперимента на детерминированной теоретической модели Проверка адекватности и работоспособности

Проверка адекватности регрессионной модели: После вычисления коэффициентов для проверки пригодности модели,

По уравнению регрессии (6.75) можно вычислить предсказанные значения функции отклика всех точках спектра плана: . В результате будет получено N значений . Если регрессионная модель получена на основе ПФЭ и все коэффициенты регрессии признаны значимыми, то в формуле (6.75) .

Тогда значения должны совпадать со средними выборочными значениями , полученными в результате эксперимента для каждой точки спектра плана. Следовательно, поверхность отклика проходит через все точки , и полученная модель адекватна.

Значения в этом случае используют для проверки правильности вычислений коэффициентов регрессии.

Если же , то в общем случае , а величины их разностей несут информацию об ошибках предсказания по уравнению регрессии и их можно использовать для последующего анализа свойств полученной модели ее адекватности и работоспособности.

Для оценки рассеяния эмпирических значений относительно расчетных , полученных по уравнению регрессии, используют дисперсию адекватности

(6.76)

где n число параллельных опытов; N – число точек спектра плана;
количество значимых коэффициентов регрессии.

Если число параллельных опытов в различных точках спектра плана неодинаково, то для вычисления используют формулу

(6.77)

где число параллельных опытов в iй точке спектра плана.

Проверка адекватности регрессионной модели осуществляется путем сопоставления дисперсии адекватности и дисперсии воспроизводимости эксперимента . У адекватной модели значение обусловлено в основном действием случайной помехи, поэтому различие между и должно быть небольшим, так как они оценивают одну и ту же дисперсию помехи .

Проверку гипотезы об адекватности модели (гипотезы о равенстве дисперсий и ) выполняют по критерию Фишера (F-критерию)

(6.78)

В формулах (6.76) и (6.77) учтено, что чем больше число т параллельных опытов, тем с большей достоверностью оцениваются средние значения функции отклика у. Поэтому требования к различиям между экспериментальными и расчетными значениями становятся более жесткими, что отражается в увеличении F-критерия.

Полученные значения статистики F сравнивают с табличным значением критерия Фишера , определяемым в зависимости от уровня значимости q и чисел степеней свободы и , с которыми определялись дисперсии и :

(6.79)

(6.80)

Если , регрессионная модель считается адекватной.

Различие между дисперсиями и обусловлено систематической ошибкой при определении функции отклика поуравнению регрессии из-за его приближенности. Если модель описывает физические свойства исследуемого объекта неудовлетворительно, систематическая ошибка приводит к значительному возрастанию дисперсии адекватности и, следовательно, к увеличению статистики F.

При гипотеза адекватности модели отвергается. В таком случае нужно либо изменить структуру математической модели, либо уменьшить интервалы варьирования факторов и провести повторно эксперимент с моделью прежней структуры.

В первом варианте реализуется принцип постепенного усложнения структуры математической модели.

Если использовалось упрощенное уравнение регрессии первого порядка, учитывающее влияние на функцию отклика только факторов, или факторов и некоторого количества эффектов их взаимодействий низших порядков, что характерно для ДФЭ, то в модель можно дополнительно ввести новые члены, содержащие другие эффекты взаимодействия тех же порядков или более высоких порядков.

Однако во многих случаях такой путь оказывается неэффективным, так как, согласно выражению (6.76), при увеличении количества членов уравнения регрессии и неизменном числе точек спектра плана N дисперсия адекватности может возрасти, несмотря на снижение разности , поскольку при этом увеличивается и, следовательно, уменьшается знаменатель выражения (6.76).

Кроме того, следует иметь в виду, что с увеличением порядка эффекта взаимодействия возрастает вероятность незначимости коэффициента регрессии при этом эффекте. В этой связи наиболее целесообразно перейти к планированию второго порядка, используя регрессионное уравнение в виде полного квадратного полинома.

После обеспечения адекватности регрессионной модели осуществляют проверку ее работоспособности.

Адекватность регрессионной модели еще не гарантирует ее пригодность к практическому использованию в задачах прогнозирования и поиска оптимальных решений.

Модель может оказаться неработоспособной из-за низкой ее точности.

Для проверки работоспособности модели используют коэффициент детерминации, представляющий собой числовую интегральную характеристику точности уравнения регрессии. Его значение вычисляют по формуле

(6.81)

где среднее значение отклика:

(6.82)

Модель считается работоспособной при . В этом случае обеспечивается уменьшение ошибки предсказания, полученного по уравнению регрессии, по крайней мере, в 2 раза в сравнении с предсказанием по среднему значению отклика , без учета влияния факторов на функцию отклика у.

Планы второго порядка

Планы второго порядка предназначены для получения регрессионной модели в виде полного квадратного полинома полинома второй степени. Такой полином содержит основные эффекты, все парные взаимодействия и квадратичные эффекты

(6.83)

Число коэффициентов уравнения регрессии в этом случае

(6.84)

что в раз больше, чем в линейной модели вида (6.43).

Соответственно возрастает и минимально необходимое число точек в спектре плана. Для получения квадратичной модели варьирование факторов в эксперименте должно осуществляться, по крайней мере, на трех уровнях.

Существует большое множество различных планов второго порядка. Систематизированное их изложение дается в специальной литературе [9]. Рассмотрим кратко лишь композиционные планы типа , получившие широкое применение благодаря их экономичности и простой структуре.

Эти планы содержат ядро ПФЭ2k или ДФЭ2kp и включают 2k звездных точек, которые расположены на координатных осях на расстоянии от центра эксперимента.

Величина выбирается из условия минимизации обобщенной дисперсии оценок коэффициентов регрессии, что обеспечивает минимум объема эллипсоида рассеяния этих оценок. Следовательно, планы построены с учетом критерия Dоптимальности.

Величина для этих планов оказывается равной 1 для всех k факторов, а область планирования представляет собой гиперкуб. Центральной точки планы Bk не содержат.

Если ядром плана является ПФЭ2k, то число точек спектра плана типа Bk определяют по формуле

(6.85)

а если ядро составляет план ДФЭ2kp, то

(6.86)

В качестве примера в табл. 6.9 приведена матрица спектра плана типа Bk при k = 3, ядром которого является план ПФЭ23.

Таблица 6.9

ix1x2x3ix1x2x3
1-1-1-19-100
2+1-1-110+100
3-1+1-1110-10
4+1+1-1120+10
5-1-1+11300-1
6+1-1+11400+1
7-1+1+1
8+1+1+1

Из приведенной таблицы легко видеть процедуру построения плана. Первые восемь точек составляют ядро плана Bk, соответствуют спектру плана ПФЭ23, а остальные шесть – звездные точки. В этих точках варьируется только один какой-либо фактор , на нижнем или верхнем уровне, а остальные находятся в центре эксперимента и их нормированные значения равны нулю.

Оценки коэффициентов регрессии вычисляют по формулам:

(6.87)

(6.88)

(6.89)

(6.90)

В формулах (6.87) и (6.88) число точек ядра спектра плана: .

Если отдельные коэффициенты и окажутся незначимыми, то их можно исключить из уравнения регрессии без пересчета остальных коэффициентов.

Дисперсии оценок коэффициентов регрессии различны, так как план не обладает свойством ортогональности, а коэффициенты и коррелированны, поэтому в случае незначимости некоторых коэффициентов при исключении их из модели требуется уточнение оставшихся коэффициентов и .

Регрессионный анализ результатов вычислительного эксперимента на детерминированной теоретической модели

Детерминированная математическая модель характеризуется взаимно однозначным соответствием между внешним воздействием на моделируемую систему и ее реакцией на это воздействие. Поэтому в каждой точке спектра плана проводят только один опыт.

План активного вычислительного эксперимента составляется в зависимости от вида регрессионной модели так же, как и для вероятностных математических моделей.

При построении экспериментальных факторных моделей, предназначенных для решения задач оптимизации параметров технических объектов в процессе их функционального проектирования, используют планы первого и второго порядков.

Регрессионный анализ при экспериментах на детерминированных и вероятностных моделях включает одни и те же этапы: статистический анализ результатов эксперимента, получение оценок коэффициентов регрессии оценка адекватности экспериментальной факторной модели. Однако содержание первого и третьего этапов в обоих случаях различно.

На первом этапе осуществляется построение модели среднего и ее статистический анализ. При этом определяют среднее значение функции отклика и дисперсию модели среднего , характеризующую рассеяние результатов эксперимента относительно :

(6.91)

(6.92)

где значение функции отклика в i-й точке спектра плана;
N количество проведенных опытов, равное числу точек спектра плана.

Коэффициенты регрессии первого порядка определяются по
формулам (6.70) и (6.71), а регрессии второго порядка, полученной на основе плана типа , по формулам (6.87)(6.90).

После определения коэффициентов осуществляется проверка пригодности полученного уравнения регрессии.

Для этого вначале необходимо вычислить по уравнению регрессии предсказываемые значения функции отклика в каждой точке плана .

В уравнение регрессии при вычислениях подставляют значения нормированных факторов в соответствии с матрицей спектра плана. Затем определяется остаточная дисперсия

(6.93)

где число коэффициентов в уравнении регрессии.

При оценке пригодности полученного уравнения регрессии принимается иная нулевая гипотеза, чем при экспериментах на вероятностных моделях.

Здесь нулевая гипотеза гласит о том, что модель среднего достаточно хорошо описывает исследуемый процесс.

Качество предсказания, обеспечиваемого уравнением регрессии, оценивают по критерию Фишера F сравнивая остаточную дисперсию с дисперсией модели среднего :

(6.94)

Уравнение регрессии адекватно описывает результаты эксперимента, если полученное по формуле (6.

94) значение F больше табличного значения критерия Фишера , определяемого при принятом уровне значимости и числах степеней свободы и , с которыми определены дисперсии и . Согласно выражениям (6.92) и (6.93) .

Если условие выполняется, это означает, что уравнение регрессии описывает результаты эксперимента в раз лучше модели среднего. Тогда нулевая гипотеза отвергается.

При оценке значимости коэффициентов регрессии принимается нулевая гипотеза о том, что , и осуществляется проверка, отличаются ли статистически значимо оценки коэффициентов от нуля.

Значимость проверяют по критерию Стьюдента, используя формулу (6.73).

При вычислении дисперсии , оценивающей погрешности определения коэффициентов , используется остаточная дисперсия (а не дисперсия воспроизводимости эксперимента , как это было для вероятностной модели)

. (6.95)

При упрощении уравнения регрессии остаточная дисперсия может возрасти, что приводит к снижению критерия Фишера. Поэтому члены уравнения регрессии с незначимыми коэффициентами можно исключать лишь в том случае, если проверка полученной упрощенной модели на адекватность по критерию Фишера дает положительный результат.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

  1. Советов Б.Я. Моделирование систем : учеб. для вузов / Б.Я. Советов,
    С.А. Яковлев. 3-е изд., перераб. и доп. М. : Высш. шк., 2001. 343 с.

  2. Тарасик В.П. Математическое моделирование технических систем: учеб. для вузов / В.П. Тарасик. М.: Наука, 1997. 600 с.

  3. Введение в математическое моделирование: учеб. пособие для вузов / под ред. П.В.Тарасова. М.: Интермет Инжиниринг, 2000. 200 с.

  4. Советов Б.Я. Моделирование систем : учеб. для вузов / Б.Я. Советов,
    С.А. Яковлев. 2-е изд. М.: Высшая школа, 1998. 319 с.

  5. Шеннон Р. Имитационное моделирование систем – искусство и наука /
    Р. Шеннон. М.: Мир, 1978. 308 с.

  6. Максимей И.В. Имитация моделирования на ЭВМ / И.В. Максимей.
    М.: Радио и связь, 1988. 232 с.

  7. Литвинов В.В. Методы построения имитационных систем / В.В. Литвинов Т.П.Марьянович. Киев Наукова Думка 1991. 120 с.

  8. Шрайбер Т.Дж. Моделирование на GPSS / Т.Дж. Шрайбер.
    М.: Машиностроение, 1980. 592 с.

  9. Технология системного моделирования / Е.Ф. Аврамчук [и др.]. М. Машиностроение 1988. 520 с.

  10. Альянах И.Н. Моделирование вычислительных систем / И.Н. Альянах.
    Л. Машиностроение 1988. 233 с.

  11. Балакирев В.С. Оптимальное управление процессами химической технологии / В.С. Балакирев В.М. Володин А.М. Цирлин. М. Химия 1978. 384 с.

  12. Пакеты прикладных программ: Математическое моделирование / под ред. А.А. Самарского. М.: Наука, 1989. 128 с.

  13. Системное обеспечение пакетов прикладных программ / под ред.
    А.А. Самарского. М.: Наука, 1990. 208 с.

Источник: https://textarchive.ru/c-1897192.html

Обработка результатов эксперимента, Метод наименьших квадратов, Регрессионный анализ, Проверка адекватности модели, Проверка значимости коэффициентов

Проверка адекватности регрессионной модели: После вычисления коэффициентов для проверки пригодности модели,

Тщательное, скрупулезное выполнение эксперимента, несомненно, является главным условием успеха исследо­вания. Это общее правило, и планирование эксперимента не относится к исключениям.

Однако нам не безразлично, как обработать полученные данные. Мы хотим навлечь из них всю информацию и сде­лать соответствующие выводы. Как всегда, мы находимся между Сциллой и Харибдой.

С одной стороны, не извлечь из эксперимента все, что из него следует,– значит прене­бречь нелегким трудом экспериментатора.

С другой стороны, сделать утверждения, не следующие из эксперимента, – значит создавать иллюзии, заниматься самообманом.

Статистические методы обработки результатов позво­ляют нам не перейти разумной меры риска.

Метод наименьших квадратов

Нач­нем с простого случая: один фактор, линейная модель. Интересующая нас функция отклика (которую мы будем также называть уравнением регрессии) имеет вид

Это хорошо известное уравнение прямой линии. Наша цель – вычисление неизвестных коэффициентов bb1. Мы провели эксперимент, чтобы использовать при вычис­лениях его результаты. Как это сделать наилучшим обра­зом?

Если бы все экспериментальные точки лежали строго на прямой линии, то для каждой из них было бы справед­ливо равенство

,

где i= 1, 2, …, N– номер опыта. Тогда не было бы никакой проблемы. На практике это равенство нарушается и вместо него приходится писать

,

где  – разность между экспериментальным и вычис­ленным по уравнению регрессии значениями yв iэкспе­риментальной точке. Эту величину иногда невязкой.

Мы хотим найти такие коэффициенты регрессии, при которых невязки будут минимальны. Это требо­вание можно записать по-разному. В зависимости от этого мы будем получать разные оценки коэффициентов. Вот одна из возможных записей

,

которая приводит к методу наименьших квадратов.

Когда мы ставим эксперимент, то обычно стремимся провести больше (во всяком случае не меньше) опытов, чем число неизвестных коэффициентов. Поэтому система линейных уравнений

оказывается переопределенной и часто противоречивой (т. е. она может иметь бесконечно много решений или может не иметь решений). Переопределенность возникает, когда число уравнений больше числа неизвестных; противоре­чивость – когда некоторые из уравнений несовместимы друг с другом.

Только если все экспериментальные точки лежат па прямой, то система становится определенной и имеет единственное решение.

МНК обладает тем замечательным свойством, что он делает определенной любую, произвольную систему уравнений. Он делает число уравнений равным чис­лу неизвестных коэффициентов.

Для определения двух неизвестных коэф­фициентов требуется два уравнения. Давайте попробуем их получить.

Мини­мум некоторой функции, если он существует, достигается при одновременном равенстве нулю частных производных по всей неизвестным, т. е.

.

В явном виде это запишется как

,

.

Окончательные формулы для вычисления коэффи­циентов регрессии, которые удобно находить с помощью определителей, имеют вид

,

.

Величина  называется остаточной суммой квадратов ( – значение параметра оптимизации, вычисленное из уравнения регрессии). МНК гарантирует, что эта величина минимально возможная.

Обобщение на многофакторный случай не связано с какими-либо принципиальными трудностями.

Воспользуемся тем, что матрицы планирования ортогональны и нормированы, т.е.

       и         

Для любого числа факторов коэффициенты будут вычисляться по формуле

В этой формуле j = 0, 1, 2 …, k– номер фактора. Ноль записан для вычисления b0.

Так как каждый фактор (кроме x0)варьируется на двух уровнях +1 и –1, то вычисления сводятся к приписыванию столбцу yзнаков соответствующего фактору столбца и алгебраическому сложению полученных значений. Де­ление результата на число опытов в матрице планирова­ния дает искомый коэффициент.

Регрессионный анализ

До сих пор мы пользовались МНК как вычисли­тельным приемом. Нам нигде не приходилось вспоминать о статистике. Но, как только мы начинаем про­верять какие-либо гипотезы о пригодности модели или о значимости коэффициентов, приходится вспоминать о статистике. И с этого момента МНК превращается в рег­рессионный анализ.

А регрессионный анализ как всякий статистический метод, применим при определенных предположениях, постулатах.

Первый постулат. Параметр оптимизации y есть случайная величина с нормальным законом распределения. Дисперсия воспроизводимости – одна из харак­теристик этого закона распределения.

В данном случае, как и по отношению к любым другим постулатам, нас интересуют два вопроса: как проверить его выполнимость и к чему приводят его нарушения?

При наличии большого экспериментального материала (десятки параллельных опытов) гипотезу о нормальном рас­пределении можно проверить стандартными статистичес­кими тестами (например, – критерием). К сожалению, экспериментатор редко располагает такими данными, поэтому приходится принимать этот постулат на веру.

При нарушении нормальности мы лишаемся возмож­ности установления вероятностей, с которыми справедливы те или иные высказывания. В этом таится большая опас­ность. Мы рискуем загипнотизировать себя численными оценками и вероятностями, за которыми ничего не стоит. Вот почему надо очень внима­тельно относиться к возможным нарушениям предпосылок.

Второй постулат. Дисперсия y не зависит от абсо­лютной величины y. Выполнимость этого постулата проверяется с помощью критериев однородности дисперсий в разных точках фак­торного пространства. Нарушение этого постулата недо­пустимо.

Всегда существует та­кое преобразование y,которое делает дисперсии одно­родными. Увы, его не всегда легко найти. Довольно часто помогает логарифмическое преобразование, с которого обычно начинают поиски.

Третий постулат. Значения факторов суть неслу­чайные величины. Это несколько неожиданное утверждение практически означает, что установление каждого фактора на заданный уровень и его поддержание существенно точнее, чем сшибка воспроизводимости.

Нарушение этого постулата приводит к трудностям при реализации матрицы планирования. Поэтому оно обычно легко обнаруживается экспериментатором.

Существует еще четвертый постулат, налагающий ог­раничения на взаимосвязь между значениями факторов. У Нас он выполняется автоматически в силу ортогональ­ности матрицы планирования.

Проверка адекватности модели

Первый вопрос, который нас интересует после вычис­ления коэффициентов модели, это проверка ее пригод­ности. Мы будем называть такую проверку провер­кой адекватности модели.

Для характеристики среднего разброса относительно линии регрессии вполне подходит остаточная сумма квад­ратов.

Неудобство состоит в том, чтоона зависит от чис­ла коэффициентов в уравнении: введите столько коэф­фициентов, сколько вы провели независимых опытов, и получите остаточную сумму, равную нулю.

Поэтому предпочитают относить ее на один «свободный» опыт. Число таких опытов называется числом степеней свобо­ды f.

Числом степеней свободы в статистике называется разность между числом опытов и числом коэффициентов (констант), которые уже вычислены по результатам этих опытов независимо друг от друга.

Остаточная сумма квадратов, деленная на число сте­пеней свободы, называется остаточной диспер­сией, или дисперсией адекватности

.

В статистике разработан критерий, который очень удобен для проверки гипотезы об адекватности модели. Он называется F-критерием Фишера и определяется сле­дующей формулой:

.

 – это дисперсия воспроизводимости со своим числом степеней свободы.

Удобство использования критерия Фишера состоит в том, что проверку гипотезы можно свести к сравнению с табличным значением.

Если рассчитанное значение F-критерия не превы­шает табличного, то, с соответствующей доверительной вероятностью, модель можно считать адекватной. При превышении табличного значения эту приятную гипотезу приходится отвергать.

Этот способ расчета дисперсии адекватности, подходит, если опыты в матрице планирования не дублируются, а информация о дисперсии воспроизводимости извлекается из параллельных опытов в нулевой точке или из предварительных экспериментов.

Важны два случая: 1) опыты во всех точках плана дублируются одинаковое число раз (равномерное дублирование), 2) число параллельных опытов не одинаково (неравномерное дублирование).

В первом случае дисперсию адекватности нужно умножать на n, где n – число повторных опытов

 .

Такое видоизменение формулы вполне естественно. Чем больше число параллельных опытов, тем с большей достоверностью оцени­ваются средние значения. Поэтому требования к различиям между экспериментальными и расчетными значениями становятся более жесткими, что отражается в увеличении F-критерия.

Во втором случае, когда приходится иметь дело с неравномер­ным дублированием, положение усложняется. Даже когда экспе­риментатор задумал провести равное число параллельных опытов, часто не удается по тем или иным причинам все их реализовать. Кроме того, иногда приходится отбрасывать отдельные опыты как выпадающие наблюдения.

При неравномерном дублировании нарушается ортогональность матрицы планирования и, как следствие, изменяются расчетные фор­мулы для коэффициентов регрессии и их ошибок, а также для дис­персии адекватности.

Для дисперсии адекватности можно записать общую формулу

,

где N – число различных опытов (число строк матрицы);

ni – число параллельных опытов в i-й строке матрицы;

 – среднее арифметическое из ni параллельных опытов;

 – предсказанное по уравнению значение в этом опыте.

Смысл этой формулы очень прост: различию между эксперимен­тальным и расчетным значением придается тем больший вес, чем больше число повторных опытов.

Для b-коэффициентов нельзя записать универсальную рас­четную формулу. Все зависит от того, какой был план и как дубли­ровались опыты. Всякий раз приходится делать специальные рас­четы, пользуясь методом наименьших квадратов.

Проверка значимости коэффициентов

Проверка значимости каждого коэффициента прово­дится независимо.

Ее можно осуществлять двумя равноценными спосо­бами: проверкой по t-критерию Стьюдента или построе­нием доверительного интервала. При использовании пол­ного факторного эксперимента или регулярных дробных реплик доверительные интервалы для всех коэффициен­тов (в том числе и эффектов взаимодействия) равны друг другу.

Прежде всего, надо найти дисперсию коэф­фициента регрессии . Она определяется в нашем по формуле

Из формулы видно, что дисперсии всех коэффициентов равны друг другу, так как они зависят только от ошибки опыта и числа опытов.

Теперь легко построить доверительный интервал

Здесь t – табличное значение критерия Стьюдента при числе степеней свободы, с которыми определялась , и выбранном уровне значимости (обычно 0,05);  – квадратичная ошибка коэффициента регрессии.

Коэффициент значим, если его абсолютная величина больше доверительного интервала.

Источник: http://appmath.narod.ru/page9.html

Проверка адекватности регрессионной математической модели

Проверка адекватности регрессионной модели: После вычисления коэффициентов для проверки пригодности модели,

Использование регрессионной модели позволяет вычислять значения в любой области варьирования факторов. Для чего в уравнение регрессии надо подставить соответствующие значения варьируемых факторов.

Проверка адекватности модели необходима для того, чтобы убедиться в том, действительно ли, она правильно отражает поведение исследуемого объекта.

Если выходная величина, рассчитанная по модели, существенно не отличается от той, которая получена экспериментальным путем, можно считать, что модель является адекватной.

Пусть основных опытов экспериментального плана и число параллельных (дублированных) опытов в каждом ом основном опыте, число оцениваемых коэффициентов регрессии в математической модели.

Если число основных опытов больше числа коэффициентов регрессии , то такой план эксперимента называется не насыщенным и в этом случае можно проверить адекватность математической модели. В противном случае, проверить адекватность невозможно.

Последовательность действий при проверке математической модели.

1. Рассчитывают сумму квадратов разностей между измеренными и полученными в результате расчетов по уравнению регрессии ;

а) в случае равномерного дублирования опытов

(3.26)

б) в случае неравномерного дублирования опытов

(3.27)

в) при отсутствии дублирования опытов

(3.28)

· Вычисляют число степеней свободы дисперсии адекватности

(3.29)

2. Вычисляют дисперсию адекватности

(3.30)

3. По критерию Фишера проверяют однородность дисперсий адекватности и воспроизводимости

(3.31)

Полученное значение сравнивают с , выбранном при уровне значимости и числах степеней свободы и Если выполняется условие то модель можно считать адекватной исследуемому объекту.

Можно оценить эффективность модели (ее информационную ценность). Для этого необходимо сделать следующее.

· Вычислить дисперсию относительно среднего значения отклика

(3.32)

где среднее значение функции отклика по всем опытам.

· Рассчитывают остаточную дисперсию :

(3.33)

· Вычисляют величину

(3.34)

Величина показывает, во сколько раз уравнение регрессии точнее описывает результаты эксперимента по сравнению со средним значением . Модель считается эффективной, если раз.

Для экспериментов с дублированными опытами формулы для вычисления рассчитываются по следующим формулам:

(3.25)

где значение выходной величины в ом дублированном опыте го основного опыта; число основных опытов:

(3.36)

Пример обработки результатов полного факторного эксперимента с двумя факторами.

План полного факторного плана с двумя факторами представлен в таблице 3.4.

Таблице 3.4

Вычисляем средние значения факторов по сериям дублированных опытов:

Поместим данные в таблицу 3.5.

Таблица 3.5

Вычисляем коэффициенты регрессионной математической модели:

Регрессионная математическая модель будет иметь вид:

Вычисление предсказанных значений функции отклика для всех основных опытов:

Проверка однородности дисперсий

Вычисление расчетного коэффициента Кохрена :

Табличный коэффициент Кохрена

Поскольку ( табличное значение коэффициента Кохрена), то гипотеза об однородности дисперсий принимается.

Вычисляем дисперсию воспроизводимости :

Вычисляем дисперсии коэффициентов регрессии:

Проверяем значимость коэффициентов регрессионной математической модели:

Поскольку меньше все коэффициенты значимы.

Проверка адекватности математической модели осуществляется в следующей последовательности:

· Вычисляется :

· Число оцениваемых коэффициентов регрессии

· Число степеней свободы, связанных с дисперсией адекватности:

· Дисперсия адекватности :

· Вычисление расчетного коэффициента Фишера:

· Табличный коэффициент Фишера

Поскольку то математическая модель адекватна.

Проверка эффективности оценивают в следующей последователь-ности.

· Выборочное среднее по всем сериям опытов :

· Вычисление дисперсии относительно среднего значения отклика

· Вычисление остаточной дисперсии

· Вычисление отношения .

Регрессионная модель считается эффективной, если В данном случае это условие выполнено.

Графики функции представлены на рисунке 3.6.

а) б)

Из графика видно, что данная зависимость является плоскостью в трехмерном пространстве.

Из графиков, рисунок 3.6, хорошо видно, что с увеличением фактора выходная величина увеличивается (коэффициент ), с увеличением фактора уменьшается (коэффициент ).

Чтобы оценить влияние взаимодействия факторов на выходную величину , необходимо в таблицу 6 ввести еще один столбец, таблица 3.6.

Таблица 3.6

Тогда коэффициент рассчитывается по формуле:

.

Теперь модель будет иметь вид

Проверим значимость коэффициента :

Расчетный коэффициент больше табличного , поэтому его необходимо включить в математическую модель.

Коэффициент оказался значимым, поэтому план стал насыщенным, и проверить адекватность модели невозможно.

План эксперимента можно записать с буквенными обозначениями уровней факторов, таблица 3.7.

Таблица 3.7

Здесь комбинации факторов на различных уровнях:

(1) — все факторы на нижнем уровне;

a — первый фактор на верхнем уровне;

b — второй фактор на верхнем уровне;

ab — оба фактора на верхнем уровне.

Такая запись матрицы плана полного факторного эксперимента значительно сокращает ее запись, особенно в том случае, когда количество факторов достаточно велико. Например, матрица ПФЭ для 3-х факторов будет иметь вид, таблица 3.8.

Таблица 3.8

Как видно из таблицы 9, запись матрицы ПФП в буквенных обозначениях для трех факторов значительно меньше матрицы со значениями 1 и +1.

3.8. Дробный факторный эксперимент [1, 3, 5, 24, 26, 36]

Количество опытов в полном факторном плане быстро увеличивается при увеличении количества варьируемых факторов Например, при число основных опытов Если, например, количество дублированных опытов , число опытов станет равным Такое количество экспериментов естественно совершенно недопустимо, особенно на начальном этапе экспериментального исследования. Поэтому необходимо найти способ сокращения количества экспериментов. Решение этой задачи подсказывает тот факт, что многие взаимодействия факторов лишь незначительно, а и то вовсе не влияют на выходную величину. Поэтому некоторое взаимодействие факторов можно заменить новым фактором, например, . И тогда вместо плана полного факторного эксперимента с четырьмя факторами ( ) можно использовать матрицу плана с тремя факторами ( ). Это позволяет вместо основных опытов поставить эксперимент с опытами, то есть количество опытов сократится вдвое. Это будет, так называемый, дробный факторный план (ДФП). Матрица ДФП представлена в таблице 10.

Такой эксперимент называется дробным факторным экспериментом (ДФЭ). Этот план ДФЭ обозначается как . В плане ДФЭ столбец полностью повторяет столбец столбец столбец совпадает со столбцом и т. д. Отсюда следует, что оценки коэффициентов будут смешанными , то есть они являются совместными оценками двух эффектов:

(3.37)

Например, для ДФЭ можно составить следующие восемь генерирующих соотношений:

(3.38)

Таблица 3.9

Коэффициент регрессии со смешанными оценками могут удовлетворительно оценивать соответствующий истинный коэффициент, при условии, что второй эффект отсутствует, то есть его коэффициент незначимо отличается от нуля.

План дробного факторного эксперимента типа называется полурепликой от полного факторного эксперимента

Если в эксперимент включить еще один фактор, приравняв его к какому-нибудь взаимодействию факторов, например, получим четвертьреплики от ПФЭ или Система смешивания оценок будет иметь вид

(3.39)

При введении еще одного фактора, например, получим ДФП типа реплики ПФЭ и т. д.

В ДФЭ типа каждая из групп содержит смешанных эффектов взаимодействия факторов.

Генерирующим соотношением или генератором плана называется соотношение, в котором в левой части стоит новый фактор, а в правой – произведение некоторых взаимодействий факторов, то есть генерирующее соотношение показывает, какие взаимодействия заменены новыми факторами.

Возникает необходимость выбрать, такое из восьми взаимодействий лучше выбрать для построения ДФД .

Определяющим контрастом называется соотношение, определенное как символическое произведение столбцов плана, равное +1 или 1:

(3.40)

С помощью определяющего контраста можно легко получить систему смешивания эффектов взаимодействия факторов.

Пусть необходимо определить систему смешивания оценок для генерирующего соотношения с определяющим контрастом поскольку Для этого необходимо умножить правую часть определяющего контраста на

(3.41)

Из полученного соотношения получаем следующую систему смешивания оценок:

(3.42)

Таким образом, для рассматриваемых генераторов плана будем иметь следующие оценки:

(3.43)

В шести указанных планах все линейные эффекты смешаны только с парными взаимодействиями и могут быть оценены независимо, если парные взаимодействия равны нулю. Реплики, в которых линейные эффекты смешаны с парными взаимодействиями, называются планами с разрешающей способностью R=III (по количеству факторов в определяющем контракте).

Дробные реплики с одинаковым количеством опытов могут иметь различные разрешающие способности. Например, для плана эксперимента

можно построить восемь полуреплик с различными разрешающими способностями со следующими ОК:

(3.44)

Какую реплику следует выбрать из восьми возможных?

Если необходимо более точно определить линейные эффекты, при условии, что тройные и взаимодействия более высокого порядка незначимы, можно выбрать полуреплику с или то есть с генерирующими соотношениями или Количество факторов в ОК этой реплики

Если нужно, чтобы линейные эффекты оценивались независимо от парных взаимодействий, необходимо использовать полуреплики с определяющими контрастами или с количеством членов для генерирующих соотношений . Эти полуреплике записываются только четными комбинациями букв

(3.45)

только нечетными комбинациями букв

(3.46)

Полуреплики, в которых новые вводимые факторы приравнивают взаимодействиям наивысших порядков, обладают максимальной разрешающей способностью . Они называются главными полурепликами.

Для полуреплики определяющие контрасты будут главными, поскольку они имеют максимальное число факторов.

Если взять, например, полуреплику с ОК то система смешивания оценок будет В этой полуреплике основные эффекты связаны с парными взаимодействиями.

Для полуреплики с ОК система смешивания оценок будет В этой полуреплике основные эффекты связаны с тройными взаимодействиями. В общем случае будет меньше ( ), потому предпочтение отдается полуреплике с ОК . Это позволяет уменьшить ошибку в оценке линейных коэффициентов регрессии

Введя новый фактор , можно получить четверть-реплику . Пусть , тогда определяющими контрастами будут и

Чтобы полностью охарактеризовать разрешающую способность четверть реплики, вводится понятие обобщающего определяющего контраста (ООК). В нашем примере третий определяющий контраст получается перемножением двух исходных то есть а их ООК будет иметь вид:

(3.47)

Этот план имеет разрешающую способность поскольку два ОК содержат по три члена. Коэффициенты регрессии будут являться совместными оценками:

(3.48)

Основные эффекты, без парных взаимодействий, можно получить, добавив новую четверть-реплику с ООК в которой факторы заменены на обратные. Этот метод называется «методом перевала». В результате получаем из реплики с разрешающей способности реплику с разрешающей способностью

Реплики большой дробности

Процедура выбора реплики большой дробности совершенно аналогична, рассмотренной ранее. Пусть необходимо провести эксперимент по ДФП с числом факторов При этом надо выбрать 1/8-реплики . Замена факторов , например, осуществляется следующим образом:

(3.49)

В таблице 3.10 приведены зависимости количества основных опытов от дробности реплики.

Таблица 3.10

Для каждого из этих решений можно сделать шесть перестановок. В итоге мы получаем 24 возможности выбора 1/8 реплики.

Наименее удачным будет выбор номер один, поскольку в нем линейные эффекты смешиваются с парными взаимодействиями.

Если априори известно, что взаимодействие будет наиболее существенным, необходимо выбрать второе решение, если третье, если четвертое.

Пусть мы выбрали четвертое решение, полагая, что фактор является наиболее существенным. Приравняем тройному взаимодействию и запишем генерирующие соотношения в виде

(3.50)

При этом мы ограничимся парными и тройными взаимодействиями факторов.

Для 1/8 реплики с генерирующими соотношениями

(3.51)

и определяющими контрастами:

(3.52)

Если попарно перемножить эти определяющие контрасты, то получим:

(2.53)

Произведение трех определяющих контрастов будет равно

Чтобы полностью охарактеризовать разрешающую способность этой 1/8 реплики, найдем обобщающий определяющий контраст

(3.54)

Получается следующая система смешивания:

(3.55)

С ростом числа факторов дробность реплик увеличивается и усложняется система смешивания оценок. Предельное число факторов для восьми опытов – семь. В этом случае оцениваются восемь коэффициентов линейного уравнения

(3.56)

число степеней свободы равно нулю .

С ростом числа факторов от 8 до 15 необходимо ставить 16 опытов.

Предельное число факторов для 16 опытов – пятнадцать. План с максимальным числом факторов для данного числа опытов и заданной модели называется насыщенным. В этом случае число основных опытов

равно числу оцениваемых коэффициентов регрессии Поэтому адекватность такой модели проверить нельзя.

Пример. Пусть задана матрица плана ДФЭ для трех факторов (полуреплика от ПФП ), таблица 3.11.

Таблица 3.11

ДФЭ

Здесь – факторы в нормализованных значениях; -факторы в натуральных значениях; – значения выходной величины в дублированных опытах – средние значения выходной величины в основных опытах.

Вычисляются оценки коэффициентов регрессии:

Регрессионная математическая модель в данном случае будет иметь вид

Вычисление предсказанных значений функции отклика для всех основных опытов:

Проверка однородности дисперсий по сериям дублированных опытов:

Вычисление расчетного коэффициента Кохрена :

Табличный коэффициент Кохрена

Поскольку ( табличное значение коэффициента Кохрена), то гипотеза об однородности дисперсий принимается.

Вычисляем дисперсию воспроизводимости :

Вычисляем дисперсии коэффициентов регрессии:

Проверяем значимость коэффициентов регрессионной математической модели:

Поскольку меньше коэффициенты значимы. Коэффициент незначим. Графики зависимостей функции отклика от каждого из варьируемых факторов представлены на рисунке 23.

Поскольку план эксперимента насыщенный, проверить адекватность математической модели невозможно.

В рассматриваемом плане генерирующим соотношением будет , определяющий контраст Умножая последовательно определяющий контраст на , и , получим следующую систему смешивания оценок:

(3.57)

Разрешающая способность этой дробной реплики будет равна



Источник: https://infopedia.su/18x3267.html

Scicenter1
Добавить комментарий