Метод ирвина в excel

Метод ирвина в excel

Пример . Проверить ряд на наличие выбросов методом Ирвина, сгладить метод простой скользящей средней с интервалом сглаживания 3, методом экспоненциального сглаживания (α = 0,1), представить результаты сглаживания графически, определите для ряда трендовую модель в виде полинома первой степени (линейную модель), дайте точечный и интервальный прогноз на три шага вперед.

где хк – сомнительное значение, хк пред – предыдущее значение в вариационном ряду, s — выборочное среднеквадратическое отклонение (СКО), рассчитываемое по исследуемой выборке с учётом сомнительного значения; возможно также использование в расчётах генерального СКО, если оно известно с высокой точностью.

Полученное расчётное значение сравнивают с табличным Iтабл, которое зависит от объёма выборки n и принятого уровня значимости α. Если Iрасч > Iтабл, то сомнительное значение считают грубой ошибкой. Iтабл находят из соответствующих таблиц. Однако при автоматизированной обработке данных удобно рассчитывать Iтабл с приемлемой точностью по зависимостям, показанным (для случая использования выборочного СКО при k=1) в табл. 6.1, при изменении объёма выборки n в пределах от 3 до 1000.

Таблица 6.1.

α Iтабл
0,01 -205,06n -3 + 424,26n -2,5 — 352,483n -2 +143,747n -1,5 — 33,401n -1 +6,381n -0,5 + 1,049
0,05 -229,21n -3 + 422,39n -2,5 — 320,96n -2 +124,594n -1,5 — 26,15n -1 +4,799n -0,5 + 0,7029
0,1 -132,78n -3 + 224,24n -2,5 — 165,27n -2 +68,614n -1,5 — 16,109n -1 +3,693n -0,5 + 0,549

Пример 6.1. Результаты испытаний представлены в ряду: 32, 27, 28, 29, 30, 29, 37, 30, 31, 26. Оценить наличие промахов, исходя из предположения о нормальном распределении.

Возможный вариант расчёта примера 6.1 показан на рисунке 6.1.

Рис.6.1. Вариант расчёта для примера 6.1.

Вводим результаты испытаний и принятый уровень значимости, рассчитываем n и s (целесообразно задать при этом такие интервалы в статистических функциях СЧЁТ и СТАНДОТКЛОН, чтобы таблица правильно пересчитывалась при объёме испытаний до 1000). Затем рассчитываем максимальное и минимальное значения вариационного ряда, используя статистические функции МАКС и МИН, а также второе и предпоследнее значения используя функции НАИБОЛЬШИЙ и НАИМЕНЬШИЙ. Далее находим расчётное значение критерия Ирвина для наибольшего и наименьшего значений, предполагая их сомнительными. При этом модуль можно найти по функции ABS.

Вычисляем табличные значения критерия при различных уровнях значимости по формулам, приведенным в табл. 6.1. Для более быстрого ввода уравнений в электронную таблицу и уменьшения вероятности ошибок целесообразно скопировать уравнения в соответствующие ячейки листа MS Excel, а затем вставить вместо х ссылки на объём выборки, а также расставить необходимые знаки, в том числе знак = в начале уравнений.Табличное значение, соответствующее введённому в электронную таблицу уровню значимости, выносим в отдельную ячейку (на рис. 6.1 ячейка Е16). Для этого используем http://arhiuch.ru/st6.htmlлогическую функцию ЕСЛИ. В диалоговом окне этой функции вводим логическое выражение Е4=0,01. Если это выражение истинно, то надо использовать табличное значение при уровне значимости 0,01, поэтому в строке Значение_если_истина ссылаемся на ячейку, содержащую соответствующее значение. Если логическое выражение Е4=0,01 ложно, надо вывести табличное значение при уровне значимости 0,05. Для этого в строке Значение_если_ложь вводим функцию ЕСЛИ (для этого надо открыть список в левой верхней части электронной таблицы нажатием на чёрный треугольник, выбрать Другие функции… и затем ЕСЛИ). В открывшемся при этом новом диалоговом окне вводим логическое выражение Е4=0,05. В строку Значение_если_истина нового диалогового окна ссылаемся на ячейку, содержащую табличное значение при уровне значимости 0,05. В строке Значение_если_ложь второго диалогового окна вводим снова функцию ЕСЛИ, и в открывшемся третьем диалоговом окне вводим логическое выражение Е4=0,1. В строке Значение_если_истина ссылаемся на ячейку, содержащую табличное значение при уровне значимости 0,1. Если введённый в ячейку Е4 уровень значимости не равен одному из используемых, расчёт будет ошибочным. Поэтому в строке Значение_если_ложь вводим сообщение «ВВЕДИТЕ СТАНДАРТНЫЙ УРОВЕНЬ ЗНАЧИМОСТИ!».

Читайте также:  Как скрыть игры в одноклассниках

Задание.
1. Выполнить расчёты в соответствии с примером 6.1. Определить, какие значения являются грубыми погрешностями при различных уровнях значимости. Занести результаты в табл. 6.2.

Таблица 6.2.

α Минимальные значения Максимальные значения
Iрасч Iтабл Н/О Iрасч Iтабл Н/О
0,01 &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp
0,05 &nbsp &nbsp Н &nbsp &nbsp О
0,1 &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp

Примечание: О – грубая ошибка, Н – не ошибка
2. Определить, какие значения являются грубыми ошибками в результатах испытаний, представленных в табл. 6.3, если предполагается нормальное распределение.

Таблица 6.3.

Вариант Р Результаты испытаний
1 0,9 123 125 131 142 135 162 131 135 138 132 127
2 0,95 11 13 15 13 14 23 16 13 24 15
3 0,99 33 48 49 50 47 45 48 50 51 52 44
4 0,9 221 272 280 285 277 219 290 268 279 292
5 0,95 55 56 45 44 58 49 50 37
6 0,99 8 7 4 9 7 7 11 16 6 7 10
7 0,9 142 163 174 153 155 191 139 166 171
8 0,95 8 7 6 8 5 3 8 7 8 8 6
9 0,99 555 570 568 547 582 578 524 622 559 560
10 0,95 91 66 66 58 70 67 53 87

&nbsp &nbsp &nbsp &nbsp Далее &nbsp &nbsp Содержание

Кроме того, аномальные уровни во временных рядах могут возникать из-за воздействия факторов, имеющих объективный характер, но проявляющихся эпизодически или очень редко – ошибки второго рода, они устранению не подлежат.

Для выявления аномальных уровней временных рядов используются методы, рассчитанные для статистических совокупностей.

Метод Ирвина.

Метод Ирвина предполагает использование следующей формулы:

Читайте также:  Почему не могу зайти в облако

, (1)

где среднее квадратическое отклонение рассчитывается в свою очередь с использованием формул:

. (2)

Расчетные значения сравниваются с табличными значениями критерия Ирвина , и если оказываются больше табличных, то соответствующее значение уровня ряда считается аномальным. Значение критерия Ирвина для уровня значимости , т.е. с 5%-ной ошибкой, приведены в таблице 4.

Таблица 4.

2,8 2,3 1,5 1,3 1,2 1,1 1,0

После выявления аномальных уровней ряда обязательно определение причин их возникновения!

Если точно установлено, что аномалия вызвана ошибками первого рода, то соответствующие уровни ряда «поправляются» либо заменой простой средней арифметической соседних уровней ряда, либо значениями, полученными по кривой, аппроксимирующей данный временной ряд в целом.

Метод проверки разностей средних уровней.

Реализация этого метода состоит из четырех этапов.

1. Исходный временной ряд разбивается на две примерно равные по числу уровней части: в первой части первых уровней исходного ряда, во второй – остальных уровней .

2. для каждой из этих частей вычисляются среднее значение и дисперсии:

3. проверка равенства (однородности) дисперсий обеих частей ряда с помощью F-критерия Фишера, которая основана на сравнении расчетного значения этого критерия:

с табличным (критическим) значением критерия Фишера с заданным уровнем значимости (уровнем ошибки) . В качестве чаще всего берут значения 0,1 (10%-ная ошибка), 0,05 (5%-ная ошибка), 0,01 (1%-ная ошибка). Величина называется доверительной вероятностью. Если расчетное (эмпирическое) значение F меньше табличного , то гипотеза о равенстве дисперсий принимается и переходят к четвертому этапу. В противном случае, гипотеза о равенстве дисперсий отвергается и делается вывод, что данный метод для определения наличия тренда ответа не дает.

4. проверяется гипотеза об отсутствии тренда с использованием критерия Стьюдента. Для этого определяется расчетное значение критерия Стьюдента по формуле:

Читайте также:  Пропала сетка в автокаде

(3)

где среднее квадратическое отклонение разности средних:

.

Если расчетное значение меньше табличного значения статистики Стьюдента с заданным уровнем значимости , гипотеза принимается, то есть тренда нет, в противном случае тренд есть. Заметим, что в данном случае табличное значение берется для числа степеней свободы, равного , при этом данный метод применим только для рядов с монотонной тенденцией.

Метод Фостера-Стьюарта.

Этот метод обладает большими возможностями и дает более надежные результаты по сравнению с предыдущими. Кроме тренда самого ряда (тренда в среднем), он позволяет установить наличие тренда дисперсии временного ряда: если тренда дисперсии нет, то разброс уровней ряда постоянен; если дисперсия увеличивается, то ряд «раскачивается» и т.д.

Реализация метода также состоит из четырех этапов.

1. производится сравнение каждого уровня со всеми предыдущими, при этом определяются две числовые последовательности:

2. вычисляются величины:

Нетрудно видеть, что величина , характеризующая изменение временного ряда, принимает значения от 0 (все уровни ряда равны между собой) до (ряд монотонный). Величина характеризует изменение дисперсии уровней временного ряда и изменяется от (ряд монотонно убывает) до (ряд монотонно возрастает).

3. проверка гипотез: можно ли считать случайными

1. отклонение величины от величины математического ожидания величины для ряда, в котором уровни расположены случайным образом;

2. отклонение величины от нуля.

Эта проверка проводится с использованием расчетных (эмпирических) значений критерия Стьюдента для средней и для дисперсии:

где математическое ожидание величины , определенной для ряда, в котором уровни расположены случайным образом;

среднее квадратическое отклонение для величины ;

среднее квадратическое отклонение для величины .

Имеются табличные значения величин , и ; фрагмент этих значений представлен в таблице 5.

Таблица 5.

3,858 5,195 5,990 6,557
1,288 1,677 1,882 2,019
1,964 2,279 2,447 2,561

4. эмпирические значения и сравниваются с табличными значениями критерия Стьюдента с заданным уровнем значимости . Если эмпирическое значение меньше табличного, то гипотеза об отсутствии соответствующего тренда принимается; в противном случае тренд есть.

Ссылка на основную публикацию
Мегафон модем служба не запущена
Здесь легко и интересно общаться. Присоединяйся! Comodo Internet Security Premium 2014 бесплатное комплексное решение безопасности. Защищает от вирусов, интернет-атак и...
Куосера пишет неоригинальный картридж
Современные принтеры японской компании Kyocera, которые были разработаны после 2013 года оснащены специальным механизмом. Он определяет количество тонера в картридже...
Листы для морского боя распечатать
Игра “морской бой” остаётся популярной во все времени. Для того, чтобы играть в Морской бой необходимы две карточки, на которых...
Метод ирвина в excel
Пример . Проверить ряд на наличие выбросов методом Ирвина, сгладить метод простой скользящей средней с интервалом сглаживания 3, методом экспоненциального...
Adblock detector