При относительном скольжении деталей пар трения происходит повреждение контактирующих поверхностей. Этот вид повреждения поверхностных объемов детали называют износом. Потеря всего одной тысячной массы машины в результате изнашивания приводит к полной утрате работоспособности. Каждые три года...
(Механика. Основы расчёта и проектирования деталей машин)
  • КРИТЕРИИ УСТОЙЧИВОСТИ СИСТЕМ И МЕТОДЫ ОПРЕДЕЛЕНИЯ КРИТИЧЕСКИХ НАГРУЗОК
    Известны три основных критерия устойчивости сооружений: динамический, статический и энергетический, которые определяют и методику расчета сооружений на устойчивость. 1. Динамический (по Ляпунову) критерий основан на исследовании решений уравнений динамического движения отклоненной от начального...
    (Строительная механика плоских стержневых систем)
  • КРИТЕРИИ ВЫБОРА КАНАЛОВ РАСПРОСТРАНЕНИЯ РЕКЛАМЫ
    Среди всех решений, которые принимаются в процессе планирования, наиболее важным является выбор конкретных медианосителей внутри каждого медиа. Как правило, медиапланеры стремятся выбирать те носители, которые позволяют добиться следующих целей: 1) добиться заданной частоты предъявления рекламного сообщения...
    (Психология массовых коммуникаций)
  • Корреляционно-регрессионный анализ
    Корреляция и регрессия относятся к методам выявления статистической зависимости между исследуемыми переменными. “На основе анализа эмпирических данных, собранных в ходе проведения исследования, описывается не только сам факт существования статистической зависимости, но и математическая формула функции...
    (Маркетинговые исследования)
  • КОРРЕЛЯЦИОННО-РЕГРЕССИОННЫЙ МЕТОД ИССЛЕДОВАНИЯ
    Одним из методов моделирования экономических процессов является корреляционно-регрессионный метод исследования. Моделирование представляет собой процесс выражения сложных взаимосвязанных экономических явлений средствами математических формул и символов. Сочетание качественного анализа с применением математических...
    (Общая и прикладная статистика)
  • КОРРЕЛЯЦИОННО-РЕГРЕССИОННЫЙ АНАЛИЗ
    Статистическое исследование экономических и технологических процессов в настоящее время является одним из важнейших инструментов при разработке систем управления процессами. Знание связей между параметрами позволяет выделить ключевые факторы, влияющие на качество готовой продукции или на исследуемые...
    (Математика и экономико-математические модели)
  • Метод Ирвина используется для выявления аномальных значений уровней временного ряда. Под аномальным уровнем понимается отдельное значение уровней временного ряда, которое не отвечает потенциальным возможностям исследуемой экономической системы и которое, оставаясь в качестве уровня ряда, оказывает существенное влияние на значение основных характеристик временного ряда.

    Причинами аномальных явлений могут быть ошибки технического порядка, или ошибки первого рода, они подлежат выявлению и устранению.

    Кроме того, аномальные уровни во временных рядах могут возникать из-за воздействия факторов, имеющих объективный характер, но проявляющихся эпизодически. Их относят к ошибкам второго рода, которые не подлежат устранению.

    Для выявления аномальных наблюдений может быть использован метод Ирвина. В этом случае вычисляется коэффициент λ t , равный:

    ,
    ,
    .

    Расчетные значения λ 2 , λ 3 ,... сравниваются с табличными значениями критерия Ирвина λ α . Если оказывается, что расчетное значение λ t больше табличного λ α , то соответствующее значение y t уровня ряда считается аномальным.

    После выявления аномальных значений уровней ряда обязательно определение причин их возникновения. Если точно установлено, что они вызваны ошибками первого рода, то они устраняются обычно заменой средней арифметической двух соседних уровней ряда, либо заменой значением соответствующей трендовой кривой.

    При проверке наличия аномальных колебаний с использованием метода Ирвина, получили следующие расчетные значения коэффициента λ t:

    Таблица №13

    Сравнивая найденные значения коэффициента λ t с табличным значением λ α , равным 1,3 для уровня значимости α = 0,05 и при n = 20 (число уровней временного ряда), получаем, что отдельные значения уровней ряда превосходят значение λ α , следовательно делаем вывод о том, что в данной модели присутствуют аномальные колебания, вызванные ошибками второго рода, которые устранению не подлежат.

    Глава 8. Определение оптимального вида линии тренда. Прогноз показателей

    Под трендом понимается изменение, определяющее общее направление развития, основную тенденцию временного ряда.

    Для выбора линии тренда, наилучшим образом отражающей общее направление процесса развития ставки рефинансирования Центрального Банка, уровня безработицы и инфляции, необходимо построить несколько линий тренда и выбрать ту из них, которая лучше отражает динамику развития того или иного процесса.

    Для построения линий тренда необходимо использовать возможности ТР Excel, применив команду "Диаграмма" - "Добавить линию тренда". В диалоговом окне "Линия тренда" на вкладке "Тип" необходимо выбрать требуемый тип линии тренда и указать степень полинома. На вкладке "Параметры" необходимо установить переключатель "Показывать уравнение на диаграмме", "Поместить на диаграмму величину достоверности аппроксимации".

    После построения линий тренда, следует выбрать ту, которая наилучшим образом отражает динамику изменения того или иного процесса во времени.

    Затем следует сделать прогноз значений на 3 периода вперед, используя выбранный тренд. Тренд, по которому необходимо сделать прогноз выбирается исходя из величины достоверности аппроксимации.

    Для того чтобы сделать прогноз также необходимо воспользоваться возможностями ТР Excel. В данном случае необходимо в диалоговом окне "Линия тренда" на вкладке "Параметры" указать, на сколько периодов вперед необходимо сделать прогноз.

    Данный прогноз позволяет определить, как через определенный промежуток времени изменится изучаемый показатель при неизменности остальных показателей.

    После построения линии тренда для показателя ставки рефинансирования Центрального Банка, в качестве оптимальной линии тренда была выбрана линия тренда 2, которой соответствует уравнение:

    Y = -0.0089х 3 +0ю3152х 2 -3.5642х+37.014; R 2 = 0.8048

    Для показателя уровня безработицы в качестве оптимальной линии тренда была выбрана линия тренда 1, которой соответствует уравнение:

    Y = -6E-06x 4 +0.0003x 3 -0.0038x 2 +0.0187x+0.0291; R 2 = 0.8771

    Для показателя уровня инфляции в качестве оптимальной линии тренда была выбрана линия тренда 2, которой соответствует уравнение:

    Y = -0.0064x 3 +0.2186x 2 -2.3701x+14.603; R 2 = 0.7703

    Прогнозы, сделанные по выбранным линиям тренда дают наиболее точную характеристику повеления показателей в будущем.

    z 1 прогнозное

    z 2 прогнозное

    y прогнозное

    t прогнозное

    Подставляя полученные прогнозные значения в ранее рассчитанное уравнение регрессии,

    получаем у = 13,12990776.

    Используется для оценки сомнительных значений выборки на грубые ошибки. Порядок его применения следующий.

    Находят расчётное значение критерия λ расч = (|х к - х к пред |)/σ ,

    где х к – сомнительное значение, х к пред – предыдущее значение в вариационном ряду, если х к оценивается от максимальных значений вариационного ряда, или последующее, если х к оценивается от минимальных значений вариационного ряда (Ирвин использовал в общем случае термин «первое значение»); σ – генеральное среднеквадратическое отклонение (СКО) непрерывной нормально распределённой случайной величины.

    Если λ расч > λ табл , х к – грубая ошибка. Здесь λ табл – табличное значение (процентная точка) критерия Ирвина.

    Возникающие при этом вопросы описаны на странице . В частности, в статье-первоисточнике табличные значения критерия рассчитаны для нормально распределенной случайной величины при известном генеральном среднеквадратическом отклонении (СКО) σ . Поскольку σ чаще всего неизвестно, Ирвином предложено использовать в расчётах вместо σ выборочное СКО s, определяемое по формуле

    где n – объём выборки, х i – элементы выборки, х ср – среднее значение выборки.

    Такой подход обычно и используется на практике. Однако приемлемость использования выборочного СКО, и при этом процентных точек для генерального СКО, не подтверждена.

    В данной статье приведены табличные значения (процентные точки) критерия Ирвина, рассчитанные методом статистического компьютерного моделирования при использовании выборочного СКО для максимального значения вариационного ряда при стандартном нормальном распределении случайной величины (при других параметрах нормального распределения, а также для минимального значения вариационного ряда получаются такие же результаты). Для каждого объёма выборки n моделировали 10 6 выборок. Как показали предварительные расчёты, при параллельных определениях различия в значениях процентной точки могут достигать 0,003. Поскольку значения округляли до 0,01, в сомнительных случаях проводили от 2 до 4 параллельных определений.

    Кроме того, по данным рассчитали табличные значения критерия Ирвина для известного генерального СКО и сопоставили их с приведёнными в .

    Поскольку при практическом применении критерия Ирвина нередко возникают определённые затруднения из-за отсутствия в литературных источниках табличных значений критерия при некоторых объёмах выборок, были рассчитаны тем же методом статистического компьютерного моделирования некоторые из отсутствующих в табличных значений.

    Ясно, что при объёме выборки 2 применение критерия с использованием выборочного СКО не имеет смысла. Это подтверждается тем, что упрощение выражения для расчётного значения критерия при выборочном СКО даёт квадратный корень из двух, что наглядно показывает бессмысленность применения критерия при объёме выборки 2 и выборочном СКО.

    Полученные результаты приведены в табл. 1.

    Таблица 1 - Табличные значения критерия Ирвина для крайних элементов вариационного ряда.

    Объём выборки По генеральному СКО По выборочному СКО
    Уровень значимости
    0,1 0,05 0,01 0,1 0,05 0,01
    2 2,33* 2,77* 3,64* - - -
    3 1,79* 2,17* 2,90* 1,62 1,68 1,72
    4 1,58 1,92 2,60 1,55 1,70 1,88
    5 1,45 1,77 2,43 1,45 1,64 1,93/
    6 1,37 1,67 2,30 1,38 1,60 1,94
    7 1,31 1,60 2,22 1,32 1,55 1,93
    8 1,26 1,55 2,14 1,27 1,51 1,92
    9 1,22 1,50 2,09 1,23 1,47 1,90
    10 1,18* 1,46* 2,04* 1,20 1,44 1,88
    11 1,15 1,43 2,00 1,17 1,42 1,87
    12 1,13 1,40 1,97 1,15 1,39 1,85
    13 1,11 1,38 1,94 1,13 1,37 1,83
    14 1,09 1,36 1,91 1,11 1,35 1,82
    15 1,08 1,34 1,89 1,09 1,33 1,80
    20 1,03* 1,27* 1,80* 1,03 1,27 1,75
    25 0,99 1,23 1,74 0,99 1,22 1,70
    30 0,96* 1,20* 1,70* 0,96 1,19 1,66
    35 0,93 1,17 1,66 0,94 1,16 1,63
    40 0,91* 1,15* 1,63* 0,92 1,14 1,61
    45 0,89 1,13 1,61 0,90 1,12 1,59
    50 0,88* 1,11* 1,59* 0,89 1,10 1,57
    60 0,86* 1,08* 1,56* 0,87 1,08 1,54
    70 0,84* 1,06* 1,53* 0,85 1,06 1,52
    80 0,83* 1,04* 1,51* 0,83 1,04 1,50
    90 0,82* 1,03* 1,49* 0,82 1,03 1,48
    100 0,81* 1,02* 1,47* 0,81 1,02 1,46
    200 0,75* 0,95* 1,38* 0,75 0,95 1,38
    300 0,72* 0,91* 1,33* 0,72 0,91 1,33
    500 0,69* 0,88* 1,28* 0,69 0,88 1,28
    1000 0,65* 0,83* 1,22* 0,65 0,83 1,22
    Примечание: значения, помеченные звёздочкой, рассчитаны по данным и при необходимости уточнены при статистическом компьютерном моделировании. Остальные значения рассчитаны при статистическом компьютерном моделировании.

    Если сравнить процентные точки для известного генерального СКО, приведённые в табл. 1, с соответствующими процентными точками, приведёнными в , то они в нескольких случаях различаются на 0,01, и в одном случае на 0,02. Видимо, приведённые в данной статье процентные точки более точны, поскольку в сомнительных случаях они проверялись статистическим компьютерным моделированием.

    Из табл.1 видно, что процентные точки критерия Ирвина при использовании выборочного СКО при сравнительно небольших объёмах выборки заметно отличаются от процентных точек при использовании генерального СКО. Только при значительных объёмах выборки, примерно около 40, процентные точки становятся близки. Таким образом, при использовании критерия Ирвина следует пользоваться процентными точками, приведёнными в табл. 1, с учётом того, получено расчётное значение критерия по генеральному или по выборочному СКО.

    ЛИТЕРАТУРА

    1. Irvin J.O. On a criterion for the rejection of outlying observation //Biometrika.1925. V. 17. P. 238 – 250.

    2. Кобзарь А.И. Прикладная математическая статистика. – М.: ФИЗМАТЛИТ, 2006. – 816с. © В.В. Заляжных
    При использовании материалов ставьте ссылку.


    Задания для самостоятельного изучения дисциплины.

    Задание 1. В соответствии с вариантом, осуществить имитацию набора эмпирических данных, получаемых в результате измерения одномерного признака. Для этого необходимо осуществить табулирование функции:

    , ,

    и получить 15 – 20 последовательных данных. Здесь, предположительно характеристика признака (отражает основную тенденцию признака), а помехи (ошибки) измерений, которые явились следствием проявления случайностей различного рода.

    Варианты исходных данных:

    Осуществить выявление аномальных уровней получаемого при табулировании функции ряда данных и выполнить их сглаживание:

    а). методом Ирвина, по формуле

    ,

    .

    Расчетные значения сравниваются с табличными значениями критерия Ирвина:

    Таблица критерия Ирвина

    В таблице приведены значения критерия Ирвина для уровня значимости (с 5% ошибкой).

    б). методом проверки разностей средних уровней, разбивая временной ряд данных, примерно на две равные части и вычисляя для каждой из частей среднее значение и дисперсию. Далее, проверить равенство дисперсий обеих частей с помощью критерия Фишера. Если гипотеза о равенстве дисперсий принимается, перейти к проверке гипотезы об отсутствии тренда с использованием критерия Стьюдента. Для вычисления эмпирического значения статистики, использовать формулы:

    ,

    где среднее квадратическое отклонение разностей средних:

    .

    Расчетное значение статистики сравнить с табличным.

    в). Методом Фостера-Стьюарта.

    2. Осуществить механическое сглаживание уровней ряда:

    а). методом простой скользящей средней;

    б). методом взвешенной скользящей средней;

    в). Методом экспоненциального сглаживания.

    Задание 2. В таблице данных экономических показателей, приведен временной ряд ежемесячных объемов перевозок (привязанных к определенной местности) сельскохозяйственных грузов в условных единицах.

    Применяя метод Четверикова для выделения компонент временного ряда:

    а). провести выравнивание эмпирического ряда с использованием центрированной скользящей средней с периодом сглаживания ;

    б). полученную предварительную оценку тренда вычесть из исходного эмпирического ряда: .

    в). Вычислить для каждого года (по строке) среднее квадратическое отклонение величины , используя для этого формулу

    г). найти предварительное значение средней сезонной волны: .

    д). получить ряд, лишенный сезонной волны: .

    е). полученный ряд сгладить с использованием простой скользящей средней с интервалом сглаживания, равным пяти, и получить новую оценку тренда .

    ж). вычислить отклонения ряда от исходного эмпирического ряда :

    .

    з). полученные отклонения подвергнуть обработке в соответствии с пп. в). и г). для выявления новых значений сезонной волны.

    и). произвести вычисление коэффициента напряженности сезонной волны по формулам и далее (сам коэффициент):

    .

    Коэффициент напряженности не вычисляется для первого и последнего года.

    к). Используя коэффициент напряженности, вычислить окончательные значения сезонной компоненты временного ряда: .

    Задание 3. Временной ряд задан в таблице:

    Осуществить предварительный выбор наилучшей кривой роста:

    а). методом конечных разностей (Тинтнера);

    б). методом характеристик прироста.

    2. Для исходного ряда построить линейную модель , определив ее параметры методом наименьших квадратов.

    3. Для исходного временного ряда построить адаптивную модель Брауна с параметром сглаживания и ; выбрать наилучшую модель Брауна , где период упреждения (количество шагов вперед).

    4. Оценить адекватность моделей на основе исследований:

    а). близости математического ожидания остаточной компоненты нулю; критическое значение статистики Стьюдента принять (для доверительной вероятности 0,70);

    б). случайности отклонений остаточной компоненты по критерию пиков (поворотных точек); расчеты выполнить на основе соотношения ;

    в). независимости (отсутствия автокорреляции) уровней рядя остатков либо по критерию Дарбина-Уотсона (в качестве критических используйте уровни и ), либо по первому коэффициенту автокорреляции (критический уровень принять равным );

    г). нормальности закона распределения остаточной компоненты на основе RS-критерия (в качестве критических уровней принять интервал (2,7 – 3,7)).

    5. Оценить точность моделей используя показатели среднего квадратического отклонения и средней относительной ошибки аппроксимации.

    6. На основе сравнительного анализа адекватности и точности моделей выбрать лучшую модель, по которой построить точечный и интервальный прогнозы на два шага вперед (). Результаты прогнозирования отразить графически.

    Задание 4. Проведена оценка процессоров 10-ти рабочих станций локальной сети, построенной на базе машин приблизительно одного типа, но разных производителей (что предполагает некоторые отклонения параметров работы машин от базовой модели). Для тестирования работы процессоров использована смесь типа ICOMP 2.0 в основу которой положены два основных теста:

    1. 125.turb3D – тест моделирования турбулентности в кубическом объеме (прикладное ПО);

    2. NortonSI32 – инженерная программа типа AutoCaD

    и вспомогательный тест для нормирования времени обработки данных SPECint_base95. Оценка процессоров производилась по взвешенному времени выполнения смеси, нормированному по эффективности базового процессора, в соответствии с формулой

    где время выполнения го теста;

    вес го теста;

    эффективность базового процессора на м тесте.

    Если выражение (1) логарифмировать, то получим:

    и после переобозначения переменных:

    базовое время обработки теста SPECint_base95 ;

    логарифм времени обработки первого теста,

    логарифм времени обработки второго теста, регрессионный коэффициент, получаемый в оценках (вес теста);

    регрессионный коэффициент – вес теста обработки арифметических операций в целых числах (базовый тест).

    1. По данным измерений, приведенным в таблице, построить регрессионную (эмпирическую) функцию, оценить коэффициенты регрессии и проверить модель на адекватность (вычислить ковариационную матрицу, коэффициенты парной корреляции, коэффициент детерминации).

    Варианты данных:

    Вариант 1.

    Вариант 2.

    Вариант 3.

    Вариант 4.