Оказывается, что целый ряд практических задач можно решить с помощью немногих характеристик распределения, а знание точной функции распределения случайной величины оказывается необязательным. К таким определяющим характеристикам случайной величины относятся, например, ее среднее и среднее квадратичное значения, а также среднее квадратичное отклонение.

Находить средние значения случайных величин можно из опыта, а также зная функции распределения случайных величин. Рассмотрим, как находить эти средние значения в различных случаях.

Пусть случайная величина может принимать: значения с вероятностью или это значение выпадает раз из

значение с вероятностью или это значение выпадает раз из наконец,

значение с вероятностью или это значение выпадает раз из

Тогда сумма значений случайной величины при испытаниях будет:

Чтобы найти среднее значение случайной величины т. е. значение, приходящееся на одно испытание, нужно сумму разделить на полное число испытаний:

Если мы имеем некоторую среднюю величину найденную по формуле (2.11), то, вообще говоря, при различных значениях полного числа испытаний значения средней величины также будут различными, так как рассматриваемые величины носят случайный характер. Однако при увеличении числа среднее значение данной величины будет стремиться к определенному пределу а. И чем больше будет число испытаний, тем ближе определенное по формуле (2.11), будет приближаться к этому предельному значению:

Последнее равенство представляет собой так называемый закон больших чисел или теорему Чебышева: среднее значение случайной величины будет стремиться к постоянному числу при очень большом числе измерений.

Итак, среднее значение случайной величины равна сумме произведений случайной величины на вероятность ее появления.

Если случайная величина меняется непрерывно, то ее среднее значение можно найти с помощью интегрирования:

Средние величины обладают рядом важных свойств:

1) среднее значение постоянной величины равно самой постоянной величине т. е.

2) среднее значение некоторой случайной величины есть величина постоянная, т. е.

3) среднее значение суммы нескольких случайных величин равно сумме средних значений этих величин, т. е.

4) среднее значение произведения двух взаимно независимых случайных величин равно произведению средних значений каждой из них, т. е.

Распространяя это правило на большее число независимых величин, имеем:

Иногда по тем или иным причинам знание среднего значения случайной величины оказывается недостаточным. В таких случаях ищется не просто среднее значение случайной величины, а среднее значение квадрата этой величины (квадратичное). При этом имеют место аналогичные формулы:

для дискретных значений и

в случае непрерывного изменения случайной величины.

Среднее квадратичное значение случайной величины оказывается всегда положительным и не обращается в нуль.

Часто приходится интересоваться не только средними значениями самой случайной величины, но и с редними значениями некоторых функций от случайной величины.

Например, имея распределение молекул по скоростям, мы можем найти среднюю скорость. Но также нас может интересовать средняя кинетическая энергия теплового движения, являющаяся квадратичной функцией скорости. В таких случаях можно воспользоваться следующими общими формулами, определяющими среднее значение произвольной функции случайной величины для случая дискретного распределения

для случая непрерывного распределения

Для нахождения средних значений случайной величины или функции от случайной величины с помощью ненормированной функции распределения пользуются формулами:

Здесь везде интегрирование производится по всей области возможных значений случайной величины

Отклонение от средних. В ряде случаев знание среднего и среднего квадратичного значения случайной величины оказывается недостаточным для характеристики случайной величины. Интерес представляет также распределение случайной величины около своего среднего значения. Для этого исследуется отклонение случайной величины от среднего значения.

Однако, если мы возьмем среднее отклонение случайной величины от ее среднего значения т. е. среднее значение чисел:

то получим, как в случае дискретного, так и в случае непрерывного распределения, нуль. Действительно,

Иногда можно находить среднее значение модулей отклонений случайной величины от среднего значения, т. е. величину:

Однако вычисления с абсолютными значениями часто сложны, а иногда и невозможны.

Поэтому гораздо чаще для характеристики распределения случайной величины около своего среднего значения используют так называемое среднее квадратичное отклонение или средний квадрат отклонения. Средний квадрат отклонения иначе называют дисперсией случайной величины. Дисперсия определяется по формулам:

которые преобразуются к одному виду (см. задачи 5, 9).

где величина представляет квадрат отклонения случайной величины от ее среднего значения.

Квадратный корень из дисперсии случайной величины называется средним квадратичным отклонением случайной величины, а для физических величин - флуктуацией:

Иногда вводится относительная флуктуация, определяемая по формуле

Таким образом, зная закон распределения случайной величины, можно определить все интересующие нас характеристики случайной величины: среднее значение, среднее квадратичное, среднее значение произвольной функции от случайной величины, средний квадрат отклонения или дисперсию и флуктуацию случайной величины.

Поэтому одной из основных задач статистической физики является отыскание законов и функций распределения тех или иных физических случайных величин и параметров в различных физических системах.

Для того чтобы найти среднее значение в Excel (при том неважно числовое, текстовое, процентное или другое значение) существует много функций. И каждая из них обладает своими особенностями и преимуществами. Ведь в данной задаче могут быть поставлены определенные условия.

Например, средние значения ряда чисел в Excel считают с помощью статистических функций. Можно также вручную ввести собственную формулу. Рассмотрим различные варианты.

Как найти среднее арифметическое чисел?

Чтобы найти среднее арифметическое, необходимо сложить все числа в наборе и разделить сумму на количество. Например, оценки школьника по информатике: 3, 4, 3, 5, 5. Что выходит за четверть: 4. Мы нашли среднее арифметическое по формуле: =(3+4+3+5+5)/5.

Как это быстро сделать с помощью функций Excel? Возьмем для примера ряд случайных чисел в строке:

Или: сделаем активной ячейку и просто вручную впишем формулу: =СРЗНАЧ(A1:A8).

Теперь посмотрим, что еще умеет функция СРЗНАЧ.


Найдем среднее арифметическое двух первых и трех последних чисел. Формула: =СРЗНАЧ(A1:B1;F1:H1). Результат:



Среднее значение по условию

Условием для нахождения среднего арифметического может быть числовой критерий или текстовый. Будем использовать функцию: =СРЗНАЧЕСЛИ().

Найти среднее арифметическое чисел, которые больше или равны 10.

Функция: =СРЗНАЧЕСЛИ(A1:A8;">=10")


Результат использования функции СРЗНАЧЕСЛИ по условию ">=10":

Третий аргумент – «Диапазон усреднения» - опущен. Во-первых, он не обязателен. Во-вторых, анализируемый программой диапазон содержит ТОЛЬКО числовые значения. В ячейках, указанных в первом аргументе, и будет производиться поиск по прописанному во втором аргументе условию.

Внимание! Критерий поиска можно указать в ячейке. А в формуле сделать на нее ссылку.

Найдем среднее значение чисел по текстовому критерию. Например, средние продажи товара «столы».

Функция будет выглядеть так: =СРЗНАЧЕСЛИ($A$2:$A$12;A7;$B$2:$B$12). Диапазон – столбец с наименованиями товаров. Критерий поиска – ссылка на ячейку со словом «столы» (можно вместо ссылки A7 вставить само слово "столы"). Диапазон усреднения – те ячейки, из которых будут браться данные для расчета среднего значения.

В результате вычисления функции получаем следующее значение:

Внимание! Для текстового критерия (условия) диапазон усреднения указывать обязательно.

Как посчитать средневзвешенную цену в Excel?

Как мы узнали средневзвешенную цену?

Формула: =СУММПРОИЗВ(C2:C12;B2:B12)/СУММ(C2:C12).


С помощью формулы СУММПРОИЗВ мы узнаем общую выручку после реализации всего количества товара. А функция СУММ - сумирует количесвто товара. Поделив общую выручку от реализации товара на общее количество единиц товара, мы нашли средневзвешенную цену. Этот показатель учитывает «вес» каждой цены. Ее долю в общей массе значений.

Среднее квадратическое отклонение: формула в Excel

Различают среднеквадратическое отклонение по генеральной совокупности и по выборке. В первом случае это корень из генеральной дисперсии. Во втором – из выборочной дисперсии.

Для расчета этого статистического показателя составляется формула дисперсии. Из нее извлекается корень. Но в Excel существует готовая функция для нахождения среднеквадратического отклонения.


Среднеквадратическое отклонение имеет привязку к масштабу исходных данных. Для образного представления о вариации анализируемого диапазона этого недостаточно. Чтобы получить относительный уровень разброса данных, рассчитывается коэффициент вариации:

среднеквадратическое отклонение / среднее арифметическое значение

Формула в Excel выглядит следующим образом:

СТАНДОТКЛОНП (диапазон значений) / СРЗНАЧ (диапазон значений).

Коэффициент вариации считается в процентах. Поэтому в ячейке устанавливаем процентный формат.

Распределение торговых фирм по размеру месячного товарооборота характеризуется следующими данными:

№п/п Товарооборот, млн. руб. Число фирм
1 до 5 20
2 5-10 26
3 10-15 20
4 15-20 14
5 20-25 10
6 25 и более 10
Итого - 100

Определите:

а) средний размер месячного товарооборота на одну фирму;

б) модальное и медианное значение месячного товарооборота;

в) сделайте выводы о характере данного распределения.

Решение:

а) Рассчитаем средний размер товарооборота на одну фирму.

В данном ряду варианты усредняемого признака (товарооборот) представлены не одним числом, а в виде интервала «от - до». Причём первый и последний - интервалы открытые.

В таких рядах условно принимается, величина интервала первой группы равна величине интервала последующей, а величина интервала последней группы равна величине интервала предыдущей. Таким образом, товарооборот первой группы от 0 до 5 млн. руб., товарооборот последней - от 25 до 30 млн. руб. Исчисление средней по сгруппированным данным производится по формуле средней арифметической взвешенной:

Чтобы применить эту формулу, необходимо варианты признака выразить одним числом (дискретным). За такое дискретное число принимается средняя арифметическая простая из верхнего и нижнего значения интервала. Так для первой группы дискретная величина х будет равна: (0 + 5) / 2 = 2,5 . Дальнейший расчёт производится обычным методом определения средней арифметической взвешенной:

Исходные и расчётные данные представим в таблице:

Товарооборот, млн. руб. Число фирм, f Середина интервала, х xf Сумма накопленных частот
0-5 20 2,5 50 20
5-10 26 7,5 195 46
10-15 20 12,5 250 66
15-20 14 17,5 245 -
20-25 10 22,5 225 -
25-30 10 27,5 275 -
Итого 100 - 1240 -

б) Определим модальное и медианное значение месячного товарооборота.
В интервальных рядах распределения с равными интервалами мода определяется по формуле:

x Mo - начальное значение интервала, содержащего моду;
i Mo - величина модального интервала,
f Mo - частота модального интервала,
f (Mo-1) - частота интервала, предшествующего модальному,
f (Mo+1) - частота интервала, следующего за модальным.

Наибольшее число фирм (26) имеют величину товарооборота от 5 до 10 млн. руб. Следовательно, этот интервал является модальным интервалом ряда распределения. Введём следующие обозначения:

x Mo =5, i Mo =5, f Mo =26, f (Mo-1) =20, f (Mo+1) =20.

Подставим эти значения в формулу моды и произведём вычисления:

Следовательно, наибольшее число фирм имеет товарооборот 7,5 млн. руб.

Медиана интервального вариационного ряда распределения определяется по формуле:

где x Mе - начальное значение интервала, содержащего медиану;
i Mе - величина медианного интервала;
Σf - сумма частот ряда;
S (Me-1) - сумма накопленных частот, предшествующих медианному интервалу;
f Me - частота медианного интервала.

Определим, прежде всего, медианный интервал. Сумма накопленных частот, превышающая половину всех значений (66), соответствует интервалу 10 - 15. Это и есть медианный интервал, в котором находится медиана. Определим её значение по приведённой выше формуле, если:

x Mе =10 , i Mе =5 , Σf=100 , S (Me-1) =46 , f Me =20 :

Таким образом, половина фирм имеет товарооборот менее 11 млн. руб., а остальные фирмы - более 11 млн. руб.

в) В симметричных рядах распределения значения моды и медианы совпадают со средней величиной, а в умеренно ассиметричных они соотносятся таким образом:

Соотношение характеристик центра распределения товарооборота свидетельствует об умеренной асимметрии:
3(12,4-11) ≈12,4-7,5

Сейчас поговорим о том, как рассчитывать среднюю величину .
В классическом виде общая теория статистики предлагает нам один вариант правил выбора средней величины.
Сначала необходимо составить правильно логическую формулу для расчета средней величины (ЛФС). Для каждой средней величины всегда есть только одна логическая формула ее расчета, поэтому ошибиться тут трудно. Но всегда надо помнить, что в числителе (это то, что сверху дроби) сумма всех явлений, а в знаменателе (то, что внизу дроби) общее количество элементов.

После того как составлена логическая формула можно пользоваться правилами (для простоты понимания упростим их и сократим):
1. Если в исходных данных (определяем по частоте) представлен знаменатель логической формулы, то расчет проводим по формуле средней арифметической взвешенной.
2. Если в исходных данных представлен числитель логической формулы, то расчет ведем по формуле средней гармонической взвешенной.
3. Если в задаче представлены сразу и числитель и знаменатель логической формулы (такое бывает редко), то расчет проводим по этой формуле или по формуле средней арифметической простой.
Это классическое представление о выборе верной формулы расчета средней величины. Далее представим последовательность действий при решении задач на расчет средней величины.

Алгоритм решения задач на расчет средней величины

А. Определяем способ расчета средней величины – простой или взвешенный . Если данные представлены в таблице то используем взвешенный способ, если данные представлены простым перечислением, то используем простой способ расчета.

Б. Определяем или расставляем условные обозначения – x – варианта, f – частота . Варианта это то, для какого явления требуется найти среднюю величину. Оставшиеся данные в таблице будут частотой.

В. Определяем форму расчета средней величины – арифметическая или гармоническая . Определение проводится по колонке частот. Арифметическая форма используется, если частоты заданы явным количеством (условно к ним можно подставить слово штук, количество элементов «штук»). Гармоническая форма используется, если частоты заданы не явным количеством, а сложным показателем (произведением осредняемой величины и частоты).

Самое сложное, это догадаться, где и какое количество задано, особенно неопытному в таких делах студенту. В такой ситуации можно воспользоваться одним из предлагаемых далее способов. Для некоторых задач (экономических) подходит наработанное годами практики утверждение (пункт В.1). В других же ситуациях придется пользоваться пунктом В.2.

В.1 Если частота задана в денежных единицах (в рублях), то используется для расчета средняя гармоническая, такое утверждение верно всегда, если выявленная частота задана в деньгах, в других ситуациях это правило не действует.

В.2 Воспользоваться правилами выбора средней величины указанными выше в этой статье. Если частота задана знаменателем логической формулы расчета средней величины, то рассчитываем по средней арифметической форме, если частота задана числителем логической формулы расчета средней величины, то рассчитываем по средней гармонической форме.

Рассмотрим на примерах использование данного алгоритма.

А. Так как данные представлены в строчку то используем простой способ расчета.

Б. В. Имеем только данные по величине пенсий, именно они и будут нашей вариантой – х. Данные представлены простым количеством (12 человек), для расчета используем среднюю арифметическую простую.

Средний размер пенсии пенсионера составляет 9208,3 рубля.

Б. Так как требуется найти средний размер выплаты на одного ребенка, то варианты находятся в первой колонке, туда ставим обозначение х , вторая колонка автоматически становится частотой f .

В. Частота (число детей) задана явным количеством (можно подставить слово штук детей, с точки зрения русского языка неверное словосочетание, но, по сути, очень удобно проверять), значит, для расчета используется средняя арифметическая взвешенная.

Эту же задачу модно решить не формульным способом, а табличным, то есть занести все данные промежуточных расчетов в таблицу.

В результате все, что нужно теперь сделать, это разделить два итоговых данных в правильно порядке.

Средний размер выплаты на одного ребенка в месяц составил 1910 рублей.

А. Так как данные представлены в таблице то для расчета используем взвешенную форму.

В. Частота (себестоимость выпуска) задана неявным количеством (частота задана в рублях пункт алгоритма В1 ), значит, для расчета используется средняя гармоническая взвешенная. Вообще же, по сути, себестоимость выпуска это сложный показатель, который получается перемножение себестоимости единицы изделия на количество таких изделий, вот это и есть суть средней гармонической величины.

Чтобы эта задача могла решаться по формуле средней арифметической необходимо, чтобы вместо себестоимости выпуска стояло число изделий с соответствующей себестоимостью.

Обратите внимание, что сумма в знаменателе, получившаяся после расчетов 410 (120+80+210) это и есть общее количество выпущенных изделий.

Средняя себестоимость единицы изделия составила 314,4 рубля.

А. Так как данные представлены в таблице то для расчета используем взвешенную форму.

Б. Так как требуется найти среднюю себестоимость единицы изделия, то варианты находятся в первой колонке, туда ставим обозначение х , вторая колонка автоматически становится частотой f .

В. Частота (общее число пропусков) задана неявным количеством (это произведение двух показателей числа пропусков и числа студентов, имеющих такое количество пропусков), значит, для расчета используется средняя гармоническая взвешенная. Будем использовать пункт алгоритма В2 .

Чтобы эта задача могла решаться по формуле средней арифметической необходимо, чтобы вместо общего числа пропусков стояло число студентов.

Составляем логическую формулу расчета среднего числа пропусков одного студента.

Частота по условию задачи Общее число пропусков. В логической формуле этот показатель находится в числителе, а значит, используем формулу средней гармонической.

Обратите внимание, что сумма в знаменателе, получившаяся после расчетов 31 (18+8+5) это и есть общее количество студентов.

Среднее число пропусков одного студента 13,8 дня.

Предположим, что нужно найти среднее число дней для выполнения задач, различными сотрудниками. Или вы хотите вычисление интервала времени 10 лет Средняя температура в определенный день. Вычисление среднего значения ряда чисел несколькими способами.

Среднее функция меры центральной тенденции, в которой находится центр ряда чисел в статистическое распределение. Три большинство общих критериями центральной тенденции выступают.

    Среднее Среднее арифметическое и вычисляется путем добавления ряда чисел и затем деления количества этих чисел. Например среднее значение 2, 3, 3, 5, 7 и 10 имеет 30, разделенных на 6, 5;

    Медиана Средний номер ряда чисел. Половина чисел имеют значения, которые больше, чем Медиана, а половина чисел имеют значения, которые меньше, чем Медиана. Например медиана 2, 3, 3, 5, 7 и 10 - 4.

    Режим Наиболее часто встречающееся число в группе чисел. Например режим 2, 3, 3, 5, 7 и 10 - 3.

Эти три меры центральной тенденции симметричную распределение ряда чисел, являются одни и те же. В асимметричное распределение ряда чисел они могут быть разными.

Вычисление среднего значения ячеек, расположенных непрерывно в одной строке или одном столбце

Выполните следующие действия.

Вычисление среднего значения ячеек, расположенных вразброс

Для выполнения этой задачи используется функция СРЗНАЧ . Скопируйте в приведенной ниже таблице на пустой лист.

Вычисление среднего взвешенного значения

СУММПРОИЗВ и сумм . Пример vThis вычисляет среднюю цену единицы измерения, оплаченная через три покупки, где находится каждый покупки для различное количество единиц измерения по различным ценам за единицу.

Скопируйте в приведенной ниже таблице на пустой лист.

Вычисление среднего значения чисел, без учета нулевых значений

Для выполнения этой задачи используются функции СРЗНАЧ и если . Скопируйте приведенную ниже таблицу и имейте в виду, что в этом примере чтобы проще было понять, скопируйте его на пустой лист.