Средняя квадратическая

Определяется как обобщающая характеристика размеров вариации признака в совокупности. Оно равно квадратному корню из среднего квадрата отклонений отдельных значений признака от средней арифметической, т.е. корень из и может быть найдена так:

1. Для первичного ряда:

2. Для вариационного ряда:

Преобразование формулы среднего квадратичного отклонени приводит ее к виду, более удобному для практических расчетов:

Среднее квадратичное отклонение определяет на сколько в среднем отклоняются конкретные варианты от их среднего значения, и к тому же является абсолютной мерой колеблемости признака и выражается в тех же единицах, что и варианты, и поэтому хорошо интерпретируется.

Примеры нахождения cреднего квадратического отклонения: ,

Для альтернативных признаков формула среднего квадратичного отклонения выглядит так:

где р - доля единиц в совокупности, обладающих определенным признаком;

q - доля единиц, не обладающих этим признаком.

Понятие среднего линейного отклонения

Среднее линейное отклонение определяется как средняя арифметическая абсолютных значений отклонений отдельных вариантов от .

1. Для первичного ряда:

2. Для вариационного ряда:

где сумма n - сумма частот вариационного ряда .

Пример нахождения cреднего линейного отклонения:

Преимущество среднего абсолютного отклонения как меры рассеивания перед размахом вариации, очевидно, так как эта мера основана на учете всех возможных отклонений. Но этот показатель имеет существенные недостатки. Произвольные отбрасывания алгебраических знаков отклонений могут привести к тому, что математические свойства этого показателя являются далеко не элементарными. Это сильно затрудняет использование среднего абсолютного отклонения при решении задач, связанных с вероятностными расчетами.

Поэтому среднее линейное отклонение как мера вариации признака применяется в статистической практике редко, а именно тогда, когда суммирование показателей без учета знаков имеет экономический смысл. С его помощью, например, анализируется оборот внешней торговли, состав работающих, ритмичность производства и т. д.

Среднее квадратическое

Среднее квадратическое применяется , например, для вычисления средней величины сторон n квадратных участков, средних диаметров стволов, труб и т. д. Она подразделяется на два вида.

Средняя квадратичная простая. Если при замене индивидуальных величин признака на среднюю величину необходимо сохранить неизменной сумму квадратов исходных величин, то средняя будет являться квадратичной средней величиной.

Она является квадратным корнем из частного от деления суммы квадратов отдельных значений признака на их число:

Средняя квадратичная взвешенная вычисляется по формуле:

где f - признак веса.

Средняя кубическая

Средняя кубическая применяется , например, при определении средней длины стороны и кубов. Она подразделяется на два вида.
Средняя кубическая простая:

При расчете средних величин и дисперсии в интервальных рядах распределения истинные значения признака заменяются центральными значениями интервалов, которые отличны от средней арифметической значений, включенных в интервал. Это приводит к возникновению систематической погрешности при расчете дисперсии. В.Ф. Шеппард определил, что погрешность в расчете дисперсии , вызванная применением сгруппированных данных, составляет 1/12 квадрата величины интервала как в сторону повышения, так и в сторону понижения величины дисперсии.

Поправка Шеппарда должна применяться, если распределение близко к нормальному, относится к признаку с непрерывным характером вариации, построено по значительному количеству исходных данных (n > 500). Однако исходя из того, что в ряде случаев обе погрешности, действуя в разных направлениях компенсируют друг друга, можно иногда отказаться от введения поправок.

Чем меньше значение дисперсии и среднего квадратического отклонения, тем однороднее совокупность и тем более типичной будет средняя величина.
В практике статистики часто возникает необходимость сравнения вариаций различных признаков. Например, большой интерес представляет сравнение вариаций возраста рабочих и их квалификации, стажа работы и размера заработной платы, себестоимости и прибыли, стажа работы и производительности труда и т.д. Для таких сопоставлений показатели абсолютной колеблемости признаков непригодны: нельзя сравнивать колеблемость стажа работы, выраженного в годах, с вариацией заработной платы, выраженной в рублях.

Для осуществления таких сравнений, а также сравнений колеблемости одного и того же признака в нескольких совокупностях с разными средним арифметическим используется относительный показатель вариации - коэффициент вариации.

Структурные средние

Для характеристики центральной тенденции в статистических распределениях не редко рационально вместе со средней арифметической использовать некоторое значение признака X, которое в силу определенных особенностей расположения в ряду распределения может характеризовать его уровень.

Это особенно важно тогда, когда в ряду распределения крайние значения признака имеют нечеткие границы. В связи с этим точное определение средней арифметической, как правило, невозможно, либо очень сложно. В таких случаях средний уровень можно определить, взяв, например, значение признака, которое расположено в середине ряда частот или которое чаще всего встречается в текущем ряду.

Такие значения зависят только от характера частот т. е. от структуры распределения. Они типичны по месту расположения в ряду частот, поэтому такие значения рассматриваются в качестве характеристик центра распределения и поэтому получили определение структурных средних. Они применяются для изучения внутреннего строения и структуры рядов распределения значений признака. К таким показателям относятся .

Используется в тех случаях, когда при замене индивидуальных значений признака на среднюю величину необходимо сохранить неизменной сумму квадратов исходных величин.

Главная сфера её использования – измерение степени колеблемости индивидуальных значений признака относительно средней арифметической (среднее квадратическое отклонение). Кроме этого, средняя квадратическая применяется в тех случаях, когда необходимо вычислить средний величину признака, выраженного в квадратных или кубических единицах измерения (при вычислении средней величины квадратных участков, средних диаметров труб, стволов и т. д.).

Средняя квадратическая рассчитывается в двух формах:

- как простая

как взвешенная

(4.22)

Все степенные средние различаются между собой значениями показателя степени.При этом, чем выше показатель степени, тем больше количественное значение среднего показателя :

Это свойство степенных средних называется свойством мажорантности средних.

Таким образом, выбор вида среднего показателя оказывает существенное влияние на его численную величину. Выбор вида средней определяется в каждом отдельном случае путем анализа исследуемой совокупности, изучения содержания явления. Степенная средняя выбрана правильно, если на всех этапах вычислений не меняется её логическая формула, т.е. реально сохраняется социально-экономическое содержание усредняемого признака.

Особый вид средних показателей структурные средние. Они используются при изучении внутреннего строения рядов распределения значений признака. К ним относятся мода и медиана.

Мода и медиана характеризуют значение признака у статистической единицы, занимающей определенное положение в вариационном ряду.

Мода (Mo ) - наиболее часто встречаемое значение признака в совокупности. Мода широко используется в статистической практике при изучении покупательского спроса, регистрации цен и др.

Медиана ( Me ) - значение признака у статистической единицы, стоящей в середине ранжированного ряда и делящей совокупность на две равные по численности части.

Для дискретных вариационных рядов Mo и Me выбираются в соответствии с определениями: мода - как значение признака с наибольшей частотой\ n i ; положение медианы при нечетном объеме совокупности определяется ее номером
, гдеN – объем статистической совокупности. При четном объеме ряда медиана равна средней из двух вариантов, находящихся в середине ряда.

Медиану используют как наиболее надежный показатель типичного значения неоднородной совокупности, так как она нечувствительна к крайним значениям признака, которые могут значительно отличаться от основного массива его значений. Кроме этого, медиана находит практическое применение вследствие особого математического свойства:
.

Рассмотрим определение моды и медианы на следующем примере:

Имеется ряд распределения рабочих участка по уровню квалификации. Данные приведены в таблице 4.4.

Таблица 4.4 - Распределения рабочих участка по уровню квалификации

Накопленная

Мода выбирается по максимальному значению частоты: при n max = 14, Mo = 4, т.е. чаще всего встречается 4-ый разряд. Для нахождения медианы Me определяются центральные единицы (N +1)/2 . Это 25 и 26-ая единицы. По накопленным частотам определяется группа, в которую попадают эти единицы. Это 4-ая группа, в которой значение признака равно 4. Таким образом, Me = 4, это означает, что у половины рабочих разряд ниже 4-го, а у другой – выше четвертого.

В интервальном ряду значения Mo и Me вычисляются более сложным путем.

Мода определяется следующим образом:

По максимальному значению частоты определяется интервал, в котором находится значение моды. Он называется модальным.

Внутри модального интервала значение моды вычисляется по формуле:

где
- нижняя граница модального интервала;

a Мо - ширина модального интервала;

n Мо , n Мо-1 , n Мо+1 - соответственно частоты модального, предмодального (предшествующего модальному) и постмодального (следующего за модальным) интервалов.

Для расчета медианы в интервальных рядах используется следующий подход:

По накопленным частотам находится медианный интервал.

Медианным называется интервал, содержащий центральную единицу.

Внутри медианного интервала значение Me определяется по формуле:

(4.25)

где
- нижняя граница медианного интервала;

a Ме -ширина медианного интервала;

N – объем статистической совокупности;

N Ме-1 - накопленная частота предмедианного интервала;

n Ме - частота медианного интервала.

Расчет моды и медианы для интервального ряда распределения рассмотрим на примере ряда распределения рабочих по стажу (табл. 4.5).

Таблица 4.5 - Распределение рабочих участка по стажу

Интервал

а i

n i

N i

Расчет Mo :

Максимальная частота n max = 13, она соответствует четвертой группе, следовательно, модальным является интервал с границами 12 – 16 лет.

Моду рассчитаем по формуле:

Чаще всего встречаются рабочие со стажем работы около 13 лет.

Мода не находится в середине модального интервала, она смещена к его нижней границе, связано это со структурой данного ряда распределения (частота предмодального интервала значительно больше частоты постмодального интервала).

Расчет медианы:

По графе накопленных частот определяется медианный интервал. Он содержит 25 и 26-ую статистические единицы, которые находятся в разных группах – в 3-ей и 4-ой. Для нахождения Me можно использовать любую из них. Расчет проведем по 3-ей группе:

Такое же значение Me можно получить при её расчете по 4-ой группе:

При сдвоенном центре Me всегда находится на стыке интервалов, содержащих центральные единицы. Вычисленное значениеMe показывает, что у первых 25 рабочих стаж работы – менее 12 лет, а у оставшихся 25-ти, следовательно, - более 12 лет.

Моду можно определить графически по полигону распределения в дискретных рядах, по гистограмме распределения – в интервальных, а медиану - по кумуляте.

Для нахождения моды в интервальном ряду правую вершину модального прямоугольника нужно соединить с правым верхним углом предыдущего прямоугольника, а левую вершину – с левым верхним углом последующего прямоугольника. Абсцисса точки пересечения этих прямых и будет модой распределения.

Для определение медианы высоту наибольшей ординаты кумуляты, соответствующей общей численности совокупности, делят пополам. Через полученную точку проводят прямую, параллельную оси абсцисс, до пересечения ее с кумулятой. Абсцисса точки пересечения является медианой.

Кроме Mo иMe в вариантных рядах могут быть определены и другие структурные характеристики – квантили. Квантили предназначены для более глубокого изучения структуры ряда распределения.Квантиль – это значение признака, занимающее определенное место в упорядоченной по данному признаку совокупности. Различают следующие виды квантилей:

- квартили – значения признака, делящие упорядоченную совокупность на 4 равные части;

- децили – значения признака, делящие совокупность на 10 равных частей;

- перцентели - значения признака, делящие совокупность на 100 равных частей.

Таким образом, для характеристики положения центра ряда распределения можно использовать 3 показателя: среднее значение признака ,мода, медиана .

При выборе вида и формы конкретного показателя центра распределения необходимо исходить из следующих рекомендаций:

Для устойчивых социально-экономических процессов в качестве показателя центра используют среднюю арифметическую. Такие процессы характеризуются симметричными распределениями, в которых

= Me = Mo ;

Для неустойчивых процессов положение центра распределения характеризуется с помощью Mo илиMe . Для асимметричных процессов предпочтительной характеристикой центра распределения является медиана, поскольку она занимает положение между средней арифметической и модой.

При выборе единиц наблюдения возможны ошибки смещения, т.е. такие события, появление которых не может быть точно предсказуемым. Эти ошибки являются объектив­ными и закономерными. При определении степени точности выборочно­го исследования оценивается величина ошибки, которая может прои­зойти в процессе выборки. Такие ошибки носят название случайных ошибок р епр езентативно сти (m),

На практике для определения средней ошибки выборки при проведении статистических исследований, используются следующие Формулы:

1) для расчета средней ошибки (m м) средней величины (М):

, где σ - среднее квадратическое отклонение;

n - численность выборки.

Это при большой выборке, а при малой n-1

92 Среднее квадратичное отклонение. Методика вычисления, применение в деятельности врача.

Приближенный метод оценки колеблемости вариационного ряда - это определение лимита, т.е. минимального и максимального значе­ния количественного признака, и амплитуды - т.е. разности между наибольшим и наименьшим значением вариант (Vmax - Vmin). Одна­ко лимит и амплитуда не учитывают значений вариант внутри ряда.

Основной общепринятой мерой колеблемости количественного приз­нака в пределах вариационного ряда является σ - сигма).

Средняя длительность лечения в обеих больницах одинакова, од­нако во второй больнице колебания были значительнее.

Методика расчета среднего квадратического отклонения включает следующие этапы:

2. Определяют отклонения отдельных вариант от средней арифмети­ческой (V-M=d). В медицинской статистике отклонения от средней обозначаются как d (deviate). Сумма всех от­клонений равняется нулю (графа 3. табл. 5).

3. Возводят каждое отклонение в квадрат (графа 4. табл. 5).

4. Перемножают квадраты отклонений на соответствующие частоты d2*p (графа 5, табл. 5).

5. Вычисляют среднее квадратическое отклонение по формуле:

при n больше 30,или
. при n меньше либо равно 30, где n - число всех вариант

Методика расчета среднего квадратического отклонения приведе­на в таблице 5.

Среднее квадратическое отклонение позволяет установить сте­пень типичности средней, пределы рассеяния ряда, сравнить колеб­лемость нескольких рядов распределения. , коэффициент вариации (Cv)

Таблица 5

Число дней V

Число больных Ρ

М=20 n=95 Σ=252

Пример: по данным специального исследования средний рост мальчиков 7 лет в городе N составил 117.7 см (σ=5. 1 см), а сред­ний вес - 21,7 кг (σ=2,4 кг). Оценить колеблемость роста и веса путем сравнения средних квадратических отклонений нельзя, т. к. вес и рост - величины именованные. Поэтому используется относи­тельная величина - коэффициент вариации:

,

Сравнение коэффициентов вариации роста (4.3%) и веса (11.2%) показывает, что вес имеет более высокий коэффициент вариации,следовательно,является менее устойчивым признаком.

Чем выше коэффициент вариации,

Средние величины широко применяются в повседневной работе ме­дицинских работников. Они используются для характеристики Физи­ческого развития, основных антропометрических признаков: рост, вес. окружность груди, динамометрия и т.д. Средние величины при­меняются для оценки состояния больного путем анализа физиологи­ческих, биохимических сдвигов в организме: уровня артериального давления, частоты сердечных сокращений. температуры тела, уровня биохимических показателей, содержания гормонов и т. д. Широкое применение средние величины нашли при анализе деятельности лечеб­но-профилактических учреждений, например: при анализе работы ста­ционаров вычисляются показатели среднегодовой занятости койки, средней длительности пребывания больного на койке и т. д.

среднее квадратичес­кое отклонение (σ - сигма)

1. Находят среднюю арифметическую величину (Μ).

Величина среднего квадра­тического отклонения обычно используется для сравнения колеблемости однотипных рядов. Если сравниваются два ряда с разными признаками (рост и масса тела, средняя длительность лечения в стационаре и больничная летальность и т.д.), то непосредственное сопоставление размеров сигм невозможно, т.к. среднеквадратичес­кое отклонение - именованная величина, выраженная в абсолютных числах. В этих случаях применяют коэффициент вариации (Cv ) , представляющий собой относительную величину: процентное отноше­ние среднего квадратического отклонения к средней арифметической.

Коэффициент вариации вычисляется по формуле:

Чем выше коэффициент вариации, тем большая изменчивость данно­го ряда. Считают, что коэффициент вариации свыше 30 % свиде­тельствует о качественной неоднородности совокупности.

81. Среднее квадратическое отклонение, методика расчета, применение.

Приближенный метод оценки колеблемости вариационного ряда - определение лимита и амплитуды, однако не учитывают значений вариант внутри ряда. Основной общепринятой мерой колеблемости количественного приз­нака в пределах вариационного ряда является среднее квадратичес­кое отклонение (σ - сигма) . Чем больше среднее квадратическое отклонение, тем степень ко­леблемости данного ряда выше.

Методика расчета среднего квадратического отклонения включает следующие этапы:

1. Находят среднюю арифметическую величину (Μ).

2. Определяют отклонения отдельных вариант от средней арифмети­ческой (d=V-M). В медицинской статистике отклонения от средней обозначаются как d (deviate). Сумма всех от­клонений равняется нулю.

3. Возводят каждое отклонение в квадрат d2.

4. Перемножают квадраты отклонений на соответствующие частоты d2*p.

5. Находят сумму произведений (d2*p)

6. Вычисляют среднее квадратическое отклонение по формуле:

При n больше 30,или при n меньше либо равно 30, где n - число всех вариант.

Значение среднего квадратичного отклонения:

1. Среднее квадратическое отклонение характеризует разброс вариант относительно средней величины (т.е. колеблемость вариационного ряда). Чем больше сигма, тем степень разнообразия данного ряда выше.

2. Среднее квадратичное отклонение используется для сравнительной оценки степени соответствия средней арифметической величины тому вариационному ряду, для которого она вычислена.

Вариации массовых явлений подчиняются закону нормального распределения. Кривая, отображающая это распределение, имеет вид плавной колоколообразной симметричной кривой (кривая Гаусса). Согласно теории вероятности в явлениях, подчиняющихся закону нормального распределения, между значениями средней арифметической и среднего квадратического отклонения существует строгая математическая зависимость. Теоретическое распределение вариант в однородном вариационном ряду подчиняется правилу трех сигм.

Если в системе прямоугольных координат на оси абсцисс отложить значения количественного признака (варианты), а на оси ординат - частоты встречаемости вариант в вариационном ряду, то по сторонам от средней арифметической равномерно располагаются варианты с большими и меньшими значениями.

Установлено, что при нормальном распределении признака:

68,3% значений вариант находится в пределах М1

95,5% значений вариант находится в пределах М2

99,7% значений вариант находится в пределах М3

3. Среднее квадратическое отлонение позволяет установить значения нормы для клинико-биологических показателей. В медицине интервал М1 обычно принимается за пределы нормы для изучаемого явления. Отклонение оцениваемой величины от средней арифметической больше, чем на 1 указывает на отклонение изучаемого параметра от нормы.

4. В медицине правило трех сигм применяется в педиатрии для индивидуальной оценки уровня физического развития детей (метод сигмальных отклонений), для разработки стандартов детской одежды

5. Среднее квадратическое отклонение необходимо для характеристики степени разнообразия изучаемого признака и вычисления ошибки средней арифметической величины.

Величина среднего квадра­тического отклонения обычно используется для сравнения колеблемости однотипных рядов. Если сравниваются два ряда с разными признаками (рост и масса тела, средняя длительность лечения в стационаре и больничная летальность и т.д.), то непосредственное сопоставление размеров сигм невозможно, т.к. среднеквадратичес­кое отклонение - именованная величина, выраженная в абсолютных числах. В этих случаях применяют коэффициент вариации (Cv ) , представляющий собой относительную величину: процентное отноше­ние среднего квадратического отклонения к средней арифметической.

Коэффициент вариации вычисляется по формуле:

Чем выше коэффициент вариации, тем большая изменчивость данно­го ряда. Считают, что коэффициент вариации свыше 30 % свиде­тельствует о качественной неоднородности совокупности.

Средняя арифметическая и средняя гармоническая величины

Сущность и значение средних величин, их виды

Наиболее распространенной формой статистического показателя является средняя величина . Показатель в форме средней величи­ны выражает типичный уровень признака в совокупности. Широкое применение средних величин объясняется тем, что они позволяют и сравнивать значения признака у единиц, относящихся к разным сово­купностям. Например, можно сравнивать среднюю продолжитель­ность рабочего дня, средний тарифный разряд рабочих, средний уровень заработной платы по различным предприятиям.

Сущность средних величин заключается в том, что в них взаи­мопогашаются отклонения значений признака у отдельных единиц со­вокупности, обусловленные действием случайных факторов. Поэтому средние величины должны рассчитываться для достаточно много­численных совокупностей (в соответствии с законом больших чи­сел). Надежность средних величин зависит также от колеблемости значений признака в совокупности. В общем случае, чем меньше ва­риация признака и чем больше совокупность, по которой определяет­ся средняя величина, тем она надежнее.

Типичность средней величины непосредственным образом свя­зана также с однородностью статистической совокупности. Сред­няя величина только тогда будет отражать типичный уровень призна­ка, когда она рассчитана по качественно однородной совокупности. В противном случае метод средних используется в сочетании с методом группировок. Если совокупность неоднородна, то общие средние заменяются или дополняются групповыми средними, рассчитанными по качественно однородным группам.

Выбор вида средних определяется экономическим содержание ем исследуемого показателя и исходных данных. Наиболее часто в статистике применяются следующие виды средних величин: степен­ные средние (арифметическая, гармоническая, геометрическая, квадратическая, кубическая и т. д.), средняя хронологическая, а также структурные средние (мода и медиана).

Средняя арифметическая величина наиболее часто встреча­ется в социально-экономических исследованиях. Средняя арифмети­ческая применяется в форме простой средней и взвешенной средней.

Рассчитывается по несгруппированным данным на основании формулы (4.1):

где x - индивидуальные значения признака (варианты);

n - число единиц совокупности.

Пример. Требуется найти среднюю выработку рабочего в бри­гаде, состоящей из 15 человек, если известно количество изделий, произведенных одним рабочим (шт.): 21; 20; 20; 19; 21; 19; 18; 22; 19; 20; 21; 20; 18; 19; 20.

Средняя арифметическая простая рассчитывается по несгруппированным данным на основании формулы (4.2):

где f - частота повторения соответствующего значения признака (варианта);

∑f - общее число единиц совокупности (∑f = n).

Пример . На основании имеющихся данных о распределении ра­бочих бригады по количеству выработанных ими изделий требуется найти среднюю выработку рабочего в бригаде.

Примечание 1. Средняя величина признака в совокупности может рассчитываться как на основании индивидуальных значений признака, так и на основании групповых (частных) средних, рассчитанных по отдельным частям совокупности. При этом используется формула средней арифметической взвешенной, а в качестве вариантов значений признака рассматриваются групповые (частные) средние (x j ).

Пример. Имеются данные о среднем стаже рабочих по цехам завода. Требуется определить средний стаж рабочих в целом по заводу.

Примечание 2. В том случае, когда значения осредняемого признака зада­ны в виде интервалов, при расчете средней арифметической величины в качестве значений признака в группах принимают средние значения этих интервалов (х ’) . Таким образом, интервальный ряд преобразуется в дискретный. При этом величи­на открытых интервалов, если таковые имеются (как правило, это первый и по­следний), условно приравнивается к величине интервалов, примыкающих к ним.

Пример. Имеются данные о распределении рабочих предпри­ятия по уровню заработной платы.

Средняя гармоническая величина является модификацией средней арифметической. Применяется в тех случаях, когда известны индивидуальные значения признака, т. е. варианты (x ), и произведений вариант на частоту (xf = М), но неизвестны сами частоты (f ).

Средняя гармоническая взвешенная рассчитывается по формуле (4.3):

Пример . Требуется определить средний размер заработной платы работников объединения, состоящего из трех предприятий, если известен фонд заработной платы и средняя заработная плата работников по каждому предприятию.

Средняя гармоническая простая в практике статистики исполь­зуется крайне редко. В тех случаях, когда xf = Mm = const, средняя гар­моническая взвешенная превращается в среднюю гармоническую простую (4.4):

Пример . Две машины прошли один и тот же путь. При этом одна из них двигалась со скоростью 60 км/ч, вторая - со скоростью 80 км/ч. Требуется определить среднюю скорость машин в пути.

Другие виды степенных средних. Средняя хронологическая

Средняя геометрическая величина используется при расчете средних показателей динамики. Средняя геометрическая применяется в форме простой средней (для несгруппированных данных) и взве­шенной средней (для сгруппированных данных).

Средняя геометрическая простая (4.5):

где n - число значений признака;

П - знак произведения.

Средняя геометрическая взвешенная (4.6):

Средняя квадратическая величина используется при расчете показателей вариации. Применяется в форме простой и взвешенной.

Средняя квадратическая простая (4.7):

Средняя квадратическая взвешенная (4.8):

Средняя кубическая величина используется при расчете показателей асимметрии и эксцесса. Применяется в форме простой взвешенной.

Средняя кубическая простая (4.9): мода определяется достаточно просто - по максимальному пока­зателю частоты. В интервальном вариационном ряду мода приблизительно соответствует центру модального интервала, т. е. интервала, имеющего большую частоту (частость). частота интервала, следующего за модальным.

Медианой (Ме) называется значение признака, расположенное в середине ранжированного ряда. Под ранжированным понимают ряд, упорядоченный в порядке возрастания или убывания значений признака. Медиана делит ранжированный ряд на две части, одна из которых имеет значения признака не большие, чем медиана, а друга - не меньшие.

Для ранжированного ряда с нечетным числом членов медиа­ной является варианта, расположенная в центре ряда. Положение ме­дианы определяется порядковым номером единицы ряда в соответст­вии с формулой (4.13):

где n - число членов ранжированного ряда.

Для ранжированного ряда с четным числом членов медиа­ной является среднее арифметическое из двух смежных значений, на­ходящихся в центре ряда.

Частота медианного интервала.

Пример. Рабочие бригады, состоящей из 9 чел., имеют сле­дующие тарифные разряды: 4; 3; 4; 5; 3; 3; 6; 2;6. Требуется опреде­лить модальное и медианное значения тарифного разряда.

Поскольку в данной бригаде больше всего рабочих 3-го разряда, то этот разряд и будет модальным, т. е. Мо = 3.

Для определения медианы осуществим ранжирование исходного ряда в порядке возрас­тания значений признака:

2; 3; 3; 3; 4; 4; 5; 6; 6.

Центральным в этом ряду является пятое по счету значение признака. Соответственно Ме = 4.

Пример. Требуется определить модальный и медианный тарифный разряд рабочих завода по данным следующего ряда распределения.

Поскольку исходный ряд распределения является дискретным, то модальное значение определяется по максимальному показателю частоты. В данномпримере на заводе больше всего рабочих 3-го разряда (f max = 30), т.е. этот разряд является модальным (Мо = 3).

Определим положение медианы. Исходный ряд распределения построен на основании ранжированного ряда, упорядоченного по воз­растанию значений признака. Середина ряда находится между 50-м и 51-м порядковыми номерами значений признака. Выясним, к какой группе относятся рабочие с этими порядковыми номерами. Для это­го рассчитаем накопленные частоты. Накопленные частоты ука­зывают на то, что медианное значение тарифного разряда равно трем (Ме = 3), поскольку значения признака с порядковыми номе­рами от 39-го до 68-го, в том числе 50-е и 51-е, равны 3.

Пример. Требуется определить модальную и медианную зара­ботную плату рабочих завода по данным следующего ряда распределения.

Поскольку исходный ряд распределения является интерваль­ным, то модальное значение заработной платы рассчитывается по формуле. При этом модальным является интервал 360-420 с максимальной частотой, равной 30.

Медианное значение заработной платы также рассчитывает­ся по формуле. При этом медианным является интервал 360-420, на­копленная частота которого равна 70, тогда как накопленная час­тота предыдущего интервала составляла только 40 при общем числе единиц, равном 100.

Стоит отметить, что у такого расчета дисперсии есть недостаток – она получается смещенной, т.е. ее математическое ожидание не равно истинному значению дисперсии. Подробней об этом . В то же время не все так плохо. При увеличении объема выборки она все-таки приближается к своему теоретическому аналогу, т.е. является асимптотически не смещенной. Поэтому при работе с большими размерами выборок можно использовать формулу выше.

Язык знаков полезно перевести на язык слов. Получится, что дисперсия — это средний квадрат отклонений. То есть вначале рассчитывается среднее значение, затем берется разница между каждым исходным и средним значением, возводится в квадрат, складывается и затем делится на количество значений в данной совокупности. Разница между отдельным значением и средней отражает меру отклонения. В квадрат возводится для того, чтобы все отклонения стали исключительно положительными числами и чтобы избежать взаимоуничтожения положительных и отрицательных отклонений при их суммировании. Затем, имея квадраты отклонений, мы просто рассчитываем среднюю арифметическую. Средний – квадрат – отклонений. Отклонения возводятся в квадрат, и считается средняя. Разгадка заключается всего в трех словах.

Однако в чистом виде, как, например, средняя арифметическая, или индекс, дисперсия не используется. Это скорее вспомогательный и промежуточный показатель, который необходим для других видов статистического анализа. У нее даже единицы измерения нормальной нет. Судя по формуле, это квадрат единицы измерения исходных данных. Без бутылки, как говорится, не разберешься.

{module 111}

Дабы вернуть дисперсию в реальность, то есть использовать в более приземленных целей, из нее извлекают квадратный корень. Получается так называемое среднеквадратичное отклонение (СКО) . Встречаются названия «стандартное отклонение» или «сигма» (от названия греческой буквы). Формула стандартного отклонения имеет вид:

Для получения этого показателя по выборке используют формулу:

Как и с дисперсией, есть и немного другой вариант расчета . Но с ростом выборки разница исчезает.

Среднеквадратичное отклонение, очевидно, также характеризует меру рассеяния данных, но теперь (в отличие от дисперсии) его можно сравнивать с исходными данными, так как единицы измерения у них одинаковые (это явствует из формулы расчета). Но и этот показатель в чистом виде не очень информативен, так как в нем заложено слишком много промежуточных расчетов, которые сбивают с толку (отклонение, в квадрат, сумма, среднее, корень). Тем не менее, со среднеквадратичным отклонением уже можно работать непосредственно, потому что свойства данного показателя хорошо изучены и известны. К примеру, есть такое правило трех сигм , которое гласит, что у данных 997 значений из 1000 находятся в пределах ±3 сигмы от средней арифметической. Среднеквадратичное отклонение, как мера неопределенности, также участвует во многих статистических расчетах. С ее помощью устанавливают степень точности различных оценок и прогнозов. Если вариация очень большая, то стандартное отклонение тоже получится большим, следовательно, и прогноз будет неточным, что выразится, к примеру, в очень широких доверительных интервалах.

Коэффициент вариации

Среднее квадратическое отклонение дает абсолютную оценку меры разброса. Поэтому чтобы понять, насколько разброс велик относительно самих значений (т.е. независимо от их масштаба), требуется относительный показатель. Такой показатель называется коэффициентом вариации и рассчитывается по следующей формуле:

Коэффициент вариации измеряется в процентах (если умножить на 100%). По этому показателю можно сравнивать самых разных явлений независимо от их масштаба и единиц измерения. Данный факт и делает коэффициент вариации столь популярным.

В статистике принято, что, если значение коэффициента вариации менее 33%, то совокупность считается однородной, если больше 33%, то – неоднородной. Мне здесь трудно что-то прокомментировать. Не знаю, кто и почему так определил, но это считается аксиомой.

Чувствую, что я увлекся сухой теорией и нужно привести что-то наглядное и образное. С другой стороны все показатели вариации описывают примерно одно и то же, только рассчитываются по-разному. Поэтому разнообразием примеров блеснуть трудно, Отличаться могут лишь значения показателей, но не их суть. Вот и сравним, как отличаются значения различных показателей вариации для одной и той же совокупности данных. Возьмем пример с расчетом среднего линейного отклонения (из ). Вот исходные данные:

И график для напоминания.

По этим данным рассчитаем различные показатели вариации.

Среднее значение – это обычная средняя арифметическая.

Размах вариации – разница между максимумом и минимумом:

Среднее линейное отклонение считается по формуле:

Стандартное отклонение:

Расчет сведем в табличку.

Как видно, среднее линейное и среднеквадратичное отклонение дают похожие значения степени вариации данных. Дисперсия – это сигма в квадрате, поэтому она всегда будет относительно большим числом, что, собственно, ни о чем не говорит. Размах вариации – это разница между крайними значениями и может говорить о многом.

Подведем некоторые итоги.

Вариация показателя отражает изменчивость процесса или явления. Ее степень может измеряться с помощью нескольких показателей.

1. Размах вариации – разница между максимумом и минимумом. Отражает диапазон возможных значений.
2. Среднее линейное отклонение – отражает среднее из абсолютных (по модулю) отклонений всех значений анализируемой совокупности от их средней величины.
3. Дисперсия – средний квадрат отклонений.
4. Среднеквадратичное отклонение – корень из дисперсии (среднего квадрата отклонений).
5. Коэффициент вариации – наиболее универсальный показатель, отражающий степень разброса значений независимо от их масштаба и единиц измерения. Коэффициент вариации измеряется в процентах и может быть использован для сравнения вариации различных процессов и явлений.

Таким образом, в статистическом анализе существует система показателей, отражающих однородность явлений и устойчивость процессов. Часто показатели вариации не имеют самостоятельного смысла и используются для дальнейшего анализа данных (расчет доверительных интервалов

Инструкция

Пусть имеется несколько чисел, характеризующих -либо однородные величины. Например, результаты измереений, взвешиваний, статистических наблюдений и т.п. Все представленные величины должны измеряться одной и той же измерения. Чтобы найти квадратичное отклонение, проделайте следующие действия.

Определите среднее арифметическое всех чисел: сложите все числа и разделите сумму на общее количество чисел.

Определите дисперсию (разброс) чисел: сложите квадраты найденных ранее отклонений и разделите полученную сумму на количество чисел.

В палате лежат семь больных с температурой 34, 35, 36, 37, 38, 39 и 40 градусов Цельсия.

Требуется определить среднее отклонение от средней .
Решение:
« по палате»: (34+35+36+37+38+39+40)/7=37 ºС;

Отклонения температур от среднего (в данном случае нормального значения): 34-37, 35-37, 36-37, 37-37, 38-37, 39-37, 40-37, получается: -3, -2, -1, 0, 1, 2, 3 (ºС);

Разделите полученную раннее сумму чисел на их количество. Для точности вычисления лучше воспользоваться калькулятором. Итог деления является средним арифметическим значением слагаемых чисел.

Внимательно отнеситесь ко всем этапам расчета, так как ошибка хоть в одном из вычислений приведет к неправильному итоговому показателю. Проверяйте полученные расчеты на каждом этапе. Среднее арифметическое число имеет тот же измеритель, что и слагаемые числа, то есть если вы определяете среднюю посещаемость , то все показатели у вас будут «человек».

Данный способ вычисления применяется только в математических и статистических расчетах. Так, например, среднего арифметического значения в информатике имеет другой алгоритм вычисления. Среднее арифметическое значение является очень условным показателем. Оно показывает вероятность того или иного события при условии, что у него только один фактор либо показатель. Для наиболее глубокого анализа необходимо учитывать множество факторов. Для этого применяется вычисление более общих величин.

Среднее арифметическое - одна из мер центральной тенденции, широко используемая в математике и статистических расчетах. Найти среднее арифметическое число для нескольких значений очень просто, но у каждой задачи есть свои нюансы, знать которые для выполнения верных расчетов просто необходимо.

Количественных результатов проведенных подобных опытов.

Как найти среднее арифметическое число

Поиск среднего арифметического числа для массива чисел следует начинать с определения алгебраической суммы этих значений. К примеру, если в массиве присутствуют числа 23, 43, 10, 74 и 34, то их алгебраическая сумма будет равна 184. При записи среднее арифметическое обозначается буквой μ (мю) или x (икс с чертой). Далее алгебраическую сумму следует разделить на количество чисел в массиве. В рассматриваемом примере чисел было пять, поэтому среднее арифметическое будет равно 184/5 и составит 36,8.

Особенности работы с отрицательными числами

Если в массиве присутствуют отрицательные числа, то нахождение среднего арифметического значения происходит по аналогичному алгоритму. Разница имеется только при рассчетах в среде программирования, или же если в задаче есть дополнительные условия. В этих случаях нахождение среднего арифметического чисел с разными знаками сводится к трем действиям:

1. Нахождение общего среднего арифметического числа стандартным методом;
2. Нахождение среднего арифметического отрицательным чисел.
3. Вычисление среднего арифметического положительных чисел.

Ответы каждого из действий записываются через запятую.

Натуральные и десятичные дроби

Если массив чисел представлен десятичными дробями, решение происходит по методу вычисления среднего арифметического целых чисел, но сокращение результата производится по требованиям задачи к точности ответа.

При работе с натуральными дробями их следует привести к общему знаменателю, который умножается на количество чисел в массиве. В числителе ответа будет сумма приведенных числителей исходных дробных элементов.

Читайте также: