Средние величины и показатели вариации

Глава 5. СРЕДНИЕ ВЕЛИЧИНЫ И ПОКАЗАТЕЛИ ВАРИАЦИИ

5.1. Сущность и значение средней величины

Средняя величина – это обобщающий показатель, характеризующий типичный уровень явления. Он выражает величину признака, отнесенную к единице совокупности.

Средняя всегда обобщает количественную вариацию признака, т.е. в средних величинах погашаются индивидуальные различия единиц совокупности, обусловленные случайными обстоятельствами. Так, заработная плата у каждого из работников предприятия может быть разной, потому что работники различаются по профессиям, специальностям, стажу, месту работы, занимаемой должности, квалификации, однако при расчете средней заработной платы эти различия, некоторым образом, выравниваются.

Вычисление среднего – один из распространенных приемов обобщения; средний показатель отражает то общее, что характерно (типично) для всех единиц изучаемой совокупности, в то же время он игнорирует различия отдельных единиц. В каждом явлении и его развитии имеет место сочетание случайности и необходимости. При исчислении средних в силу действия закона больших чисел случайности взаимопогашаются, уравновешиваются, поэтому можно абстрагироваться от несущественных особенностей явления, от количественных значений признака в каждом конкретном случае. В способности абстрагироваться от случайности отдельных значений, колебаний и заключена научная ценность средних как обобщающих характеристик совокупностей.

Характеристика признака в данной совокупности будет более или менее типичной, если средняя будет определяться для совокупностей, состоящих из:

■ качественно однородных единиц.

■ достаточно большого числа единиц.

■ единиц, которые находятся в нормальном, естественном состоянии.

5.2. Виды средних и способы их вычисления

К степенным средним относятся такие наиболее известные и часто применяемые виды, как средняя геометрическая, средняя арифметическая и средняя квадратическая.

В качестве структурных средних рассматриваются мода и медиана.

Степенные средние в зависимости от представления исходных данных могут быть простыми и взвешенными.

Простая средняя считается по не сгруппированным данным и имеет следующий общий вид:

,

где - варианта (значение) осредняемого признака; m – показатель степени средней; n – число вариант.

Взвешенная средняя считается по сгруппированным данным и имеет общий вид

,

где - варианта (значение) осредняемого признака или серединное значение интервала, в котором измеряется варианта; m – показатель степени средней;

f– частота, показывающая, сколько раз встречается i-е значение осредняемого признака.

Общие формулы расчета степенных средних имеют показатель степени (m). В зависимости от того, какое значение он принимает, различают следующие виды степенных средних:

средняя гармоническая, если m = -1;

средняя геометрическая, если m → 0;

средняя арифметическая, если m = 1;

средняя квадратическая, если m = 2;

средняя кубическая, если m = 3.

Формулы степенных средних приведены в табл. 8. Если рассчитать все виды средних для одних и тех же исходных данных, то значения их окажутся неодинаковыми. Здесь действует правило мажорантности средних: с увеличением показателя степени m увеличивается и соответствующая средняя величина:

.

В статистической практике чаще, чем остальные виды средних взвешенных, используются средняя арифметическая и средняя гармоническая взвешенные. Выбор вида степенной средней определяется экономическим содержанием задачи и наличием данных (табл.8).

Таблица 8

Виды степенных средних

Вид степенной средней Показатель степени (m) Формула расчета простая взвешенная гармоническая-1m=xfгео метрическая 0П символ произведения = арифметическая1 == квадратическая2 == кубическая3 ==

Рассмотрим среднюю арифметическую простую и взвешенную. Приведем в качестве примера расчет среднего возраста студентов в группе из 10 человек:


Средний возраст рассчитаем по формуле простой средней:

= (лет)

Сгруппируем исходные данные. Получим следующий ряд распределения:


В результате группировки получаем новый показатель – частоту, указывающую число студентов в возрасте Х лет. Следовательно, средний возраст студентов группы будет рассчитываться по формуле взвешенной средней:

= (лет).

Средняя арифметическая обладает рядом свойств, которые имеют практическое значение для вычисления средней по данным вариационного ряда. В качестве примера используем таблицу, в которой содержатся данные о сделках по продаже акций фирмы Х, осуществленных в течение недели (табл.9):

Таблица 9

Данные по продаже акций фирмы Х


Рассчитаем средний курс продаж акций для данного примера по формуле средней арифметической взвешенной и используем полученные данные в последующих расчетах:

.

Основные свойства средней арифметической

  1. Произведение средней величины на сумму частот равно сумме произведений отдельных значений признака на соответствующие им частоты:

Используя данные таблицы, получим следующее равенство:

2. При уменьшении или увеличении частот каждого значения признака х в А раз величина средней арифметической не меняется:

Так, в нашем примере было бы удобнее рассчитывать среднюю, предварительно поделив все веса на 100:

Данное правило дает, таким образом, возможность:

  1. Выражать многозначные числа частот в более компактных единицах измерения.
  2. Заменять конкретные значения частот удельными весами, тогда:

,

если d выражена в %, или

,

если d представлена в долях единицы

.

3. Если каждое индивидуальное значение признака умножить или разделить на постоянное число А, то и среднее значение увеличится или уменьшится во столько же раз.

.

Предположим, что курс продажи в каждом случае возрастает в 1,2 раза, тогда и средний курс возрастет в 1,2 раза.

руб.

4. Если к каждому индивидуальному значению прибавить или из каждого значения вычесть постоянное число А, то и средняя величина возрастет или уменьшится на это же число А:

.

Используя это правило, вычтем из значений курса акций 100 рублей. Тогда:

руб.

руб.

5. Сумма отклонений индивидуальных значений признака от его среднего значения равна нулю:

.

Тогда для нашего примера:

.

Средняя гармоническая имеет более сложную конструкцию, чем средняя арифметическая. Среднюю гармоническую чаще всего применяют для расчетов тогда, когда в качестве весов используются не единицы совокупности – носители признака, а произведения этих единиц на значения признака (т.е. М= X · f).

Например, есть данные о реализации продукта одного вида на трех рынках города:


Требуется рассчитать среднюю цену, по которой продавался товар.

При расчете средней цены на один и тот же товар, который продается в трех разных торговых точках, необходимо выручку от реализации продукции поделить на количество реализованной продукции.

Предположим, мы располагаем только данными о ценах на трех рынках и о количестве товара, проданного на каждом из них. При этом цены на отдельных рынках выступают в качестве вариантов, а количество проданного товара – в качестве весов. Тогда средняя цена определится по средней арифметической взвешенной, то есть:

= руб.

Теперь предположим, что количество проданного товара неизвестно, а известны лишь цены и выручка от продажи. В этом случае логические рассуждения остаются теми же, но расчет следует записать в форме средней гармонической взвешенной.

Чтобы исчислить среднюю, обозначим x·f=M, откуда f=M/x. Преобразуем формулу средней арифметической так, чтобы по имеющимся данным x и M можно было исчислить среднюю.

В формулу средней арифметической взвешенной вместо x·f подставим M, вместо f – отношение M/x и получим формулу средней гармонической взвешенной:

,

= руб.

Результат, как и следовало ожидать, получился тот же.

Рассмотрим еще один пример расчета средней гармонической взвешенной. Допустим, в результате проверки двух партий муки потребителям установлено, что в первой партии муки высшего сорта было 3942 кг., что составляет 70,4 % общего веса муки этой партии. Во второй партии муки высшего сорта было 6520 кг, что составляет 78,6 % общего веса муки этой партии. Необходимо определить процент муки высшего сорта  в среднем по первой и второй партиям вместе.

Средний процент муки высшего сорта по двум партиям определяем по формуле средней гармонической взвешенной:

= или 75,3 %.

В том случае, если объемы явлений, т.е. произведения, по каждому признаку равны, применяется средняя гармоническая простая. К средней гармонической простой следует прибегать в случаях определения, например, средние затраты труда, времени, материалов на единицу продукции, не одну деталь по двум (трем, четырем и т.д.) предприятиям, рабочим, занятым изготовлением одного и того же вида продукции, одной и той же детали, изделия.

Например, две автомашины прошли один и тот же путь: одна со скоростью 60 км/ч, а вторая – 80 км/ч. Тогда средняя скорость составит:

= км/ч.

Таким образом,

=,

где - сумма обратных значений вариант, n – число вариант.

Cредняя геометрическая – это величина, применяемая для расчета средних из относительных величин. Поэтому средняя геометрическая используется в расчетах средних темпов роста. Формула средней геометрической выглядит следующим образом:

,

где x – цепной коэффициент роста (варьирующий признак);

n – количество периодов, по которым имеются коэффициенты роста.

Предположим, имеются следующие данные о тепах роста товарооборота фирмы за ряд лет.

Годы2000 2001 2002 2003 Темпы роста товарооборота (в %)102,5109,2112,4101,5

Определим средние темпы роста с 2000 по 2003 годы. Значение темпов роста переводим из процентов в коэффициенты и подставляем в формулу средней геометрической.

Таким образом, средние темпы роста товарооборота фирмы составляют 1,063 или 106,3 % в год.

Среднегодовые темпы роста могут рассчитываться с использованием другой формулы средней геометрической:

,

где у1 – абсолютная величина явления в первом году периода;

уn – абсолютная величина явления в последнем году периода;

n – количество лет периода.

Пример. Стоимость продукции, произведенной фирмой Х в 1991 г., составила 200000 долл., а в 1999 г. – 1200000 долл. Определим средние ежегодные (среднегодовые) темпы роста выпуска продукции фирмой Х:

Следовательно, средние ежегодные темпы роста составляли 1,251 или 125,1 %.

Удобство данной формулы состоит в том, что при расчетах не требуются данные за все годы периода.

Решение о том, какая из двух приведенных формул средней геометрической должна использоваться в каждом конкретном случае, принимается в зависимости от наличия исходных данных.

Применение средней геометрической справедливо, если годовые коэффициенты роста за последующие годы составляют непрерывно возрастающий (или непрерывно убывающий) ряд. В случае же, когда среди данных имеются показатели роста как больше, так и меньше 1, расчет приобретает условный характер, и это надо специально оговаривать.

5.3. Структурные средние величины

Модой называется вариант признака, имеющий наибольшую частоту в данном вариационном ряду. Для дискретного ряда определение моды не представляет трудностей. Например, в группе обучается 26 студентов; из них 5 человек имеют возраст 19 лет, 12 – 20 лет, 7 – 21 год, 2 – 23 года. В данном случае модой будет 20 лет.

При исчислении моды для интервального ряда сначала определяется модальный интервал, в пределах которого находится мода, а затем находится приближенное значение модальной величины признака по формуле:

,

где - нижняя граница модального интервала;

h – величина модального интервала;

- частота модального интервала;

- частота интервала, следующего за модальным.

Мода является наиболее распространенной и, в этом смысле, наиболее типичной величиной в распределении, но она уступает средней величине, которая характеризует совокупность в целом, в то время как мода определяет размер признака, свойственный, хотя и значительной, но все же части совокупности.

Медианой называется вариант, который приходится на середину ряда, расположенного в порядке возрастания или убывания численных значений признака. Медиана делит ряд на две равные части. Например, имеются следующие данные о возрасте 7 студентов (в годах): 19, 20, 21, 23, 24, 25, 28. В этом ряду медианой является возраст 23 года, так как это число равноудалено от начала и от конца ряда, находится на 4 месте.

Существует следующее правило нахождения медианы дискретного ряда: нужно к сумме частот ряда прибавить единицу и результат поделить пополам. В приведенном выше примере сумма частот равна 7, следовательно медиана будет находиться на , т.е. на 4 месте.

В тех случаях, когда ряд состоит из четного числа членов, медиана будет равна средней из двух значений признака, расположенных в середине ряда.

При исчислении медианы для интервального ряда вначале определяют медианный интервал, в пределах которого находится медиана, а затем приближенное значение медианы по формуле:

,

где - нижняя граница интервала, который содержит медиану;

h – величина интервала;

- сумма частот или число членов ряда;

- сумма накопленных частот интервалов, предшествующих медианному;

- частота медианного интервала.

Величина моды и медианы, как правило, отличается от величины средней и совпадает с ней только в случае симметрии вариационного ряда.

5.4. Показатели вариации признаков

Средние величины дают обобщающую характеристику совокупности по варьирующим признакам, показывают типичный для данных условий уровень этих признаков. Но наряду со средними величинами большое практическое и теоретическое значение имеет изучение отклонений от средних. Для всесторонней характеристики рядов распределения необходимы показатели вариации, определяющие меру, степень колеблемости отдельных значений признака от средней. В статистике применяется несколько показателей вариации: размах вариации, среднее линейное (абсолютное) отклонение, дисперсия, среднее квадратическое отклонение и коэффициент вариации.

Размах вариации характеризует пределы изменения варьирующего признака. Он рассчитывается как разность между максимальным и минимальным значениями признака:

.

Величина размаха зависит только от двух крайних значений признака, что делает его в известной мере случайной величиной. Поэтому возникает необходимость в других показателях, которые бы учитывали отклонения от средней всех значений признака. Одним из таких показателей является среднее линейное (абсолютное) отклонение.

Среднее линейное отклонение представляет собой среднюю арифметическую из абсолютных отклонений отдельных вариант от средней.

Так как алгебраическая сумма отклонений индивидуальных значений признака от средней равна нулю (одно из свойств средней арифметической), то при исчислении среднего линейного отклонения принимаются во внимание только абсолютные значения отклонений, без учета знаков

(+ или -). Если средняя арифметическая из отклонений является простой, то среднее линейное отклонение рассчитывается по формуле:

.

Если же средняя арифметическая из отклонений – взвешенная, то среднее линейное отклонение:

.

Среднее линейное отклонение – число именованное; его размерность соответствует размерности варьирующего признака.

Дисперсией называется средний квадрат отклонений индивидуальных значений признака от их средней величины:

.

При наличии частот употребляется формула взвешенной дисперсии:

.

Дисперсия имеет большое значение в анализе. Однако ее применение как меры вариации в ряде случаев бывает не совсем удобным, потому что размерность дисперсии равна квадрату размерности изучаемого признака. Поэтому в случае ее вычисления для измерения вариации признака из дисперсии извлекают квадратный корень и получают среднее квадратическое отклонение:

или  .

Это наиболее распространенный показатель вариации признака, он имеет ту же размерность, что и признак.

Чем меньше размах вариации, среднее отклонение, дисперсия и среднее квадратическое отклонение, тем совокупность более однородна и тем типичнее средняя величина. Недостаток всех этих показателей вариации в том, что они имеют размерность и показывают только абсолютную меру вариации. Чтобы сопоставить показатель вариации со средней рассчитывают относительную величину – коэффициент вариации ():

%.

Коэффициент вариации представляет собой отношение среднего квадратического отклонения к средней арифметической. Чем этот коэффициент меньше, тем типичнее средняя, тем колеблемость признака меньше, а совокупность однороднее.

По величине коэффициента вариации можно судить об интенсивности вариации признака, а следовательно, и об однородности состава изучаемой совокупности. Чем больше величина коэффициента вариации, тем больше неоднородность совокупности. Существует шкала определения степени однородности совокупности в зависимости от значений коэффициента вариации.

Коэффициент вариации , %Степень однородности совокупностиДо 30Однородная30 – 60Средняя60 и болееНеоднородная

Если в совокупности исследуется доля единиц, обладающих тем или иным альтернативным признаком, то дисперсия этого признака определяется по формуле:

,

где q – удельный вес единиц совокупности, не обладающих изучаемым признаком;

p – удельный вес единиц, обладающих данным признаком во всей совокупности.

Пример. В трех партиях продукции, представленных на контроль качества, было обнаружено:

а) первая партия - 1000 изделий, из них 800 годных, 200 бракованных;

б) вторая партия - 800 изделий, из них 720 годных, 80 бракованных;

в) третья партия - 900 изделий, из них годных 855, бракованных 45 единиц продукции.

Определите в целом для всех партий следующие показатели:

а) средний процент годной продукции и средний процент брака;

б) дисперсию, среднее квадратическое отклонение и коэффициент вариации годной продукции.

Решение. Это пример на определение средней величины и показателей вариации альтернативного признака.

Средняя величина альтернативного признака равна р – удельному весу единиц, обладающих данным признаком во всей совокупности.

Дисперсия альтернативного признака определяется:

,

где q – удельный вес единиц совокупности, не обладающих изучаемым признаком.

Рассмотрим расчет данных показателей на нашем примере:

а) Средний процент годной продукции в трех партиях равен:

или 88,0 %.

Средний процент брака:

или 12,0 %.

б) Дисперсия удельного веса годной продукции

Среднее квадратическое отклонение удельного веса годной продукции:

.

Коэффициент вариации удельного веса годной продукции в общем выпуске продукции:

% = 36,4 %.

Правило сложения дисперсий

Если совокупность разбита на группы по факторному признаку, то общая дисперсия признака может быть определена как сумма межгрупповой дисперсии и средней из внутригрупповых дисперсий :

Общая дисперсия характеризует вариацию признака по всей совокупности как результат влияния всех факторов, определяющих индивидуальные различия единиц совокупности.

,

где - дисперсия признака в группе i (внутригрупповая дисперсия);

х – индивидуальное значение признака;

- среднее значение признака в группе i;

n – число наблюдений в группе i.

Средняя из внутригрупповых дисперсий отражает ту часть вариации результативного признака, которая обусловлена действием прочих неучтенных факторов, кроме фактора, по которому осуществлялась группировка. Другими словами, внутригрупповая дисперсия отражает случайную вариацию.

где - среднее значение признака в совокупности.

Межгрупповая дисперсия характеризует вариацию, обусловленную влиянием фактора, положенного в основу группировки.

Отношение межгрупповой дисперсии к общей дает возможность измерить вариацию результативного признака за счет факторного, то есть признака, положенного в основание группировки, и тем самым судить о связи между изучаемыми признаками:

,

где - коэффициент детерминации.

Корень квадратный из коэффициента детерминации называют эмпирическим корреляционным отношением:

.

Эмпирическое корреляционное отношение показывает какую часть общей колеблемости результативного признака определяет изучаемый фактор, т.е. характеризует влияние группировочного признака на результативный признак. Этот показатель принимает значения в интервале [0,1]. Если связь отсутствует, то =0. В этом случае дисперсия групповых средних равна нулю (=0), т.е. все групповые средние равны между собой и межгрупповой вариации нет. Это означает, что группировочный признак не влияет на вариацию исследуемого признака х. Если связь функциональная, то . В этом случае дисперсия групповых средних равна общей дисперсии (( т.е. не будет внутригрупповой дисперсии. Это означает, что группировочный признак полностью определяет вариацию изучаемого признака, а влияние прочих факторных признаков равно нулю. При равной [0,1] связь является умеренной.

Пример. С целью установления зависимости между урожайностью и сортом винограда в одном из хозяйств на основе выборки определили урожай на 10 кустах винограда:

Наименование сорта виноградаЧисло проверенных кустовУрожай винограда с каждого куста, кг.Куст №1Куст № 2Куст № 3Куст №4Куст № 5Сорт «А»3657--Сорт «Б»576859Сорт «В»297---

Исчислите общую, межгрупповую и среднюю из групповых (частных) дисперсий. Определите связь между сортом и его урожайностью.

  1. Групповые средние, т.е. средняя урожайность по каждому сорту винограда, равны:

кг

  1. Определяем среднюю урожайность винограда по хозяйству:

кг.

  1. Определяем внутригрупповую (частную) дисперсию урожайности для каждого сорта отдельно:
  1. Средняя из частных дисперсий:
  1. Межгрупповая дисперсия:
  1. Определяем общую дисперсию урожайности по всей совокупности, используя правило сложения дисперсий:

.

  1. Проверим этот вывод путем расчета общей дисперсии обычным способом:
  1. Определим коэффициент детерминации -

или 26 %.

Таким образом, только на 26 % вариация урожайности обусловлена различиями между сортами, а на 74 % - другими факторами (характером почвы, удобренностью участков, поливом и т.п.)

  1. Определяем эмпирическое корреляционное отношение:

.

Следовательно, можно утверждать, что связь умеренная.

← Предыдущая
Страница 1
Следующая →

Файл

глава 5.doc

глава 5.doc
Размер: 364 Кб

.

Пожаловаться на материал

Статистика. Сущность и значение средней величины. Виды средних и способы их вычисления. Структурные средние величины. Показатели вариации признаков.

У нас самая большая информационная база в рунете, поэтому Вы всегда можете найти походите запросы

Искать ещё по теме...

Похожие материалы:

Вводные слова и сочетания

Вводные слова и сочетания: не являются членами предложения. Вводные слова и замечания делятся на группы по выражаемому им значению. Вставные конструкции.

Что такое гипокауст?

Гипокауст (лат. hypocaustum, от греч. hypó — под, внизу, нижний и kaustós — горячий, раскалѐнный, подогретый) — наиболее распространѐнный тип классической античной, в особенности древнеримской, отопительной системы, предназначенной для обогрева одноэтажных зданий. Тест.

Дефекты рельсов и их обнаружение

Классификация дефектов рельсов и их обнаружение. Остродефектные рельсы. Методы и средства рельсовой дефектоскопии. Дефектоскопия рельсов включает оценку их качества в процессе изготовления.

Сервисология

Сервисология - область знания, рассматривающая сервис как целостный феномен, род социальной реальности. Шпоргалки. Ответы. Предметом изучения являются организация, формы и методы индивидуального обслуживания человека.

Оценка бизнеса

Стратегия ценообразования. Ценовые стратегии. Оценка стоимости бизнеса. Цели и функции, этапы, подходы и методы оценки бизнеса. Предприятия-аналоги при оценке бизнеса. Расчет рыночной стоимости имущества. Интеллектуальная собственность и методы ее оценки. Нематериальные и материальные активов. Стоимость товарного знака.

Сохранить?

Пропустить...

Введите код

Ok