Сводка и группировка данных статистического наблюдения

Глава 3. СВОДКА И ГРУППИРОВКА ДАННЫХ СТАТИСТИЧЕСКОГО НАБЛЮДЕНИЯ

3.1. Понятия сводки и группировки статистических данных

Собранный в процессе статистического наблюдения материал нуждается в определенной обработке, сведение разрозненных данных воедино. Это происходит в процессе выполнения второго этапа статистического исследования, который носит название «статистическая сводка». Она состоит из подсчёта первичного статистического материала (сводка в узком смысле слова), его группировки, а также представления результатов сводки в виде статистических рядов, таблиц и графиков.

Статистическая сводка ведётся по программе, которая составляется заранее. Программа определяет подлежащее и сказуемое сводки. Подлежащее сводки составляют группы, на которые разбивается совокупность явлений. Сказуемое сводки составляют показатели, характеризующие каждую группу и совокупность в целом. Успех сводки во многом зависит от плана её проведения, который содержит указания о последовательности и сроках выполнения отдельных частей сводки и изложения её результатов.

Группировкой называется объединение единиц объекта наблюдения в однородные по существенным для них признакам группы.

В зависимости от числа признаков в основании группировки выделяют группировки по одному признаку – простые – и группировки по нескольким признакам – сложные.

Алгоритм простой группировки.

  1.  Совокупность упорядочивается по значению группировочного признака.
  2.  Определяется число групп (m).
  3.  Единицы с одинаковыми или близкими значениями признака объединяются в группы.
  4.  Подсчитываются итоги по группам (число единиц совокупности и значения обобщающих показателей).
  5.  Результаты группировки представляются в виде группировочной таблицы (табл.3)

Таблица 3

Группировочная таблица

№ группы Значение группировочного признака Число единиц совокупности в группе Обобщающий показатель 1 Обобщающий показатель 212…mИтого

Под группировочным признаком понимают признак, по которому происходит объединение отдельных единиц совокупности в однородные группы (признаки могут быть атрибутивными, т.е. смысловыми, качественными, не имеющими количественного выражения – пол, профессия, специализация; и количественными – размер территории, объем продаж и т.п.).

Если группировка выполняется по атрибутному признаку, то число групп, в которые объединяются единицы объекта наблюдения, определяется числом разновидностей атрибутивного признака. Так, группировка населения по полу даёт две группы, а группировка его по национальности образует столько групп, сколько различных национальностей имеется среди изучаемого населения.

При группировке по количественным признакам возникает вопрос о выборе размера интервала, т.е. разности между наибольшим и наименьшим значениями признака в данной группе. Размер интервала должен быть таким, чтобы полученные группы чётко отличались друг от друга. Интервалы групп могут быть равные и неравные. Разные интервалы целесообразно применять в тех случаях, когда признак изменяется равномерно.

При исследовании экономических явлений чаще применяются неравные, прогрессивно увеличивающиеся интервалы. Это объясняется тем, что здесь количественные изменения размера признака имеют неодинаковое значение в низших и высших группах. Например, если разница в числе работников в 50 человек имеет существенное значение для мелкого предприятия, то для крупного такая разница существенного значения не имеет.

Интервалы могут быть закрытые (с указанием нижней, так и верхней границ) или открытые (с указанием только одной границы).

Для придания группировке строгой определённости верхняя граница предыдущей и нижняя граница последующей группы должны обозначаться различно.

Алгоритм построения группировки с равными интервалами включает следующие шаги.

  1.  Определяется оптимальное количество групп – m. Для больших совокупностей можно воспользоваться формулой американского учёного Стерджесса:

                          m=1+3,322*lgN,

где N – число единиц совокупности.

  1.  Определяется величина интервала:

                          ,

где числитель – размах вариации;

максимальное значение признака в исследуемой совокупности;

минимальное значение признака в исследуемой совокупности;

m – число групп.

Если в результате деления получится нецелое число, то округлять нужно в большую сторону, а не в меньшую.

  1.  Определяются границы каждого интервала:

Для первого интервала: от до .

Для второго интервала: от  до .

Для m-го интервала: от  до .

  1.  Подсчитывают число единиц, попавших в интервал. Причём единицы, имеющие значение признака, равное граничному, относят только к одному из интервалов.
  2.  Результаты заносят в таблицу.

Рассмотрим пример построения равноинтервального ряда. Пусть по совокупности из 20 студентов изучается посещаемость ими практических занятий по статистике за семестр.

(Х – число практических занятий по статистике, на которых студент присутствовал в семестре):

16 14 15 10 7 10 3 16 12 5 16 0 15 16 12 4 7 6 10 9.

Число групп для удобства возьмем равным 3, тогда величина интервала будет равна:

.

Границы групп будут следующими:

[0;5,4) [5,4;10,8) [10,8;16,2).

Численность групп будет:

  1.  7  11

Результаты группировки оформим в виде таблицы (табл.4).                                                                                   

Таблица 4

Равноинтервальная группировка студентов по признаку                                                посещаемости


Группировки с неравными интервалами подразделяют на:

  1.  группировки с прогрессивно возрастающими или убывающими интервалами (по арифметической либо геометрической прогрессии). Например, по численности работающих промышленные предприятия могут быть разбиты на следующие группы с арифметически возрастающими величинами интервалов: до 100 человек, 100 – 200, 200 – 300, 300 – 500, 500 – 1000, 1000 и более человек. Это объясняется тем, что изменение количества работающих на 50 – 100 человек имеет существенное значение для мелких предприятий, а для крупных – не имеет;
  2.  группировки с равнонаполненными группами (численность каждой группы примерно одна и та же). Равномерное распределение единиц совокупности по группам обеспечивает статистическую устойчивость характеристик, рассчитанных для отдельных групп.

Алгоритм построения равнонаполненной группировки:

  1.  определяется число групп на основе качественного анализа явления;
  2.  определяется численность каждой группы (N) при заданном числе групп – (m) как: N, где N – объём совокупности. Если в результате деления получается не целое число, то численность групп будет не совсем одинаковой, в некоторых группах число единиц будет больше;
  3.  определяются границы интервалов по группам. Нижняя граница 1-го интервала есть минимальное значение признака в упорядоченной совокупности. Значение верхней границы 1-го интервала (равное нижней границе 2-го интервала) определяется значением признака у N-й единицы, упорядоченной по значению признака совокупности. Верхняя граница 2-го интервала определяется значением признака у единицы под номером 2N и т.д.

Построим равнонаполненную группировку совокупности 20 студентов по признаку «посещаемость практических занятий» - Х.

Исходные данные:

16 14 15 10 7 10 3 16 12 5 16 0 15 16 12 4 7 6 10 9.

Решение

  1.  Примем число групп равным 3. тогда N=20/3=6,67.
  2.  Упорядочим совокупность студентов по значению признака Х:

       

Определим границы интервалов по группам:

                   

1 группа 0       7

2 группа 7      14

3 группа 14    16

Результаты сведём в табл.5.

                                  

                                                                                             Таблица 5

Равнонаполненная группировка студентов по признаку посещаемости


3.2. Виды группировок

Статистические группировки и классификация преследуют цели выделения качественно однородных совокупностей, изучения взаимосвязи между явлениями и признаками. Каждой из этих целей соответствует особый вид группировки: типологическая, структурная, аналитическая (факторная).

  •  Типологические группировки – служат для выделения из совокупности качественно (содержательно) однородных групп единиц, характеризующих основные типы изучаемого явления. Они производятся с целью теоретического обобщения первичной статистической информации. Поэтому их проводят до структурных и аналитических группировок.

Типологические группировки применяются чаще всего к неоднородной совокупности и осуществляются посредством сложных неравноинтеральных группировок. Примерами типологических группировок могут служить группировки хозяйственных объектов по формам собственности; населения по общественным группам; работников на занятых преимущественно физическим и преимущественно умственным трудом; товаров одного вида по потребительским свойствам (престижные, надёжные, дешёвые) и т.д.

  •  Структурные группировки – характеризуют структуру однородных совокупностей по какому-либо варьирующему признаку. Анализируются такие группировки по изменению частот для дискретных или равноинтервальных группировок; по изменению абсолютных или относительных плотностей распределения для неравноинтервальных группировок. По результатам анализа делаются выводы о равномерности или неравномерности распределения группировочного признака в совокупности, а в случае неравномерного распределения - о наиболее часто встречающихся значениях признака.
  •  Аналитические группировки – позволяют выявлять связи между изучаемыми признаками. При этом выделяют признак-результат (признак-фактор определяет значения признака-результата).

              Техника осуществления аналитической группировки:

  1.  производится группировка единиц совокупности по признаку-фактору;
    1.  по каждой полученной группе отбираются соответствующие значения признака-результата и на их основе рассчитывается некоторый обобщающий показатель (чаще всего среднее значение);
    2.  анализируются изменения обобщающего показателя по группам и делается вывод о наличии или отсутствии взаимосвязи и её направлении. Если изменение величины признака-фактора, положенного в основу группировки, вызывает изменение величины признака-результата в том же направлении, то связь прямая, в противном случае – связь обратная.

Для иллюстрации возможностей аналитической группировки изучим на конкретном примере, как связать между собой два признака, присущие тому или иному студенту, а именно: «экзаменационная оценка» (признак-результат «Y») и «посещаемость занятий (признак-фактор «Х»):

X16141510710316125160151612476109Y44433553335445424334

Результаты аналитической группировки представлены в табл.6:

Таблица 6

Аналитическая группировка

Анализируя данную таблицу, можно заметить прямую зависимость результативного признака Y – «оценка по статистике» от признака-фактора Х – «посещаемость практических занятий по статистике»: чем больше занятий посетил студент, тем выше его оценка по статистике. Данная зависимость наблюдается в среднем по совокупности. По числу группировочных признаков различают простые группировки (один признак) и сложные

(два и более признаков).

Среди простых группировок особое место занимают статистические ряды распределения.

Ряд распределения – это группировка, в которой для характеристики групп (упорядоченно расположенных по значению признака, т. е. ранжированных) применяется один показатель – численность группы. Другими словами, это ряд чисел, показывающий, как распределяются единицы некоторой совокупности по изучаемому признаку.

Ряды, построенные по атрибутивному признаку, называются атрибутивными рядами распределения.

Ряды распределения, построенные по количественному признаку, называются вариационными рядами.

Примером атрибутивных рядов могут служить распределения населения регионов по полу, занятости, национальности.

Вариационные ряды распределения состоят из двух элементов вариантов и частот.

Вариантами называются упорядоченные значения количественного признака в ряду распределения, они могут быть положительными и отрицательными, абсолютными и относительными.

Частоты – это абсолютные числа, показывающие сколько раз встречаются те или иные варианты в вариационном ряду. Их также называют весами. Сумма всех частот называется объемом совокупности и определяет число единиц всей совокупности.

Отношение частоты того или иного варианта к сумме всех частот ряда называется частостью или относительной частотой. Сумма всех частостей вариационного ряда равна единице.

Группировки также могут быть первичными или вторичными. Группировки, которые выполняются на основе первичного статистического материала (впервые) – первичные. Вторичная группировка – образование новых групп на основе ранее осуществлённой группировки. Получение новых групп на основе имеющихся возможно двумя способами: объединением первоначальных интервалов (путём их укрупнения) и долевой перегруппировкой (на основе закрепления за каждой группой определённой доли единиц совокупности). Вторичные группировки используют, когда имеющиеся группировки не удовлетворяют требованиям анализа – несопоставимы из-за различного числа выделенных групп или неодинаковых границ интервалов.

3.3. Статистические таблицы и графики

Статистические таблицы являются средством наглядного выражения результатов группировки.

Составленную таблицу, но не заполненную цифрами, принято называть макетом таблицы. Статистическая таблица имеет свое подлежащее и сказуемое. Подлежащее показывает о каком явлении идет речь в таблице и представляет собой группы и подгруппы, которые характеризуются рядом показателей. Сказуемым таблицы называются показатели, с помощью которых изучается объект, т. е. подлежащее таблицы (табл.7):

Таблица 7

Макет таблицы

Содержание строк Наименование граф (верхние заголовки) А123… Наименование строк (боковые заголовки) Итоговая строка Итоговая графа

Практикой выработаны определенные требования к составлению и оформлению таблиц.

1. Таблица по возможности должна быть краткой.

2. Каждая таблица должна иметь подробное название, из которого становится известно:

  •  какой круг вопросов излагает и иллюстрирует таблица;
    •  каковы географические границы представленной статистической совокупности;
    •  за какой период времени или на какую дату представлены данные;
    •  каковы единицы измерения (если они одинаковы для всех клеток). Если единицы измерения неодинаковы, то в верхних или боковых заголовках обязательно следует указывать, в каких единицах приводятся статистические данные (тонн, штук, рублей и пр.).

3. Таблица может сопровождаться примечаниями, в которых указываются источники данных, более подробно раскрывается содержание показателей, даются и другие пояснения, а также оговорки в случае, если таблица содержит данные, полученные в результате вычислений.

4. При оформлении таблиц обычно применяются такие условные обозначения: знак тире (-) – когда явление отсутствует; х – если явление не имеет осмысленного содержания; многоточие (…) – когда отсутствуют сведения о его размере (или делается запись «Нет сведений»). Если сведения имеются, но числовое значение меньше принятой в таблице точности, оно выражается дробным числом (0,0).

Округленные числа приводятся в таблице с одинаковой степенью точности (до 0,1; до 0,01 и т. п.). Если в таблице приводятся проценты роста, то во многих случаях целесообразно проценты от 300 и более заменять отношениями в размерах. Например, писать не «100 %», а «в 10,0 раз».

Использование графиков для изложения статистических показателей позволяет придать последним наглядность и выразительность, облегчить их восприятие, а во многих случаях помогает уяснить сущность изучаемого явления, его закономерности и обоснованности, увидеть тенденции его развития, взаимосвязь характеризующих его показателей.

Статистические графики можно классифицировать по разным признакам: назначению (содержанию), способу построения и характеру графического образа.

По содержанию или назначению можно выделить графики сравнения в пространстве, графики различных относительных величин (структуры, динамики и т.п.), графики вариационных рядов, графики размещения по территории, графики взаимосвязанных показателей. Возможны и комбинации этих графиков, например графическое изображение вариации в динамике или динамики взаимосвязанных показателей и т. п.

По способу построения графики можно разделить на диаграммы, картодиаграммы и картограммы.

По характеру графического образа различают графики точечные, линейные, плоскостные (столбиковые, квадратные, круговые, секторные, фигурные) и объемные.

Для изображения экономических явлений, протекающих во времени, применяют динамические диаграммы. В отличие от диаграмм, отображающих сравнительные величины отдельных объектов или их структуры, в динамических диаграммах объектом отображения служат процессы.

Геометрически адекватной формой их отражения являются линейные координатные диаграммы, построенные в прямоугольной системе координат,  а при дискретной вариации признака - графиком.

← Предыдущая
Страница 1
Следующая →

Файл

глава3.doc

глава3.doc
Размер: 152.5 Кб

.

Пожаловаться на материал

Понятия сводки и группировки статистических данных. Виды группировок. Статистические таблицы и графики. Алгоритм простой группировки.

У нас самая большая информационная база в рунете, поэтому Вы всегда можете найти походите запросы

Искать ещё по теме...

Похожие материалы:

Философия.  Задачи к экзамену

Рабочая программа учебного предмета Окружающий мир

Наименование учебного предмета - Окружающий мир. Программа разработана на основе Федерального государственного образовательного стандарта начального общего образования

Тесты по циклу «Воздушно-капельные инфекции»

Правильные ответы. Перечислите «атипичные» микобактерии. Морфологически возбудитель туберкулеза. С чем связана кислотоустойчивость микобактерий. Бактериологический метод диагностики

Герменевтика как техника интерпретации

Герменевтика - искусство толкования. Герменевтике придается большое значение в литературоведении, поскольку при исследовании любого памятника литературы необходимо его максимально объективное толкование.

Модели прогнозирования экономических процессов

В настоящее время насчитывается большое количество типов кривых роста для экономических процессов. Задачи анализа временных рядов. Первоначальная обработка временных рядов

Сохранить?

Пропустить...

Введите код

Ok