Ряды распределения. Атрибутные и вариационные ряды распределения. Ранжирования ряда. Характеристики варианта, частота, непрерывность, дискретность. Интервал. Анализ связи ранжированных рядов

При работе с данными часто возникает потребность выяснить, какое место занимает в совокупном перечне по величине тот или иной показатель. В статистике это называется ранжированием. В Excel имеются инструменты, которые позволяют пользователям быстро и легко произвести данную процедуру. Давайте выясним, как ими пользоваться.

Функции ранжирования

Для выполнения ранжирования в Экселе предусмотрены специальные функции. В старых версиях приложения был один оператор, предназначенный для решения этой задачи – РАНГ. В целях совместимости он оставлен в отдельной категории формул и в современных версиях программы, но в них все-таки желательно работать с более новыми аналогами, если есть такая возможность. К ним относятся статистические операторы РАНГ.РВ и РАНГ.СР. О различиях и алгоритме работы с ними мы поговорим далее.

Способ 1: функция РАНГ.РВ

Оператор РАНГ.РВ производит обработку данных и выводит в указанную ячейку порядковый номер заданного аргумента из совокупного списка. Если несколько значений имеют одинаковый уровень, то оператор выводит высший из перечня значений. Если, например, два значения будут иметь одинаковую величину, то им обоим будет присвоен второй номер, а уже следующее по величине значение будет иметь четвертый. Кстати, полностью аналогично поступает и оператор РАНГ в более старых версиях Эксель, так что данные функции можно считать идентичными.

Синтаксис этого оператора записывается следующим образом:

Аргументы «число» и «ссылка» являются обязательными, а «порядок» - необязательным. В качестве аргумента «число» нужно ввести ссылку на ту ячейку, где содержится значение, порядковый номер которого нужно узнать. Аргумент «ссылка» содержит адрес всего диапазона, который ранжируется. Аргумент «порядок» может иметь два значения – «0» и «1». В первом случае отсчет порядка идет по убывающей, а во втором – по возрастающей. Если данный аргумент не указан, то он автоматически считается программой равным нулю.

Данную формулу можно записывать вручную, в ту ячейку, где вы хотите, чтобы выводился результат обработки, но для многих пользователей удобнее задавать вводные через окно Мастера функций.


Урок: Мастер функций в Excel

Способ 2: функция РАНГ.СР

Второй функцией, которая производит операцию ранжирования в Экселе, является РАНГ.СР. В отличие от функций РАНГ и РАНГ.РВ, при совпадении значений нескольких элементов данный оператор выдает средний уровень. То есть, если два значения имеют равную величину и следуют после значения под номером 1, то им обоим будет присвоен номер 2,5.

Синтаксис РАНГ.СР очень похож на схему предыдущего оператора. Выглядит он так:

Формулу можно вводить вручную или через Мастер функций. На последнем варианте мы подробнее и остановимся.

  1. Производим выделение ячейки на листе для вывода результата. Таким же образом, как и в предыдущий раз, переходим в Мастер функций через кнопку «Вставить функцию».
  2. После открытия окна Мастера функций выделяем в перечне категории «Статистические» наименование РАНГ.СР и жмем на кнопку «OK».
  3. Активируется окно аргументов. Аргументы у данного оператора точно такие же, как и у функции РАНГ.РВ:
    • Число (адрес ячейки содержащей элемент, уровень которого следует определить);
    • Ссылка (координаты диапазона, ранжирование внутри которого выполняется);
    • Порядок (необязательный аргумент).

    Внесение данных в поля происходит точно таким же способом, как и у предыдущего оператора. После того, когда все настройки выполнены, жмем на кнопку «OK».

  4. Как видим, после выполненных действий результат расчета был выведен в ячейку, отмеченную в первом пункте данной инструкции. Сам итог представляет собой место, которое занимает конкретное значение среди других величин диапазона. В отличие от результата РАНГ.РВ, итог оператора РАНГ.СР может иметь дробное значение.
  5. Как и в случае с предыдущей формулой, с помощью изменения ссылок с относительных на абсолютные и маркера выделения, путем автозаполнения можно проранжировать весь диапазон данных. Алгоритм действий точно такой же.

Урок: Другие статистические функции в Microsoft Excel

Урок: Как сделать автозаполнение в Эксель

Как видим, в Экселе существует две функции для определения ранжирования конкретного значения в диапазоне данных: РАНГ.РВ и РАНГ.СР. Для более старых версий программы используется оператор РАНГ, который, по сути, является полным аналогом функции РАНГ.РВ. Главное отличие формул РАНГ.РВ и РАНГ.СР состоит в том, что первая из них указывает наивысший уровень при совпадении значений, а вторая выводит средний показатель в виде десятичной дроби. Это единственное различие между этими операторами, но его нужно учитывать при выборе того, какой именно функцией пользователю лучше воспользоваться.

Мы рады, что смогли помочь Вам в решении проблемы.

Задайте свой вопрос в комментариях, подробно расписав суть проблемы. Наши специалисты постараются ответить максимально быстро.

Помогла ли вам эта статья?

Научимся ранжировать числовые данные в Excel с помощью стандартной сортировки, а также функции РАНГ и ее частных случаях (РАНГ.РВ и РАНГ.СР), которые помогут в автоматизации сортировки.

Приветствую всех, дорогие читатели блога TutorExcel.Ru.

Задача ранжирования числовых данных постоянно возникает в работе с целью поиска наибольших или наименьших значений в списке.
В Excel с этой задачей можно справиться 2 способами: стандартным инструментом сортировки и с помощью функций .

Для примера возьмем простую таблицу со списком числовых значений, в которой в дальнейшем и будем ранжировать данные:

Сортировка данных

Начнем с самого простого и доступного варианта - сортировки.

Мы уже частично разбирали как можно структурировать данные с помощью фильтра и сортировки.
Вкратце, для сортировки необходимо выделить диапазон с данными и на панели вкладок выбрать Главная -> Редактирование -> Сортировка и фильтр , а далее указать по какому критерию нужно произвести сортировку.

В данном случае выберем Сортировка по убыванию , где значения будут расположены от большего к меньшему:


Минусом данного способа является изменение структуры исходных данных, так как в процессе сортирования данных строки и столбцы могут меняться местами, что в некоторых случаях неудобно или невозможно сделать.
Также к важным недостаткам этого варианта можно отнести отсутствие возможности автоматизировать сортировку. Поэтому каждый раз при изменении данных сортировку придется делать еще раз.

В качестве решения данной проблемы рассмотрим другой способ ранжирования, который впрочем можно рассматривать и отдельно от решения этой задачи.

Ранжирование данных

При отсутствии возможности изменения структуры документа мы можем создать дополнительный ряд данных, где будут содержаться порядковые номера исходных данных.
Получить эти порядковые номера нам поможет функция РАНГ (а также РАНГ.РВ и РАНГ.СР ).

Функция РАНГ в Excel

Синтаксис и описание функции:

  • Число (обязательный аргумент) - число для которого вычисляется ранг;
  • Ссылка (обязательный аргумент) - массив или ссылка на массив чисел;
  • Порядок (необязательный аргумент) - способ упорядочения. Если аргумент равен 0 или не указан, то значение 1 присваивается максимальному элементу в списке (условно говоря, сортируем по убыванию), в ином случае значение 1 присваивается минимальному элементу (сортируем по возрастанию).

Эта функция доступна во всех версиях Excel, однако начиная с Excel 2010 на ее замену добавлены РАНГ.РВ и РАНГ.СР , а РАНГ оставлена для совместимости с Excel 2007, давайте подробнее остановимся на их работе.

Функции РАНГ.РВ и РАНГ.СР в Excel

Синтаксис и описание функций:

РАНГ.РВ(число; ссылка;)
Возвращает ранг числа в списке чисел: его порядковый номер относительно других чисел в списке; если несколько значений имеют одинаковый ранг, возвращается высший ранг из этого набора значений.

Аргументы у всех трех функций одинаковые, т.е. кардинально они почти не отличаются, есть небольшие различие в деталях.
На примере исходной таблицы посмотрим как работает с данными каждая из функций:


Как мы видим отличие заключаются лишь в типе ранжирования совпадающих элементов данных.

В случае с РАНГ.РВ равным элементам присваивается высший ранг.
В нашем примере категориям Ноутбуки и Мультиварки соответствует одинаковое значение элемента - 710, который является 3 по порядку убывания, соответственно обоим значениям присваивается высший ранг - 3.
Для РАНГ.СР для этих же значений устанавливается их средний ранг, т.е. среднее между 3 и 4 порядковыми номерами - 3,5.

На этом различия между ними заканчиваются, поэтому в зависимости от ваших задач можно использовать ту или иную функцию.
Если нужно отсортировать значения по возрастанию, то в качестве аргумента Порядок нужно указать значение 1:

Автоматическая сортировка

Немного усложним задачу и представим, что нам в дальнейшем нужно составить отсортированную таблицу, которая бы автоматически обновлялась при изменении данных в исходной таблице.

Например, это можно сделать с помощью функции ВПР, или комбинации ИНДЕКС и ПОИСКПОЗ, однако в случае наличия одинаковых значений в списке мы не сможем корректно подтянуть данные и получим ошибку:


В этом случае можно воспользоваться простым приемом в виде небольшой хитрости.
Добавим к каждому значению исходной таблицы не совпадающие случайные числа близкие к нулю, к примеру, я для этих целей использую функции СТРОКА или СТОЛБЕЦ, поделенные на заведомо большую величину.

Этот шаг позволит нам получить различные числа в исходных данных, избежать совпадения рангов и ошибки при подтягивании данных:

Теперь для всех элементов таблицы (даже изначально совпадающих) определен свой индивидуальный ранг отличный от остальных, поэтому ошибок при автоматическом ранжировании данных удастся избежать.

Скачать файл с примером .

Спасибо за внимание!
Если у вас остались вопросы - пишите в комментариях.

Удачи вам и до скорых встреч на страницах блога TutorExcel.Ru!

Для ранжирования данных в Excel применяются статистические функции РАНГ, РАНГ.РВ, РАНГ.СР. Все они возвращают номер числа в ранжированном списке числовых значений. Рассмотрим подробнее синтаксис, примеры.

Пример функции РАНГ в Excel

Функция используется при ранжировании в перечне чисел. То есть позволяет узнать величину числа относительно других числовых значений. Если отсортировать список по возрастанию, то функция вернет позицию числа. Например, в массиве чисел {30;2;26} число 2 будет иметь ранг 1; 26 –2; 30 –3 (как наибольшее значение в списке).

Синтаксис функции:

  1. Число. Для, которого необходимо определить номер в ранжировании.
  2. Ссылка. На массив чисел или диапазон ячеек с числовыми значениями. Если задать в качестве аргумента просто числа, то функция вернет ошибку. Нечисловым значениям номер не присваивается.
  3. Порядок. Способ упорядочения чисел в списке. Варианты: аргумент равен «0» или опущен – значение 1 присваивается максимальному числу в списке (как будто список отсортирован в порядке убывания); аргумент равен любому неравному нулю числу – номер ранжирования 1 присваивается минимальному числу в списке (как будто список отсортирован в порядке возрастания).

Определим ранжирование чисел в списке без повторов:

Аргумент, определяющий способ упорядочения чисел, равен «0». Следовательно, в данной функции номера присваивались значениям от большего к меньшему. Максимальному числу 87 присвоен номер 1.

В третьем столбце приведена формула с рангом по возрастанию.

Определим номера значений в списке, где присутствуют повторяющиеся значения.

Желтым цветом выделены повторяющиеся числа. Для них определяется один и тот же номер. Например, числу 7 во втором столбце присвоен номер 9 (и во второй строке, и в девятой); в третьем столбце – 3. Но ни одно из чисел во втором столбце не будет иметь 10, а в третьем – 4.

Чтобы ранги не повторялись (иногда это мешает пользователю решить поставленную задачу), используется следующая формула:

Для работы функции можно установить пределы. Например, необходимо ранжировать только значения от 0 до 30. Чтобы решить задачу, применим функцию ЕСЛИ (=ЕСЛИ(A2

Серым цветом выделены значения, которые соответствуют заданному условию. Для чисел, которые больше 30, выводится пустая строка.

Пример функции РАНГ.РВ в Excel

В версиях Excel, начиная с 2010 года, появилась функция РАНГ.РВ. Это абсолютный аналог предыдущей функции. Синтаксис такой же. Буквы «РВ» в названии указывают на то, что при обнаружении формулой одинаковых значений функция вернет высший номер ранжирования (то есть первого обнаруженного элемента в перечне равных).

Как видно из примера, данная функция обрабатывает повторяющиеся числа в списке точно так же, как и в обычной формуле. Если необходимо избежать повторений рангов, используем другую формулу (см. выше).

Пример функции РАНГ.СР в Excel

Возвращает номера числового значения в списке (порядковый номер относительно других значений). То есть выполняет ту же задачу. Только при обнаружении идентичных значений возвращает средний показатель.

Вот результат работы функции:

Формула в столбце «по убыванию»: =РАНГ.СР(A2;$A$2:$A$9;0). Так, функция значению 87 присвоила средний номер 1,5.

Допустим, в списке чисел три повторяющихся значения (выделены оранжевым цветом).

Функция присвоила каждому из них ранг 5, что является средним для 4, 5 и 6.

Сравним работу двух функций:

Напомним, что эти две функции работают только в Excel 2010 и выше. В более ранних версиях для этих целей можно задействовать формулу массива.

Скачать примеры функции ранжирования РАНГ в Excel.

Таким образом, все выше описанные примеры позволяют автоматизировать работу по ранжированию данных и составлению рейтинга значений без применения сортировки.

Вариационный ряд представляет собой расположение значений признака каждой статистической единицы в определенном порядке. При этом отдельно взятые значения признака принято называть вариантой (вариантом). . Каждый член вариационного ряда (варианта) называется порядковой статистикой, а номер варианты - рангом (порядком) статистики.

Важнейшими характеристиками вариационного ряда являются его крайне варианты (Х 1 =Хmin; Х n =Хmax) и размах вариации (Rх = Хn – Х 1).

Вариационные ряды находит широкое применение при первичной обработке статистической информации, полученной в результате статистического наблюдения. Они служат базой для построения эмпирической функции распределения статистических единиц в составе статистической совокупности. Поэтому вариационные ряды называют рядами распределения .

В статистике различает следующие виды вариационных рядов: ранжированный, дискретный, интервальный.

Ранжированный (от латинского rang – чин) ряд - это такой ряд распределения единиц статистической совокупности, в котором варианты признака в порядке возрастания или убывания. Любой ранжированный ряд состоит из ранговых номеров (1 до n) и соответствующих им вариант. Число вариант в ранжированном ряду, сформированному по существенному признаку, обычно равно числу единиц в статистической совокупности.

Для формирования ранжированного ряда по заданному признаку (например, по числу работников животноводства в 100 сельскохозяйственных предприятиях) можно воспользоваться макетом табл. 5.1.

Т а б л и ц а 5.1. Порядок формирования ранжированного ряда

Конец работы -

Эта тема принадлежит разделу:

Статистика

И продовольствия республики беларусь.. департамент образования науки и кадров..

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ:

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

Шундалов Б.М
Общая теория статистики. Учебное пособие для экономических специальностей высших сельскохозяйственных учебных заведений. Учебное пособие со

Предмет статистики
Слово "статистика" происходит от латинского "статус" (status), которое означает состояние, положение вещей. Это даёт возможность подчеркнуть теоретическую познавательную сущност

Сущность статистического наблюдения
Любое статистическое исследование, как было отмечено выше (тема 1), всегда начинается со сбора первичной (исходной) информации о каждой единице статистической совокупности. Однако, не всяк

Программа статистического наблюдения
В первой главе было обращено внимание на то, что каждая статистика единица, как объект в целом, обладает множеством различных свойств, качеств, специфических особенностей, которые принято называть

Перечень признаков, регистрируемых в процессе наблюдения, принято называть программой статистического наблюдения
Разработка программы – один из важнейших теоретических и практических вопросов статистического наблюдения. Добротность программы во многом определяет качество собранного материала, его надёжность и

Формы статистического наблюдения
Всё многообразие статистических наблюдений сводит к двум формам: статистической отчётности и специально организованным статистическим наблюдениям. Статистическая отчётность

Статистические формуляры
Статистический формуляр – это банк, содержащий вопросы программы статистического наблюдения и место для ответов на них. формуляр является носителем статистической информации, полученной в результат

Виды статистического наблюдения
Статистические наблюдения классифицируются по видам, которые могут различаться по различным принципам. Так, в зависимости от степени охвата изучаемого объекта статистические наблюдения могут подраз

Способы проведения статистических наблюдений
Статистические наблюдения могут проводится различными способами, среди которых нередко встречаются следующие: отчётный, экспедиционный, самоисчисления, саморегисрации, анкетный, корреспондентский.

Место, сроки и период проведения статистических наблюдений
В плане любого статистического наблюдения должно быть чётко определено место проведения этого наблюдения, т.е. то место, где производится регистрация собираемой информации, заполнения статистическо

Ошибки статистического наблюдения и меры борьбы с ними
Одним из наиболее важных требований, предъявляемых к результатам статистического наблюдения, является их точность, под которой понимается мера соответствия статистических знаний, п

Первичная статистическая сводка
Результаты статистического наблюдения содержат разносторонние сведения о каждой единице совокупности или объекта и обычно носят неупорядоченный характер. Этот исходный материал необходимо, прежде в

Сущность и значение относительных статистических показателей
Относительные показатели – это статистические величины, выражающие меру количественного соотношения абсолютных значений признака и отображающие относительные размеры явлений и процессов. О

Виды относительных показателей. Относительные показатели динамики
В зависимости от задач, решаемых с помощью относительных величин, различают следующие виды относительных показателей: динамики, структуры, координации, интенсивности, сравнения, выполнения заказа,

Относительные показатели структуры
Одна из важнейших особенностей всех явлений заключается в их сложности. Даже молекула дистиллированной воды состоит из атомов водорода и кислорода. Многие же явления природы, общества, человеческог

Относительные показатели координации
Относительные показатели координации – это соотношение между собой абсолютных размеров составных частей в некотором абсолютном целом. Для расчёта этих показателей одну из составных

Относительные показатели интенсивности
Относительные показатели интенсивности (степени) представляют собой соотношение абсолютных размеров двух качественно различных, но взаимосвязанных признаков в статистической совоку

Относительные показатели сравнения
Относительные показатели сравнения (сопоставления) получают путем соотношения одноименных абсолютных показателей, относящихся к разным статистическим единицам, сов

Относительные показатели выполнения заказа
Относительные показатели выполнения заказа (задания, плана) представляют собой соотношение абсолютных, фактически достигнутых показателей за определенный период или по состоянию на

Относительные показатели уровня экономического развития
Относительными показателями уровня экономического развития называют соотношение абсолютных размеров двух качественно различных (разноименных), но взаимосвязанных признаков. При это

Сущность и значение графического метода
Абсолютные статистические показатели, полученные в результате статистических наблюдений, и рассчитанные на этой основе разнообразные относительные показатели могут быть лучше, глубже, доступнее пон

Основные требования, предъявляемые к построению координатных диаграмм
Наиболее распространенным и удобным способом графического изображения абсолютных и относительных показателей динамики, показателей сравнения и др. считается координатнаядиаграмма.

Способы графического изображения показателей динамики и структуры
Во многих случаях имеется необходимость на одной и той же координатной диаграмме отразите не одну, а несколько линий, характеризующих динамику различных абсолютных или относительных показателей либ

Способы графического изображения показателей сравнения
В широком понимании сравнение показателей проводится как во времени, так и в пространстве, т.е. приемами сравнения могут быть охвачены и динамика, и структура, и территориальные объекты. Поэтому пр

Сущность и значение картограмм и картодиаграммы
Во многих случаях имеется необходимость графически изобразить важнейшие признаки, характерные для обширных территориальных объектов. В системе АПК это могут быть населенные пункты, сельскохозяйстве

Контрольная вопросы к теме 4
1. Что представляет собой графический метод и на чем он основывается? 2. С какими основными целями используется графический метод. 3. Каким образом классифицируютс

Сущность вариации. Виды вариационных признаков
Вариация (от латинского variatio – изменение) представляет собой изменение признака (вариант) в статистической совокупности, т.е. принятие единицами совокупности или их группами разных знаний призн

По числу работников животноводства
Ранговый номер (№) варианты Варианта, соответствующая ранговому номеру (№) Символ Число работников животноводства

Дискретный ряд распределения
Дискретный (разделительный) ряд представляет собой такой вариационный ряд, в котором его группы сформированы по признаку, изменяющемуся прерывно, т.е. через определённое число един

Работников животноводства
№ варианты Варианта (значение признака), Х Частотные знаки Локальные частоты, fл Накопительные частоты, fн

Интервальный ряд распределения
Во многих случаях, кота статистическая совокупность включает большое или тем более бесконечное число вариант, что чаще всего встречается при непрерывной вариации, практически невозможно и нецелесоо

Сущность средних величин
Вариационные ряды отображают большое разнообразие явлений и процессов, составляющих сущность нашей действительности. Для более полного, углубленного изучения явлений и процессов окружающего нас мир

Средняя арифметическая величина
Если в формулу 6.2 подставить значение К=1, то получается средняя арифметическая величина, т.е. .

В ранжированном ряду распределения
Ранговые №№ Варианты (значения признака) Символы Посевная площадь, га

Ряду распределения
№ п.п. Варианты Локальные частоты Взвешенные средние варианты Символы Урожайн

Основные свойства средней арифметической величины
Средняя арифметическая величина обладает многими математическими свойствами, имеющими важное математическое значение при ее расчёте. Знание этих свойств помогают контролировать правильность и точно

Средняя хронологическая величина
Одной из разновидностей средней арифметической величины является средняя хронологическая. Среднюю величину, исчисленную по совокупности значений признака в разные моменты или за различные периоды в

Средняя квадратическая величина
При условии постановки значения К=2 в формулу 6.2. получаем среднюю квадратическую величину. В ранжированном ряду средняя квадратическая величина рассчитывается по невзвешенной (пр

Средняя геометрическая величина
Если в формулу 6.2 подставить значение К=0, то в результате получаем среднюю геометрическую величину, которая имеет простую (невзвешенную) и взвешенную формы. Средняя геометрическая проста

Средняя гармоническая величина
При условии подстановки в общую формулу 6.2 значение К=-1 можно получить среднюю гармоническую величину, которая имеет простую и взвешенную формы. Название средней гармони

Структурные среднее. Сущность и значение моды
В некоторых случаях для получения обобщающей характеристики статистической совокупности по какому-либо признаку приходится пользоваться т.н. структурными средними. К ним относят

Сущность и значение медианы
Медиана– варианта, находящиеся в середине вариационного ряда. Медиана в ранжированном ряду находится следующим образом. Во-первых, рассчитывают номер медианой варианты:

Понятие о простейших показателях вариации
Сущность вариации была рассмотрена в 5 главе учебника, где отмечалось, что вариация – это колеблемость, изменение величины признака в статистической совокупности, т.е. принятие единицами совокупнос

Среднее квадратической отклонение
Среднее квадратической отклонение рассчитывается на базе средней квадратической величины. Оно выступает в не взвешенной (простой) и взвешенной формах. Для ранжированного р

Коэффициент вариации
Коэффициент вариации представляет собой относительный показатель, который можно рассчитать по следующей формуле:

Контрольна вопросы к теме 6
1. Что такое средняя величина и что она выражает? 2. Что представляет собой определяющее свойство совокупности и для чего его применяют в статистике? 3. Какие основные виды средни

Сущность генеральной и выборочной совокупности
В статистике сравнительно редко встречается сплошной вид наблюдения, каким является, например, всеобщая перепись населения. Все-таки наиболее часто приходится использовать несплошные наблюдения, ко

Понятие о стохастической совокупности
В реальных условиях сравнительно редко встречаются случаи статистической работы с генеральной совокупностью и, следовательно, далеко не всегда можно получить основные статистические характеристики

Сущность выборочного метопа
Статистическая работа в большинстве случаев так или иначе связана с данными, полученными в результате применения выборочного метода. Многие исследования были бы невыполнимы, если бы не использовали

Преимущества и недостатки выборочного метода
Выборочный метод имеет ряд преимуществ перед сплошным наблюдением. Во - первых, выборочное наблюдение позволяет существенно экономить труд, средства, время для его проведения. Сове

Способы отбора, их преимущества и недостатки
Отбор статистических единиц из генеральной совокупности может быть произведен no-разному и зависит от многих условий. Выборочный метоп включает следующие способы отбора статистических единиц случай

Сущность ошибок репрезентативности и порядок их расчета
Одним из центральных вопросов по выборочному методу считается теоретический расчет основных статистических характеристик и прежде всего среднего значения признаке в генеральной статистической совок

Понятие о малой выборке. Точечная оценка основных статистических характеристик
Применение выборочного метопа может базироваться на отборе из генеральной совокупности теоретически любого числа статистических единил. Математически доказано, что выборочные совокупности могут быт

Предельная ошибка выборки. Интервальная опенка основных статистических характеристик
Предельная ошибка выборки представляет собой расхождение между статистическими характеристиками, полученными в выборочной и генеральной совокупности Как было показано выше (формула

Приемы расчета численности выборки при различных способах отбора
Подготовительная работа к проведению выборочного наблюдения непосредственно связана с определением необходимой численности выборки, которая зависит от способа отбора и численности единиц в генераль

Понятие о вторичной (сложной) статистической сводке
Результаты простой сводки, содержание которой рассмотрено в теме 2, не всегда могут удовлетворить исследователя, так как они дают лишь общее представление об изучаемом объекте, т.е. от статистики т

Типологические группировки
Типологическая группировкапредставляет собой расчленение статистической совокупности на одно-качественных в существенном отношении типологических группы. Типологическую группировку

Структурные группировки
Структурная группировка заключается в расчленении однородной и качественном отношении совокупности статистических единиц на группы, характеризующий состав сложного объекта. Посредством структурной

Сущность и порядок проведения простой и аналитической группировки
Аналитическая группировка, при которой статистическая совокупность разбивается на однородные группы по одному какому-либо факторному признаку, называется простой.

Аналитической группировки
№п.п. Группы крестьянских хозяйств по дозам удобрений, т/га. Частотные знаки в группах (число единиц совокупности в группе)

Результативными показателями в картофелеводстве
№ п.п. Показатели Группы хозяйств по доза удобрений, т/га Итого (в среднем) 10-20

Сущность и значение статистических таблиц
Результаты обработки данных наблюдения с помощью разнообразных статистических методов (сводки, относительных, средних величин, формирований, вариационных рядов, показателей вариации, аналитических

Элементарный состав статистических таблиц
Комплексная статистическая обработка результатов наблюдения обычно связана с использованием многочисленных таблиц. Поэтому каждой таблице присваивается индивидуальный номер.Обязате

Виды и формы статистических таблиц
В зависимости от строения табличного подлежащего различают следующие виды статистических таблиц: простые, групповые и комбинационные. Простая статистическая таблица - хара

Вспомогательные и результативные статистические таблицы
Статистические таблицы могут выполнять различную функциональную роль. Одни из них служат например, для обобщения результатов статистического наблюдения и способствуют выполнения функции первичной с

Результатами производства, 2003 г
(комбинационная таблица) № п.п. Группы хозяйств по нагрузке сельхозугодий на 1 трактор, га Подгруппы хозяйств по нагрузк

Льноперерабатывающих предприятий АПК в 2003 г
(рабочая таблица) № п.п. Годовой объем переработки тресты, т Численность работников, чел Грузоподъемность а

Оформление статистических таблиц
Достижение поставленных целей с помощью табличного метода возможно в тех случаях, когда выдержаны необходимые требования по оформление статистических таблиц. Обычно все таблицы должны имет

Понятие о дисперсионном методе
Название метода обусловлено широким использованием различных видов дисперсий, сущность и способы расчета которых рассмотрены в шестой теме учебника. Целесообразно отметить, что дисперсия количестве

Признака-результата
№ п/п Индивидуальные варианты Линейные отклонения индивид. вариант от средней Квадраты линейных отклонений

Крестьянских хозяйствах
№ п/п Урожайность, ц/га Линейные отклонения индивидуальной урожайности от средней, ц/га Квадраты линейных отклонений урожайнос

Фитофтороза, на урожайность картофеля
№ п/п Группы хозяйств по удельному весу обработанных посевов, % Число хозяйств в группе Средний удельный вес обработанных посевов,

Признака-результата
№ группы Интервалы по факторному признаку Локальная частота Средняя варианта результативного признака

Виды дисперсий. Правило сложения дисперсий
Принцип расчета дисперсии (среднего квадрата отклонений) в общем виде рассмотрен в теме 6. Применительно к дисперсионному методу это означает, что каждому виду вариации соостветствует определенная

Урожайности картофеля (первая группа)
№ п.п. Урожайность, ц/га Линейное отклонение от средней групповой урожайности Квадраты линейных отклонений

Понятие о критерии Р. Фишера
Дисперсионный метод состоит в оценке отношения исправленной дисперсии, характеризующей систематические колебания групповых средних значений изучаемого результативного признака, к исправленной диспе

Двухфакторный дисперсионный комплекс
Решение этого комплекса направленно на изучение качественного влияния двух факторных признаков влияния двух факторных признаков на один или несколько результативных признаков. Двухфакторный комплек

Зерновых культур
№ подгруппы Число хозяйств в подгруппе Средняя урожайность ц/га Линейные отклонения урожайности в подгруппе от средн

Особенности многофакторного дисперсионного комплекса
Изучение качества связи, т.е. существенности влияния нескольких (трех, четырех и более) факторных признаков на результативные показатели, по существу является продолжительности приема комбинированн

Урожайности зерновых культур
№ п.п. Элементы вариаций Символы Общая вариация Систематическая вариация Остаточная вариац

Сущность и виды корреляций
В предыдущей главе было показано, что качество (существенность) зависимости между факторными и результативными признаками в статистической совокупности определяется и оценивается с помощью дисперси

Основные формы корреляционной связи между признаками
Выявлению формы связи между признаками предшествует определение причинной зависимости между ними. Это наиболее важный и ответственный момент для правильного использования корреляционного метода. По

Показатели тесноты корреляционных связей. Корреляционное отношение
Одним из центральных вопросов, решаемых с помощью корреляционного метода, является определение и оценка количественной меры тесноты связи между факторными и результативными признаками. При

Коэффициенты прямолинейной парной корреляции
Если взаимосвязь между признаками изучаемой парой признаков выражается в форме, близкой к прямой, то степень тесноты связи между этими признаками можно рассчитать при помощи коэффициента пр

Ранговый коэффициент корреляции
Основные статистические характеристики в тех случаях, когда генеральная совокупности, из которой берется выборка, оказывается за пределами параметров нормального или близкого к нему закона распреде

Коэффициент множественной корреляции
При изучении тесноты связи между несколькими факторными и результативными признаками рассчитывают совокупный коэффициент множественной корреляции. Так, при определении совокупной м

Показатели детерминации
При изучении количественного влияния признаков – факторов на результаты важно определить, какая часть колеблемости результативного признака непосредственно обусловлена воздействием вариации изучаем

Сущность, виды, и значение уравнений регрессии
Под регрессией понимается функция, предназначенная для описания зависимости изменения результативных признаков под влиянием колеблемости признаков – факторов. Понятие регрессии введено в статистиче

Уравнение прямолинейной регрессии
Корреляционную связь в форме, близкой к прямолинейной, можно представить в виде уравнения прямой линии:

Уравнение гиперболической регрессии
Если форма связи между признаком-фактором и признаком-результатом, выявленная с помощью координатной диаграммы (поля корреляции), приближается к гиперболической, то необходимо составить и решить ур

Регрессии
№ п.п. Признак-фактор Признак-результат Обратное значение признака-фактора Квадрат обратного значения

Гиперболической регрессии
№ п.п. Урожайность гороха, ц/га Х Себестоимость гороха, тыс. руб./ц У Расчетные величины

Уравнение параболической регрессии
В некоторых случаях эмпирические данные статистической совокупности, изображенные наглядно с помощью координатной диаграммы, показывают, что увеличение фактора сопровождаются опережающим ростом рез

Параболической регрессии
№ п.п. Х У ХУ Х2 Х2У Х4

Параболической регрессии
№ п.п. Удельный вес посевов картофеля, Х Урожай картофеля, тыс. ц. У Расчеты величины

Уравнение множественной регрессии
Применение корреляционного метода при изучении зависимости признака – результата от нескольких факторных признаков формируется по схеме, аналогической простой (парной) корреляции. Одной из

Коэффициенты эластичности
Для содержательного и доступного описания (интерпретации) результатов, отражающих корреляционно – регрессионную зависимость между признаками посредством различных уравнений регрессии, обычно исполь

Сущность динамического ряда
Все явления окружающего мира претерпевают непрерывные изменения во времени; с течением времени, т.е. в динамике изменяется их объем, уровень, состав, структура и т.д. целесообразно отметить, что по

Сельскохозяйственных предприятиях
(на начало года; тыс. физических единиц) Показатели 2000 г. 2001 г. 2002 г. 2003 г.

Основные показатели динамического ряда
Всесторонний анализ динамического ряда позволит вскрыть и характеризовать закономерности, проявляющие на разных этапах развития явлений, выявить тенденции и особенности развития этих явлений. В про

Абсолютные приросты уровней
Одним из наиболее простых показателей развития динамики является абсолютный прирост уровня. Абсолютным приростом называется разность двух уровней динамического ряда.Абсолю

Темпы роста уровней
Для характеристики относительной скорости изменения показатель темпа роста. Темп роста – это отношение одного уровня динамического ряда к другому, принятому за базу сравнения. темп роста могут быть

Темп прироста уровней
Если абсолютная скорость прироста уровней динамического ряда характеризуется величиной абсолютных приростов, то относительная скорость прироста уровней – темпами прироста. Темп при

Абсолютное значение одного процента прироста
При анализе динамических рядов нередко ставится задача: выяснить, каким абсолютными значениями выражается 1 % прироста (снижения) уровней, так как в ряде случаев при снижении (замедлении) темпов ро

За 1999-2003 гг
Годы Урожайность, ц/га Абсолютные приросты урожайности., ц/га Темп роста, % Темп прироста, %

Приемы выравнивания динамических рядов
Для выявления временных закономерностей требует, как правило, достаточно большое число уровней, динамического ряда. Если же динамический ряд состоит из ограниченного числа уровней, то его выравнива

Способы аналитического выравнивания динамического рядов
Выявление общей тенденции развития уровней динамического ряда может быть проведено с применением различных приемов аналитического выравнивания, которое наиболее часто осуществляетс

Аналитическое выравнивание по показательной кривой
В некоторых случаях, например, в процессе ввода в действие и освоение новых производственных мощностей, для динамического ряда может быть характерно быстрорастущее изменение уровней, т.е. цепные те

Аналитическое выравнивание по параболе второго порядка
Если изучаемый динамический ряд характеризуется положительными абсолютными приростами, с ускорением развития уровней, то выравнивание ряда может быть проведено по параболе второго порядка.

Аналитическое выравнивание по уравнению гиперболы
Если для динамического ряда характерны затухающие абсолютные снижения уровней (например, динамика трудоемкости продукции, трудообеспеченности производства в сельском хозяйстве и др.), то выравниван

Понятие об интерполяции и экстраполяции уровней динамического ряда
В некоторых случаях необходимо найти значения отсутствующих промежуточных уровней динамического ряда на основе известных его значений. В таких случаях может быть использован прием интерполяции, зак

Важнейшей частью статистического анализа является построение рядов распределения (структурной группировки) с целью выделения характерных свойств и закономерностей изучаемой совокупности. В зависимости от того, какой признак (количественный или качественный) взят за основу группировки данных, различают соответственно типы рядов распределения.

Если за основу группировки взят качественный признак, то такой ряд распределения называют атрибутивным (распределение по видам труда, по полу, по профессии, по религиозному признаку, национальной принадлежности и т.д.).

Если ряд распределения построен по количественному признаку, то такой ряд называют вариационным . Построить вариационный ряд - значит упорядочить количественное распределение единиц совокупности по значениям признака, а затем подсчитать числа единиц совокупности с этими значениями (построить групповую таблицу).

Выделяют три формы вариационного ряда: ранжированный ряд, дискретный ряд и интервальный ряд.

Ранжированный ряд - это распределение отдельных единиц совокупности в порядке возрастания или убывания исследуемого признака. Ранжирование позволяет легко разделить количественные данные по группам, сразу обнаружить наименьшее и наибольшее значения признака, выделить значения, которые чаще всего повторяются.

Другие формы вариационного ряда - групповые таблицы, составленные по характеру вариации значений изучаемого признака. По характеру вариации различают дискретные (прерывные) и непрерывные признаки.

Дискретный ряд - это такой вариационный ряд, в основу построения которого положены признаки с прерывным изменением (дискретные признаки). К последним можно отнести тарифный разряд, количество детей в семье, число работников на предприятии и т.д. Эти признаки могут принимать только конечное число определенных значений.

Дискретный вариационный ряд представляет таблицу, которая состоит из двух граф. В первой графе указывается конкретное значение признака, а во второй - число единиц совокупности с определенным значением признака.

Если признак имеет непрерывное изменение (размер дохода, стаж работы, стоимость основных фондов предприятия и т.д., которые в определенных границах могут принимать любые значения), то для этого признака нужно строить интервальный вариационный ряд .

Групповая таблица здесь также имеет две графы. В первой указывается значение признака в интервале «от - до» (варианты), во второй - число единиц, входящих в интервал (частота).

Частота (частота повторения) - число повторений отдельного варианта значений признака, обозначается fi , а сумма частот, равная объему исследуемой совокупности, обозначается

где k - число вариантов значений признака

Очень часто таблица дополняется графой, в которой подсчитываются накопленные частоты S, которые показывают, какое количество единиц совокупности имеет значение признака не большее, чем данное значение.

Частоты ряда f могут заменяться частостями w, выраженными в относительных числах (долях или процентах). Они представляют собой отношения частот каждого интервала к их общей сумме, т.е.:

При построении вариационного ряда с интервальными значениями прежде всего необходимо установить величину интервала i, которая определяется как отношение размаха вариации R к числу групп m:

где R = xmax - xmin ; m = 1 + 3,322 lgn (формула Стерджесса); n - общее число единиц совокупности.

Для определения структуры совокупности используют особые средние показатели, к которым относятся медиана и мода, или так называемые структурные средние. Если средняя арифметическая рассчитывается на основе использования всех вариантов значений признака, то медиана и мода характеризуют величину того варианта, который занимает определенное среднее положение в ранжированном вариационном ряду.

Медиана (Ме) - это величина, которая соответствует варианту, находящемуся в середине ранжированного ряда.

Для ранжированного ряда с нечетным числом индивидуальных величин (например, 1, 2, 3, 3, 6, 7, 9, 9, 10) медианой будет величина, которая расположена в центре ряда, т.е. пятая величина.

Для ранжированного ряда с четным числом индивидуальных величин (например, 1, 5, 7, 10, 11, 14) медианой будет средняя арифметическая величина, которая рассчитывается из двух смежных величин.

То есть для нахождения медианы сначала необходимо определить ее порядковый номер (ее положение в ранжированном ряду) по формуле

где n - число единиц в совокупности.

Численное значение медианы определяют по накопленным частотам в дискретном вариационном ряду. Для этого сначала следует указать интервал нахождения медианы в интервальном ряду распределения. Медианным называют первый интервал, где сумма накопленных частот превышает половину наблюдений от общего числа всех наблюдений.

Численное значение медианы

где xМе - нижняя граница медианного интервала; i - величина интервала; S-1 - накопленная частота интервала, которая предшествует медианному; f - частота медианного интервала.

Модой (Мо) называют значение признака, которое встречается наиболее часто у единиц совокупности. Для дискретного ряда модой будет являться вариант с наибольшей частотой. Для определения моды интервального ряда сначала определяют модальный интервал (интервал, имеющий наибольшую частоту). Затем в пределах этого интервала находят то значение признака, которое может являться модой.

Чтобы найти конкретное значение моды, необходимо использовать формулу

где xМо - нижняя граница модального интервала; iМо - величина модального интервала; fМо - частота модального интервала; fМо-1 - частота интервала, предшествующего модальному; fМо+1 - частота интервала, следующего за модальным.

Мода имеет широкое распространение в маркетинговой деятельности при изучении покупательского спроса, особенно при определении пользующихся наибольшим спросом размеров одежды и обуви, при регулировании ценовой политики.

Основной целью анализа вариационных рядов является выявление закономерности распределения, исключая при этом влияние случайных для данного распределения факторов. Этого можно достичь, если увеличивать объем исследуемой совокупности и одновременно уменьшать интервал ряда. При попытке изображения этих данных графически мы получим некоторую плавную кривую линию, которая для полигона частот будет являться некоторым пределом. Эту линию называют кривой распределения.

Иными словами, кривая распределения есть графическое изображение в виде непрерывной линии изменения частот в вариационном ряду, которое функционально связано с изменением вариант. Кривая распределения отражает закономерность изменения частот при отсутствии случайных факторов. Графическое изображение облегчает анализ рядов распределения.

Известно достаточно много форм кривых распределения, по которым может выравниваться вариационный ряд, но в практике статистических исследований наиболее часто используются такие формы, как нормальное распределение и распределение Пуассона.

Нормальное распределение зависит от двух параметров: средней арифметической и среднего квадратического отклонения . Его кривая выражается уравнением

где у - ордината кривой нормального распределения; - стандартизованные отклонения; е и π - математические постоянные; x - варианты вариационного ряда; - их средняя величина; - cреднее квадратическое отклонение.

Если нужно получить теоретические частоты f" при выравнивании вариационного ряда по кривой нормального распределения, то можно воспользоваться формулой

где - сумма всех эмпирических частот вариационного ряда; h - величина интервала в группах; - cреднее квадратическое отклонение; - нормированное отклонение вариантов от средней арифметической; все остальные величины легко вычисляются по специальным таблицам.

При помощи этой формулы мы получаем теоретическое (вероятностное) распределение , заменяя им эмпирическое (фактическое) распределение , по характеру они не должны отличаться друг от друга.

Тем не менее в ряде случаев, если вариационный ряд представляет собой распределение по дискретному признаку, где при увеличении значений признака х частоты начинают резко уменьшаться, а средняя арифметическая, в свою очередь, равна или близка по значению к дисперсии (), такой ряд выравнивается по кривой Пуассона.

Кривую Пуассона можно выразить отношением

где Px - вероятность наступления отдельных значений х; - средняя арифметическая ряда.

При выравнивании эмпирических данных теоретические частоты можно определить по формуле

где f" - теоретические частоты; N - общее число единиц ряда.

Сравнивая полученные величины теоретических частот f" c эмпирическими (фактическими) частотами f, убеждаемся, что их расхождения могут быть весьма невелики.

Объективная характеристика соответствия теоретических и эмпирических частот может быть получена при помощи специальных статистических показателей, которые называют критериями согласия.

Для оценки близости эмпирических и теоретических частот применяются критерий согласия Пирсона, критерий согласия Романовского, критерий согласия Колмогорова.

Наиболее распространенным является критерий согласия К. Пирсона , который можно представить как сумму отношений квадратов расхождений между f" и f к теоретическим частотам:

Вычисленное значение критерия необходимо сравнить с табличным (критическим) значением . Табличное значение определяется по специальной таблице, оно зависит от принятой вероятности Р и числа степеней свободы k (при этом k = m - 3, где m - число групп в ряду распределения для нормального распределения). При расчете критерия согласия Пирсона должно соблюдаться следующее условие: достаточно большим должно быть число наблюдений (n 50), при этом если в некоторых интервалах теоретические частоты < 5, то интервалы объединяют для условия > 5.

Если , то расхождения между эмпирическими и теоретическими частотами распределения могут быть случайными и предположение о близости эмпирического распределения к нормальному не может быть отвергнуто.

В том случае, если отсутствуют таблицы для оценки случайности расхождения теоретических и эмпирических частот, можно использовать критерий согласия В.И. Романовского КРом, который, используя величину , предложил оценивать близость эмпирического распределения кривой нормального распределения при помощи отношения

где m - число групп; k = (m - 3) - число степеней свободы при исчислении частот нормального распределения.

Если вышеуказанное отношение < 3, то расхождения эмпирических и теоретических частот можно считать случайными, а эмпирическое распределение - соответствующим нормальному. Если отношение > 3, то расхождения могут быть достаточно существенными и гипотезу о нормальном распределении следует отвергнуть.

Критерий согласия А.Н. Колмогорова используется при определении максимального расхождения между частотами эмпирического и теоретического распределения, вычисляется по формуле

где D - максимальное значение разности между накопленными эмпирическими и теоретическими частотами; - сумма эмпирических частот.

По таблицам значений вероятностей -критерия можно найти величину , соответствующую вероятности Р. Если величина вероятности Р значительна по отношению к найденной величине , то можно предположить, что расхождения между теоретическим и эмпирическим распределениями несущественны.

Необходимым условием при использовании критерия согласия Колмогорова является достаточно большое число наблюдений (не меньше ста).

Первым этапом статистического изучения вариации являются построение вариационного ряда - упорядоченного распределения единиц совокупности по возрастающим (чаще) или по убывающим (реже) значениям признака и подсчет числа единиц с тем или иным значением признака.

Существуют три формы вариационного ряда: ранжированный, дискретный, интервальный. Вариационный ряд часто называют рядом распределения. Этот термин употребляется при изучении вариации как количественных, так и неколичественных признаков. Ряд распределения представляет собой структурную группировку (гл. 6).

Ранжированный ряд - это перечень отдельных единиц совокупности в порядке возрастания (убывания) изучаемого признака.

Ниже приведены сведения о крупных банках Санкт-Петербурга, ранжированных по размерам собственного капитала на 01.10.1999 г.

Название банка Собственный капитал, млн руб.

Балтонэксим банк 169

Банк «Санкт-Петербург» 237

Петровский 268

Балтийский 290

Промстройбанк 1007

Если численность единиц совокупности достаточно велика, ранжированный ряд становится громоздким, а его построение, даже с помощью компьютера, занимает длительное время. В таких случаях вариационный ряд строится с помощью группировки единиц совокупности по значениям изучаемого признака.

Определение числа групп

Число групп в дискретном вариационном ряду определяется числом реально существующих значений варьирующего признака. Если признак принимает дискретные значения, но их число очень велико (например, поголовье скота на 1 января года в разных сельскохозяйственных предприятиях может составить от нуля до десятков тысяч голов), то строится интервальный вариационный ряд. Интервальный вариационный ряд строится и для изучения признаков, которые могут принимать любые, как целые, так и дробные значения в области своего существования. Таковы, например, рентабельность реализованной продукции, себестоимость единицы продукции, доход на одного жителя города, доля лиц с высшим образованием среди населения разных территорий и вообще все вторичные признаки, значения которых рассчитываются путем деления величины одного первичного признака на величину другого (см. гл. 3).

Интервальный вариационный ряд представляет собой таблицу, состоящую из двух граф (или строк) - интервалов признака, вариация которого изучается, и числа единиц совокупности, попадающих в данный интервал (частот), или долей этого числа от общей численности совокупности (частостей).

Наиболее часто используются два вида интервальных вариационных рядов: равноинтервальный и равночастотный. Равноинтервальный ряд применяется, если вариация признака не очень сильна, т.е. для однородной совокупности, распределение которой по данному признаку близко к нормальному закону. (Такой ряд представлен в табл. 5.6.) Равночастотный ряд применяется, если вариация признака очень сильна, однако распределение не является нормальным, а, например, гиперболическим (табл. 5.5).

При построении равноинтервального ряда число групп выбирается так, чтобы в достаточной мере отразились разнообразие значений признака в совокупности и в то же время закономерность распределения, его форма не искажалась случайными колебаниями частот. Если групп будет слишком мало, не проявится закономерность вариации; если групп будет чрезмерно много, случайные скачки частот исказят форму распределения.


Границы интервалов могут указываться разным образом: верхняя граница предыдущего интервала повторяет нижнюю границу следующего, как показано в табл. 5.5, или не повторяет.

В последнем случае второй интервал будет обозначен как 15,1-20, третий - как 20,1-25 и т.д., т.е. предполагается, что все значения урожайности обязательно округлены до одной десятой. Кроме того, возникает нежелательное осложнение с серединой интервала 15,1-20, которая, строго говоря, уже будет равна не 17,5, а 17,55; соответственно при замене округленного интервала 40-60 на 40,1-60 вместо округленного значения его середины 50 получим 50,5. Поэтому предпочтительнее оставить интервалы с повторяющейся округленной границей и договориться, что единицы совокупности, имеющие значение признака, равное границе интервала, включаются в тот интервал, где это точное значение впервые указывается. Так, хозяйство, имеющее урожайность, равную 15 ц/га, включается в первую группу, значение 20 ц/га - во вторую и т.д.

Равночастотный вариационный ряд необходим при очень сильной вариации признака потому, что при равноинтерваль-ном распределении большая часть единиц совокупности ока-

Таблица 5.5

Распределение 100 банков России по балансовой оценке активов на 01.01.2000 г.

Границы интервалов при равночастотном распределении - это фактические величины активов первого, десятого, одиннадцатого, двадцатого и так далее банков.

Графическое изображение вариационного ряда

Существенную помощь в анализе вариационного ряда и его свойств оказывает графическое изображение. Интервальный ряд изображается столбиковой диаграммой, в которой основания столбиков, расположенные на оси абсцисс, - это интервалы значений варьирующего признака, а высота столбиков - частоты, соответствующие масштабу по оси ординат. Графическое изображение распределения хозяйств области по урожайности зерновых культур приведено на рис. 5.1. Диаграмма этого рода часто называется гистограммой (гр. histos - ткань).

Данные табл. 5.6 и рис. 5.1 показывают характерную для многих признаков форму распределения: чаще встречаются значения средних интервалов признака, реже - крайние, малые и большие значения признака. Форма этого распределения близка к рассматриваемому в курсе математической статистики закону нормального распределения. Великий русский математик А. М. Ляпунов (1857-1918) доказал, что нор-

Таблица 5.6 Распределение хозяйств области по урожайности зерновых культур

мальное распределение образуется, если на варьирующую переменную влияет большое число факторов, ни один из которых не имеет преобладающего влияния. Случайное сочетание множества примерно равных факторов, влияющих на вариации урожайности зерновых культур, как природных, так и агротехнических, экономических, создает близкое к нормальному закону распределения распределение хозяйств области по урожайности.

Рис. 5.2. Кумулята и огива распределения хозяйств по урожайности

Такой ряд называется кумулятивным. Можно построить кумулятивное распределение «не меньше, чем», а можно «больше, чем». В первом случае график кумулятивного распределения называется кумулятой, во втором - огивой (рис. 5.2).

Плотность распределения

Если приходится иметь дело с вариационным рядом с неравными интервалами, то для сопоставимости нужно частоты, или частости, привести к единице интервала. Полученное отношение называется плотностью распределения:

Плотность распределения используется как для расчета обобщающих показателей, так и для графического изображения вариационных рядов с неравными интервалами.

Понятие сводки, группировки, классификации

Сводка – систематизация и подведение итогов: метеосводка, сводка с полей. Сводка не позволяет детально проанализировать информацию. Любая сводка должна опираться на группировку данных, т.е. сначала группировка, а потом сводка данных.

Группировка – разделение совокупностей на ряд групп по наиболее существенным признакам.

Различают качественную и количественную группировку. Качественная – атрибутивная, количественная – вариационная. В свою очередь вариационная делится на структурную и аналитическую. Структурная группировка предполагает расчет удельного веса каждой группы. Пример: на предприятии 80% - рабочие, 20% - служащие, из них 5% - руководители, 3% - служащие,12% - специалисты. Цель аналитической группировки – выявить взаимосвязь между признаками: стажем работы и средним заработком, стажем и выработкой и другими.

При проведении группировки необходимо:

Проведение всестороннего анализа природы изучаемого явления;

Выявление группировочного признака (одного или нескольких);

Установить границы групп таким образом, чтобы группы существенно отличались друг от друга, и в каждой группе объединялись однородные элементы.

По степени сложности группировки могут быть простые и комбинационные (по признакам).

По исходной информации различают первичную и вторичную группировки, первичная осуществляется на основе исходных данных наблюдения, вторичная использует данные первичной группировки.

Количество групп определяется по формуле Стерджесса:

где n - количество групп, N – генеральная совокупность.

Если используются равные интервалы, то величина интервала равна .

Интервалы могут быть равные и неравные. Последние, в свою очередь, делятся на изменяющиеся по закону арифметической или геометрической прогрессии. Первый и последний интервалы могут быть открытые или закрытые. Закрытые интервалы включают или не включают границы интервала.

Если интервалы закрытые, и ничего не сказано о включении верхних границ, то считаем, что верхние границы включены.

Если интервалы открытые, то ориентируемся по последнему интервалу.

Признак в этих интервалах может измеряться дискретно и непрерывно (т.е. дробиться). При непрерывном признаке границы смыкаются 1- 10, 10 - 20, 20 – 30; если признак изменяется дискретно, то можно использовать следующую запись: 1 – 10, 11 – 20, 21 – 30.

Если интервалы открытые, то величина последнего интервала приравнивается к предыдущему, а первого - ко второму.

Классификация – группировка по качественному признаку. Она относительно устойчива, стандартизирована и утверждается органами государственной статистики.


3.2. Ряды распределения: виды и основные характеристики

Под рядом распределения понимается ряд данных, характеризующих какое-либо социально-экономическое явление по одному признаку. Это простейший вид группировки по двум признакам.

Ряды распределения делятся на качественные и количественные, на ранжированные и не ранжированные, на сгруппированные и не сгруппированные, с дискретным и непрерывным распределением признака.

Примером не сгруппированного, не ранжированного ряда по заработной плате является ведомость заработной платы. В то же время, список работников может быть ранжированный по алфавиту или по табельным номерам. Примером ранжированного ряда является список команд, рейтинг теннисистов.

Ранжированный ряд распределения - ряд данных, расположенных в порядке убывания или возрастания признака.

Для сгруппированных ранжированных рядов выделяют следующие характеристики: варианту, частоту или частость, кумуляту и плотность распределения.

Варианта () – среднее интервальное значение признака. Т.к. при создании группировки должен выполняться принцип равномерного распределения признака в каждом интервале, то варианту можно рассчитывать как полусумму границ интервалов.

Частота () показывает сколько раз встречается данное значение признака. Относительное выражение частоты представляет собой частость (.) , т.е. долю, удельный вес от суммы частот.

Кумулята () – накопленная частота или частость, расчет нарастающим итогом. Кумулятивно подсчитываются объем, затраты, доходы, т.е. результаты деятельности.

Таблица 1

Группировка действующих кредитных организаций
по величине зарегистрированного уставного капитала

в 2008 году в РФ