Как рассчитать структурные средние. Как высчитать среднее значение

Средние величины относятся к обобщающим статистическим показателям, которые дают сводную (итоговую) характеристику массовых общественных явлений, так как строятся на основе большого количества индивидуальных значений варьирующего признака. Для выяснения сущности средней величины необходимо рассмотреть особенности формирования значений признаков тех явлений, по данным которых исчисляют среднюю величину.

Известно, что единицы каждого массового явления обладают многочисленными признаками. Какой бы из этих признаков мы ни взяли, его значения у отдельных единиц будут различными, они изменяются, или, как говорят в статистике , варьируют от одной единицы к другой. Так, например, заработная плата работника определяется его квалификацией, характером труда, стажем работы и целым рядом других факторов, поэтому изменяется в весьма широких пределах. Совокупное влияние всех факторов определяет размер заработка каждого работника, тем не менее можно говорить о среднемесячной заработной плате работников разных отраслей экономики . Здесь мы оперируем типичным, характерным значением варьирующего признака, отнесенным к единице многочисленной совокупности.

Средняя величина отражает то общее, что характерно для всех единиц изучаемой совокупности. В то же время она уравновешивает влияние всех факторов, действующих на величину признака отдельных единиц совокупности, как бы взаимно погашая их. Уровень (или размер) любого общественного явления обусловлен действием двух групп факторов. Одни из них являются общими и главными, постоянно действующими, тесно связанными с природой изучаемого явления или процесса, и формируют то типичное для всех единиц изучаемой совокупности, которое и отражается в средней величине. Другие являются индивидуальными, их действие выражено слабее и носит эпизодический, случайный характер. Они действуют в обратном направлении, обусловливают различия между количественными признаками отдельных единиц совокупности, стремясь изменить постоянную величину изучаемых признаков. Действие индивидуальных признаков погашается в средней величине. В совокупном влиянии типичных и индивидуальных факторов, которое уравновешивается и взаимно погашается в обобщающих характеристиках, проявляется в общем виде известный из математической статистики фундаментальный закон больших чисел.

В совокупности индивидуальные значения признаков сливаются в общую массу и как бы растворяются. Отсюда и средняя величина выступает как «обезличенная», которая может отклоняться от индивидуальных значений признаков, не совпадая количественно ни с одним из них. Средняя величина отражает общее, характерное и типичное для всей совокупности благодаря взаимопогашению в ней случайных, нетипичных различий между признаками отдельных ее единиц, так как ее величина определяется как бы общей равнодействующей из всех причин.

Однако для того, чтобы средняя величина отражала наиболее типичное значение признака, она должна определяться не для любых совокупностей, а только для совокупностей, состоящих из качественно однородных единиц. Это требование является основным условием научно обоснованного применения средних величин и предполагает тесную связь метода средних величин и метода группировок в анализе социально-экономических явлений. Следовательно, средняя величина - это обобщающий показатель, характеризующий типичный уровень варьирующего признака в расчете на единицу однородной совокупности в конкретных условиях места и времени.

Определяя, таким образом, сущность средних величин, необходимо подчеркнуть, что правильное исчисление любой средней величины предполагает выполнение следующих требований:

  • качественная однородность совокупности, по которой вычислена средняя величина. Это означает, что исчисление средних величин должно основываться на методе группировок, обеспечивающем выделение однородных, однотипных явлений;
  • исключение влияния на вычисление средней величины случайных, сугубо индивидуальных причин и факторов. Это достигается в том случае, когда вычисление средней основывается на достаточно массовом материале, в котором проявляется действие закона больших чисел, и все случайности взаимно погашаются;
  • при вычислении средней величины важно установить цель ее расчета и так называемый определяющий показа-телъ (свойство), на который она должна быть ориентирована.

Определяющий показатель может выступать в виде суммы значений осредняемого признака, суммы его обратных значений, произведения его значений и т. п. Связь между определяющим показателем и средней величиной выражается в следующем: если все значения осредняемого признака заменить средним значением, то их сумма или произведение в этом случае не изменит определяющего показателя. На основе этой связи определяющего показателя со средней величиной строят исходное количественное отношение для непосредственного расчета средней величины. Способность средних величин сохранять свойства статистических совокупностей называют определяющим свойством.

Средняя величина, рассчитанная в целом по совокупности, называется общей средней; средние величины, рассчитанные для каждой группы, - групповыми средними. Общая средняя отражает общие черты изучаемого явления, групповая средняя дает характеристику явления, складывающуюся в конкретных условиях данной группы.

Способы расчета могут быть разные, поэтому в статистике различают несколько видов средней величины, основными из которых являются средняя арифметическая, средняя гармоническая и средняя геометрическая.

В экономическом анализе использование средних величин является основным инструментом для оценки результатов научно-технического прогресса, социальных мероприятий, поиска резервов развития экономики. В то же время следует помнить о том, что чрезмерное увлечение средними показателями может привести к необъективным выводам при проведении экономико-статистического анализа. Это связано с тем, что средние величины, будучи обобщающими показателями, погашают, игнорируют те различия в количественных признаках отдельных единиц совокупности, которые реально существуют и могут представлять самостоятельный интерес.

Виды средних величин

В статистике используют различные виды средних величин, которые делятся на два больших класса:

  • степенные средние (средняя гармоническая, средняя геометрическая, средняя арифметическая, средняя квадра-тическая, средняя кубическая);
  • структурные средние (мода, медиана).

Для вычисления степенных средних необходимо использовать все имеющиеся значения признака. Мода и медиана определяются лишь структурой распределения, поэтому их называют структурными, позиционными средними. Медиану и моду часто используют как среднюю характеристику в тех совокупностях, где расчет средней степенной невозможен или нецелесообразен.

Самый распространенный вид средней величины - средняя арифметическая. Под средней арифметической понимается такое значение признака, которое имела бы каждая единица совокупности, если бы общий итог всех значений признака был распределен равномерно между всеми единицами совокупности. Вычисление данной величины сводится к суммированию всех значений варьирующего признака и делению полученной суммы на общее количество единиц совокупности. Например, пять рабочих выполняли заказ на изготовление деталей, при этом первый изготовил 5 деталей, второй - 7, третий - 4, четвертый - 10, пятый- 12. Поскольку в исходных данных значение каждого варианта встречалось только один раз, для определения средней выработки одного рабочего следует применить формулу простой средней арифметической:

т. е. в нашем примере средняя выработка одного рабочего равна

Наряду с простой средней арифметической изучают среднюю арифметическую взвешенную. Например, рассчитаем средний возраст студентов в группе из 20 человек , возраст которых варьируется от 18 до 22 лет, где xi - варианты осредняемого признака, fi - частота, которая показывает, сколько раз встречается i-е значение в совокупности (табл. 5.1).

Таблица 5.1

Средний возраст студентов

Применяя формулу средней арифметической взвешенной, получаем:


Для выбора средней арифметической взвешенной существует определенное правило: если имеется ряд данных по двум показателям, для одного из которых надо вычислить

среднюю величину, и при этом известны численные значения знаменателя ее логической формулы, а значения числителя неизвестны, но могут быть найдены как произведение этих показателей, то средняя величина должна высчитывать-ся по формуле средней арифметической взвешенной.

В некоторых случаях характер исходных статистических данных таков, что расчет средней арифметической теряет смысл и единственным обобщающим показателем может служить только другой вид средней величины - средняя гармоническая. В настоящее время вычислительные свойства средней арифметической потеряли свою актуальность при расчете обобщающих статистических показателей в связи с повсеместным внедрением электронно-вычислительной техники. Большое практическое значение приобрела средняя гармоническая величина, которая тоже бывает простой и взвешенной. Если известны численные значения числителя логической формулы, а значения знаменателя неизвестны, но могут быть найдены как частное деление одного показателя на другой, то средняя величина вычисляется по формуле средней гармонической взвешенной.

Например, пусть известно, что автомобиль прошел первые 210 км со скоростью 70 км/ч, а оставшиеся 150 км со скоростью 75 км/ч. Определить среднюю скорость автомобиля на протяжении всего пути в 360 км, используя формулу средней арифметической, нельзя. Так как вариантами являются скорости на отдельных участках xj = 70 км/ч и Х2 = 75 км/ч, а весами (fi) считаются соответствующие отрезки пути, то произведения вариантов на веса не будут иметь ни физического, ни экономического смысла. В данном случае смысл приобретают частные от деления отрезков пути на соответствующие скорости (варианты xi), т. е. затраты времени на прохождение отдельных участков пути (fi/ xi). Если отрезки пути обозначить через fi, то весь путь выразиться как Σfi, а время, затраченное на весь путь, - как Σ fi/ xi , Тогда средняя скорость может быть найдена как частное от деления всего пути на общие затраты времени:

В нашем примере получим:

Если при использовании средней гармонической веса всех вариантов (f) равны, то вместо взвешенной можно использовать простую (невзвешенную) среднюю гармоническую:

где xi - отдельные варианты; n - число вариантов осредняемого признака. В примере со скоростью простую среднюю гармоническую можно было бы применить, если бы были равны отрезки пути, пройденные с разной скоростью.

Любая средняя величина должна вычисляться так, чтобы при замене ею каждого варианта осредняемого признака не изменялась величина некоторого итогового, обобщающего показателя, который связан с осредняемым показателем. Так, при замене фактических скоростей на отдельных отрезках пути их средней величиной (средней скоростью) не должно измениться общее расстояние.

Форма (формула) средней величины определяется характером (механизмом) взаимосвязи этого итогового показателя с осредняемым, поэтому итоговый показатель, величина которого не должна изменяться при замене вариантов их средней величиной, называется определяющим показателем. Для вывода формулы средней нужно составить и решить уравнение, используя взаимосвязь осредняемого показателя с определяющим. Это уравнение строится путем замены вариантов осредняемого признака (показателя) их средней величиной.

Кроме средней арифметической и средней гармонической в статистике используются и другие виды (формы) средней величины. Все они являются частными случаями степенной средней. Если рассчитывать все виды степенных средних величин для одних и тех же данных, то значения

их окажутся одинаковыми, здесь действует правило мажо-рантности средних. С увеличением показателя степени средних увеличивается и сама средняя величина. Наиболее часто применяемые в практических исследованиях формулы вычисления различных видов степенных средних величин представлены в табл. 5.2.

Таблица 5.2


Средняя геометрическая применяется, когда имеется n коэффициентов роста, при этом индивидуальные значения признака представляют собой, как правило, относительные величины динамики, построенные в виде цепных величин, как отношение к предыдущему уровню каждого уровня в ряду динамики. Средняя характеризует, таким образом, средний коэффициент роста. Средняя геометрическая простая рассчитывается по формуле

Формула средней геометрической взвешенной имеет следующий вид:

Приведенные формулы идентичны, но одна применяется при текущих коэффициентах или темпах роста, а вторая - при абсолютных значениях уровней ряда.

Средняя квадратическая применяется при расчете с величинами квадратных функций, используется для измерения степени колеблемости индивидуальных значений признака вокруг средней арифметической в рядах распределения и вычисляется по формуле

Средняя квадратическая взвешенная рассчитывается по другой формуле:

Средняя кубическая применяется при расчете с величинами кубических функций и вычисляется по формуле

средняя кубическая взвешенная:

Все рассмотренные выше средние величины могут быть представлены в виде общей формулы:

где - средняя величина; - индивидуальное значение; n - число единиц изучаемой совокупности; k - показатель степени, определяющий вид средней.

При использовании одних и тех же исходных данных, чем больше k в общей формуле степенной средней, тем больше средняя величина. Из этого следует, что между величинами степенных средних существует закономерное соотношение:

Средние величины, описанные выше, дают обобщенное представление об изучаемой совокупности и с этой точки зрения их теоретическое, прикладное и познавательное значение бесспорно. Но бывает, что величина средней не совпадает ни с одним из реально существующих вариантов, поэтому кроме рассмотренных средних в статистическом анализе целесообразно использовать величины конкретных вариантов, занимающие в упорядоченном (ранжированном) ряду значений признака вполне определенное положение. Среди таких величин наиболее употребительными являются структурные, или описательные, средние - мода (Мо) и медиана (Ме).

Мода - величина признака, которая чаще всего встречается в данной совокупности. Применительно к вариационному ряду модой является наиболее часто встречающееся значение ранжированного ряда, т. е. вариант, обладающий наибольшей частотой. Мода может применяться при определении магазинов, которые чаще посещаются, наиболее распространенной цены на какой-либо товар. Она показывает размер признака, свойственный значительной части совокупности, и определяется по формуле

где х0 - нижняя граница интервала; h - величина интервала; fm - частота интервала; fm_ 1 - частота предшествующего интервала; fm+ 1 - частота следующего интервала.

Медианой называется вариант, расположенный в центре ранжированного ряда. Медиана делит ряд на две равные части таким образом, что по обе стороны от нее находится одинаковое количество единиц совокупности. При этом у одной половины единиц совокупности значение варьирующего признака меньше медианы, у другой - больше ее. Медиана используется при изучении элемента, значение которого больше или равно или одновременно меньше или равно половине элементов ряда распределения. Медиана дает общее представление о том, где сосредоточены значения признака, иными словами, где находится их центр.

Описательный характер медианы проявляется в том, что она характеризует количественную границу значений варьирующего признака, которыми обладает половина единиц совокупности. Задача нахождения медианы для дискретного вариационного ряда решается просто. Если всем единицам ряда придать порядковые номера, то порядковый номер медианного варианта определяется как (п +1) / 2 с нечетным числом членов п. Если же количество членов ряда является четным числом, то медианой будет являться среднее значение двух вариантов, имеющих порядковые номера n / 2 и n / 2 + 1.

При определении медианы в интервальных вариационных рядах сначала определяется интервал, в котором она находится (медианный интервал). Этот интервал характерен тем, что его накопленная сумма частот равна или превышает полусумму всех частот ряда. Расчет медианы интервального вариационного ряда производится по формуле

где X0 - нижняя граница интервала; h - величина интервала; fm - частота интервала; f - число членов ряда;

∫m-1 - сумма накопленных членов ряда, предшествующих данному.

Наряду с медианой для более полной характеристики структуры изучаемой совокупности применяют и другие значения вариантов, занимающих в ранжированном ряду вполне определенное положение. К ним относятся квартили и децили. Квартили делят ряд по сумме частот на 4 равные части, а децили - на 10 равных частей. Квартилей насчитывается три, а децилей - девять.

Медиана и мода в отличие от средней арифметической не погашают индивидуальных различий в значениях варьирующего признака и поэтому являются дополнительными и очень важными характеристиками статистической совокупности. На практике они часто используются вместо средней либо наряду с ней. Особенно целесообразно вычислять медиану и моду в тех случаях, когда изучаемая совокупность содержит некоторое количество единиц с очень большим или очень малым значением варьирующего признака. Эти, не очень характерные для совокупности значения вариантов, влияя на величину средней арифметической, не влияют на значения медианы и моды, что делает последние очень ценными для экономико-статистического анализа показателями.

Показатели вариации

Целью статистического исследования является выявление основных свойств и закономерностей изучаемой статистической совокупности. В процессе сводной обработки данных статистического наблюдения строят ряды распределения. Различают два типа рядов распределения - атрибутивные и вариационные, в зависимости от того, является ли признак, взятый за основу группировки, качественным или количественным.

Вариационными называют ряды распределения, построенные по количественному признаку. Значения количественных признаков у отдельных единиц совокупности не постоянны, более или менее различаются между собой. Такое различие в величине признака носит название вариации. Отдельные числовые значения признака, встречающиеся в изучаемой совокупности, называют вариантами значений. Наличие вариации у отдельных единиц совокупности обусловлено влиянием большого числа факторов на формирование уровня признака. Изучение характера и степени вариации признаков у отдельных единиц совокупности является важнейшим вопросом всякого статистического исследования. Для описания меры изменчивости признаков используют показатели вариации.

Другой важной задачей статистического исследования является определение роли отдельных факторов или их групп в вариации тех или иных признаков совокупности. Для решения такой задачи в статистике применяются специальные методы исследования вариации, основанные на использовании системы показателей, с помощью которых измеряется вариация. В практике исследователь сталкивается с достаточно большим количеством вариантов значений признака, что не дает представления о распределении единиц по величине признака в совокупности. Для этого проводят расположение всех вариантов значений признака в возрастающем или убывающем порядке. Этот процесс называют ранжированием ряда. Ранжированный ряд сразу дает общее представление о значениях, которые принимает признак в совокупности.

Недостаточность средней величины для исчерпывающей характеристики совокупности заставляет дополнять средние величины показателями, позволяющими оценить типичность этих средних путем измерения колеблемости (вариации) изучаемого признака. Использование этих показателей вариации дает возможность сделать статистический анализ более полным и содержательным и тем самым глубже понять сущность изучаемых общественных явлений.

Самыми простыми признаками вариации являются минимум и максимум - это наименьшее и наибольшее значение признака в совокупности. Число повторений отдельных вариантов значений признаков называют частотой повторения. Обозначим частоту повторения значения признака fi, сумма частот, равная объему изучаемой совокупности будет:

где k - число вариантов значений признака. Частоты удобно заменять частостями - wi. Частость - относительный показатель частоты - может быть выражен в долях единицы или процентах и позволяет сопоставлять вариационные ряды с различным числом наблюдений. Формально имеем:

Для измерения вариации признака применяются различные абсолютные и относительные показатели. К абсолютным показателям вариации относятся среднее линейное отклонение, размах вариации, дисперсия, среднее квадратическое отклонение.

Размах вариации (R) представляет собой разность между максимальным и минимальным значениями признака в изучаемой совокупности: R = Xmax - Xmin. Этот показатель дает лишь самое общее представление о колеблемости изучаемого признака, так как показывает разницу только между предельными значениями вариантов. Он совершенно не связан с частотами в вариационном ряду, т. е. с характером распределения, а его зависимость может придавать ему неустойчивый, случайный характер только от крайних значений признака. Размах вариации не дает никакой информации об особенностях исследуемых совокупностей и не позволяет оценить степень типичности полученных средних величин. Область применения этого показателя ограничена достаточно однородными совокупностями, точнее, характеризует вариацию признака показатель, основанный на учете изменчивости всех значений признака.

Для характеристики вариации признака нужно обобщить отклонения всех значений от какой-либо типичной для изучаемой совокупности величины. Такие показатели

вариации, как среднее линейное отклонение, дисперсия и среднее квадратическое отклонение, основаны на рассмотрении отклонений значений признака отдельных единиц совокупности от средней арифметической.

Среднее линейное отклонение представляет собой среднюю арифметическую из абсолютных значений отклонений отдельных вариантов от их средней арифметической:


Абсолютное значение (модуль) отклонения варианта от средней арифметической; f- частота.

Первая формула применяется, если каждый из вариантов встречается в совокупности только один раз, а вторая - в рядах с неравными частотами.

Существует и другой способ усреднения отклонений вариантов от средней арифметической. Этот очень распространенный в статистике способ сводится к расчету квадратов отклонений вариантов от средней величины с их последующим усреднением. При этом мы получаем новый показатель вариации - дисперсию.

Дисперсия (σ 2) - средняя из квадратов отклонений вариантов значений признака от их средней величины:

Вторая формула применяется при наличии у вариантов своих весов (или частот вариационного ряда).

В экономико-статистическом анализе вариацию признака принято оценивать чаще всего с помощью среднего квадратического отклонения. Среднее квадратическое отклонение (σ) представляет собой корень квадратный из дисперсии:

Среднее линейное и среднее квадратическое отклонения показывают, на сколько в среднем колеблется величина признака у единиц исследуемой совокупности, и выражаются в тех же единицах измерения, что и варианты.

В статистической практике часто возникает необходимость сравнения вариации различных признаков. Например, большой интерес представляет сравнение вариаций возраста персонала и его квалификации, стажа работы и размера заработной платы и т. д. Для подобных сопоставлений показатели абсолютной колеблемости признаков - среднее линейное и среднее квадртическое отклонение - не пригодны. Нельзя, в самом деле, сравнивать колеблемость стажа работы, выражаемую в годах, с колеблемостью заработной платы, выражаемой в рублях и копейках.

При сравнении изменчивости различных признаков в совокупности удобно применять относительные показатели вариации. Эти показатели вычисляются как отношение абсолютных показателей к средней арифметической (или медиане). Используя в качестве абсолютного показателя вариации размах вариации, среднее линейное отклонение, среднее квадратическое отклонение, получают относительные показатели колеблемости:


Наиболее часто применяемый показатель относительной колеблемости, характеризующий однородность совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33 % для распределений, близких к нормальному.

В целях анализа и получения статистических выводов по результатом сводки и группировки исчисляют обобщающие показатели – средние и относительные величины.

Задача средних величин – охарактеризовать все единицы статистической совокупности одним значением признака.

Средними величинами характеризуются качественные показатели предпринимательской деятельности: издержки обращения, прибыль, рентабельность и др.

Средняя величина – это обобщающая характеристика единиц совокупности по какому–либо варьирующему признаку.

Средние величины позволяют сравнивать уровни одного и того же признака в различных совокупностях и находить причины этих расхождений.

В анализе изучаемых явлений роль средних величин огромна. Английский экономист В. Петти (1623-1687 гг.) широко использовал средние величины. В. Петти хотел использовать средние величины в качестве меры стоимости расходов на среднее дневное пропитание одного работника. Устойчивость средней величины – это отражение закономерности изучаемых процессов. Он считал что информацию можно преобразовать, даже если нет достаточного объема исходных данных.

Применял средние и относительные величины английский ученый Г. Кинг (1648-1712) при анализе данных о населении Англии.

Теоретические разработки бельгийского статистика А. Кетле (1796-1874 гг.) основаны на противоречивости природы социальных явлений – высокоустойчивых в массе, но сугубо индивидуальных.

Согласно А. Кетле постоянные причины действуют одинаково на каждое изучаемое явление и делают эти явления похожими друг на друга, создают общие для всех них закономерности.

Следствием учения А. Кетле явилось выделение средних величин в качестве основного приема статистического анализа. Он говорил, что статистические средние величины представляют собой не категорию объективной действительности.

А. Кетле выразил взгляды на среднюю величину в своей теории среднего человека. Средний человек – это человек, обладающий всеми качествами в среднем размере (средняя смертность или рождаемость, средний рост и вес, средняя быстрота бега, средняя наклонность к браку и самоубийству, к добрым делам и т. д.). Для А. Кетле средний человек – это идеал человека. Несостоятельность теории среднего человека А. Кетле была доказана в русской статистической литературе в конце XIX-XX вв.

Известный русский статистик Ю. Э. Янсон (1835-1893 гг.) писал, что А. Кетле предполагает существование в природе типа среднего человека как чего–то данного, от которого жизнь отклонила средних людей данного общества и данного времени, а это приводит его к совершенно механическому взгляду и на законы движения социальной жизни: движение – это постепенное возрастание средних свойств человека, постепенное восстановление типа; следовательно, такое нивелирование всех проявлений жизни социального тела, за которым всякое поступательное движение прекращается.

Сущность данной теории нашла свое дальнейшее развитие в работах ряда теоретиков статистики как теория истинных величин. У А. Кетле были последователи – немецкий экономист и статистик В. Лексис (1837-1914 гг.), перенесший теорию истинных величин на экономические явления общественной жизни. Его теория известна под названием теория устойчивости. Другая разновидность идеалистической теории средних величин основана на философии

Ее основатель – английский статистик А. Боули (1869– 1957гг.) – один из самых видных теоретиков новейшего времени в области теории средних величин. Его концепция средних величин изложена в книге «Элементы статистики».

А. Боули рассматривает средние величины лишь с количественной стороны, тем самым отрывает количество от качества. Определяя значение средних величин (или «их функцию»), А. Боули выдвигает махистский принцип мышления. А. Боули писал, что функция средних величин должна выражать сложную группу

с помощью немногих простых чисел. Статистические данные должны быть упрощены, сгруппированы и приведены к средним Эти взгляды: разделяли Р. Фишер (1890-1968 гг.), Дж. Юл (1871 – 1951 гг.), Фредерик С. Миллс (1892 г) и др.

В 30-е гг. XX в. и последующие годы средняя величина рассматривается как социально значимая характеристика, информативность которой зависит от однородности данных.

Виднейшие представители итальянской школы Р. Бенини (1862-1956 гг.) и К. Джини (1884-1965 гг.), считая статистику отраслью логики, расширили область применения статистической индукции, но познавательные принципы логики и статистики они связывали с природой изучаемых явлений, следуя традициям социологической трактовки статистики.

В работах К. Маркса и В. И. Ленина средним величинам отводится особая роль.

К. Маркс утверждал, что в средней величине погашаются индивидуальные отклонения от общего уровня и средний уровень становится обобщающей характеристикой массового явления Такой характеристикой массового явления средняя величина становится лишь при условии, если взято значительное число единиц и эти единицы качественно однородны. Маркс писал, чтобы находимая средняя величина была средней «…многих различных индивидуальных величин одного и того же вида».

Средняя величина приобретает особую значимость в условиях рыночной экономики. Она помогает определить необходимое и общее, тенденцию закономерности экономического развития непосредственно через единичное и случайное.

Средние величины являются обобщающими показателями, в которых находят выражение действие общих условий, закономерность изучаемого явления.

Статистические средние величины рассчитываются на основе массовых данных статистически правильно организованного массового наблюдения. Если статистическая средняя рассчитывается по массовым данным для качественно однородной совокупности (массовых явлений), то она будет объективной.

Средняя величина абстрактна, так как характеризует значение абстрактной единицы.

От разнообразия признака у отдельных объектов абстрагируется средняя. Абстракция – ступень научного исследования. В средней величине осуществляется диалектическое единство отдельного и общего.

Средние величины должны применяться исходя из диалектического понимания категорий индивидуального и общего, единичного и массового.

Средняя отображает что–то общее, которое складывается в определенном единичном объекте.

Для выявления закономерностей в массовых общественных процессах средняя величина имеет большое значение.

Отклонение индивидуального от общего – проявление процесса развития.

В средней величине отражается характерный, типичный, реальный уровень изучаемых явлений. Задачей средних величин является характеристика этих уровней и их изменений во времени и пространстве.

Средний показатель – это обычное значение, потому что формируется в нормальных, естественных, общих условиях существования конкретного массового явления, рассматриваемого в целом.

Объективное свойство статистического процесса или явления отражает средняя величина.

Индивидуальные значения исследуемого статистического признака у каждой единицы совокупности различны. Средняя величина индивидуальных значений одного вида – продукт необходимости, который является результатом совокупного действия всех единиц совокупности, проявляющийся в массе повторяющихся случайностей.

Одни индивидуальные явления имеют признаки, которые существуют во всех явлениях, но в разных количествах – это рост или возраст человека. Другие признаки индивидуального явления, качественно различные в различных явлениях, т. е. имеются у одних и не наблюдаются у других (мужчина не станет женщиной). Средняя величина вычисляется для признаков качественно однородных и различных только количественно, которые присущи всем явлениям в данной совокупности.

Средняя величина является отражением значений изучаемого признака и измеряется в той же размерности, что и этот признак.

Теория диалектического материализма учит, что все в мире меняется, развивается. А также изменяются признаки, которые характеризуются средними величинами, а соответственно – и сами средние.

В жизни происходит непрерывный процесс создания чего–то нового. Носителем нового качества являются единичные объекты, далее количество этих объектов возрастает, и новое становится массовым, типичным.

Средняя величина характеризует изучаемую совокупность только по одному признаку. Для полного и всестороннего представления изучаемой совокупности по ряду определенных признаков необходимо располагать системой средних величин, которые могут описать явление с разных сторон.

2. Виды средних величин

В статистической обработке материала возникают различные задачи, которые необходимо решать, и поэтому в статистической практике используются различные средние величины. Математическая статистика использует различные средние, такие как: средняя арифметическая; средняя геометрическая; средняя гармоническая; средняя квадратическая.

Для того чтобы применить одну из вышеперечисленных видов средней, необходимо проанализировать изучаемую совокупность, определить материальное содержание изучаемого явления, все это делается на основе выводов, полученных из принципа осмысленности результатов при взвешивании или суммировании.

В изучении средних величин применяются следующие показатели и обозначения.

Признак, по которому находится средняя, называется осредняемым признаком и обозначается х; величина осредняемого признака у любой единицы статистической совокупности называют индивидуальным его значением, или вариантами, и обозначают как x 1 , х 2 , x 3 ,… х п ; частота – это повторяемость индивидуальных значений признака, обозначается буквой f.

Средняя арифметическая

Один из наиболее распространенных видов средней – средняя арифметическая, которая исчисляется тогда, когда объем ос–редняемого признака образуется как сумма его значений у отдельных единиц изучаемой статистической совокупности.

Для вычисления средней арифметической величины сумму всех уровней признака делят на их число.


Если некоторые варианты встречаются несколько раз, то сумму уровней признака можно получить умножением каждого уровня на соответствующее число единиц совокупности с последующим сложением полученных произведений, исчисленная таким образом средняя арифметическая называется средней арифметической взвешенной.

Формула средней арифметической взвешенной выглядит следующим образом:


гдех i – варианты,

f i – частоты или веса.

Взвешенная средняя величина должна употребляться во всех случаях, когда варианты имеют различную численность.

Арифметическая средняя как бы распределяет поровну между отдельными объектами общую величину признака, в действительности варьирующуюся у каждого из них.

Вычисление средних величин производят по данным, сгруппированным в виде интервальных рядов распределения, когда варианты признака, из которых исчисляется средняя, представлены в виде интервалов (от – до).

Свойства средней арифметической:

1) средняя арифметическая суммы варьирующих величин равна сумме средних арифметических величин: Если х i = y i +z i , то


Данное свойство показывает в каких случаях можно суммировать средние величины.

2) алгебраическая сумма отклонений индивидуальных значений варьирующего признака от средней равна нулю, так как сумма отклонений в одну сторону погашается суммой отклонений в другую сторону:


Это правило демонстрирует, что средняя является равнодействующей.

3) если все варианты ряда увеличить или уменьшить на одно и тоже число?, то средняя увеличится или уменьшится на это же число?:


4) если все варианты ряда увеличить или уменьшить в А раз, то средняя также увеличится или уменьшится в А раз:


5) пятое свойство средней показывает нам, что она не зависит от размеров весов, но зависит от соотношения между ними. В качестве весов могут быть взяты не только относительные, но и абсолютные величины.

Если все частоты ряда разделить или умножить на одно и тоже число d, то средняя не изменится.


Средняя гармоническая. Для того чтобы определить среднюю арифметическую, необходимо иметь ряд вариантов и частот, т. е. значения х и f.

Допустим, известны индивидуальные значения признака х и произведения х/, а частоты f неизвестны, тогда, чтобы рассчитать среднюю, обозначим произведение = х/; откуда:



Средняя в этой форме называется средней гармонической взвешенной и обозначается х гарм. взв.

Соответственно, средняя гармоническая тождественна средней арифметической. Она применима, когда неизвестны действительные веса f , а известно произведение = z

Когда произведения одинаковы или равны единицы (m = 1) применяется средняя гармоническая простая, вычисляемая по формуле:


где х – отдельные варианты;

n – число.

Средняя геометрическая

Если имеется n коэффициентов роста, то формула среднего коэффициента:


Это формула средней геометрической.

Средняя геометрическая равна корню степени n из произведения коэффициентов роста, характеризующих отношение величины каждого последующего периода к величине предыдущего.

Если осреднению подлежат величины, выраженные в виде квадратных функций, применяется средняя квадратическая. Например, с помощью средней квадратической можно определить диаметры труб, колес и т. д.

Средняя квадратическая простая определяется путем извлечения квадратного корня из частного от деления суммы квадратов отдельных значений признака на их число.


Средняя квадратическая взвешенная равна:

3. Структурные средние величины. Мода и медиана

Для характеристики структуры статистической совокупности применяются показатели, которые называют структурными средними. К ним относятся мода и медиана.

Мода (М о ) – чаще всего встречающийся вариант. Модой называется значение признака, которое соответствует максимальной точке теоретической кривой распределений.

Мода представляет наиболее часто встречающееся или типичное значение.

Мода применяется в коммерческой практике для изучения покупательского спроса и регистрации цен.

В дискретном ряду мода – это варианта с наибольшей частотой. В интервальном вариационном ряду модой считают центральный вариант интервала, который имеет наибольшую частоту (частность).

В пределах интервала надо найти то значение признака, которое является модой.


где х о – нижняя граница модального интервала;

h – величина модального интервала;

f m – частота модального интервала;

f т -1 – частота интервала, предшествующего модальному;

f m +1 – частота интервала, следующего за модальным.

Мода зависит от величины групп, от точного положения границ групп.

Мода – число, которое в действительности встречается чаще всего (является величиной определенной), в практике имеет самое широкое применение (наиболее часто встречающийся тип покупателя).

Медиана (M e – это величина, которая делит численность упорядоченного вариационного ряда на две равные части: одна часть имеет значения варьирующего признака меньшие, чем средний вариант, а другая – большие.

Медиана – это элемент, который больше или равен и одновременно меньше или равен половине остальных элементов ряда распределения.

Свойство медианы заключается в том, что сумма абсолютных отклонений значений признака от медианы меньше, чем от любой другой величины.

Применение медианы позволяет получить более точные результаты, чем при использовании других форм средних.

Порядок нахождения медианы в интервальном вариационном ряду следующий: располагаем индивидуальные значения признака по ранжиру; определяем для данного ранжированного ряда накопленные частоты; по данным о накопленных частотах находим медианный интервал:


где х ме – нижняя граница медианного интервала;

i Me – величина медианного интервала;

f/2 – полусумма частот ряда;

S Me -1 – сумма накопленных частот, предшествующих медианному интервалу;

f Me – частота медианного интервала.

Медиана делит численность ряда пополам, следовательно, она там, где накопленная частота составляет половину или больше половины всей суммы частот, а предыдущая (накопленная) частота меньше половины численности совокупности.

Сейчас поговорим о том, как рассчитывать среднюю величину .
В классическом виде общая теория статистики предлагает нам один вариант правил выбора средней величины.
Сначала необходимо составить правильно логическую формулу для расчета средней величины (ЛФС). Для каждой средней величины всегда есть только одна логическая формула ее расчета, поэтому ошибиться тут трудно. Но всегда надо помнить, что в числителе (это то, что сверху дроби) сумма всех явлений, а в знаменателе (то, что внизу дроби) общее количество элементов.

После того как составлена логическая формула можно пользоваться правилами (для простоты понимания упростим их и сократим):
1. Если в исходных данных (определяем по частоте) представлен знаменатель логической формулы, то расчет проводим по формуле средней арифметической взвешенной.
2. Если в исходных данных представлен числитель логической формулы, то расчет ведем по формуле средней гармонической взвешенной.
3. Если в задаче представлены сразу и числитель и знаменатель логической формулы (такое бывает редко), то расчет проводим по этой формуле или по формуле средней арифметической простой.
Это классическое представление о выборе верной формулы расчета средней величины. Далее представим последовательность действий при решении задач на расчет средней величины.

Алгоритм решения задач на расчет средней величины

А. Определяем способ расчета средней величины – простой или взвешенный . Если данные представлены в таблице то используем взвешенный способ, если данные представлены простым перечислением, то используем простой способ расчета.

Б. Определяем или расставляем условные обозначения – x – варианта, f – частота . Варианта это то, для какого явления требуется найти среднюю величину. Оставшиеся данные в таблице будут частотой.

В. Определяем форму расчета средней величины – арифметическая или гармоническая . Определение проводится по колонке частот. Арифметическая форма используется, если частоты заданы явным количеством (условно к ним можно подставить слово штук, количество элементов «штук»). Гармоническая форма используется, если частоты заданы не явным количеством, а сложным показателем (произведением осредняемой величины и частоты).

Самое сложное, это догадаться, где и какое количество задано, особенно неопытному в таких делах студенту. В такой ситуации можно воспользоваться одним из предлагаемых далее способов. Для некоторых задач (экономических) подходит наработанное годами практики утверждение (пункт В.1). В других же ситуациях придется пользоваться пунктом В.2.

В.1 Если частота задана в денежных единицах (в рублях), то используется для расчета средняя гармоническая, такое утверждение верно всегда, если выявленная частота задана в деньгах, в других ситуациях это правило не действует.

В.2 Воспользоваться правилами выбора средней величины указанными выше в этой статье. Если частота задана знаменателем логической формулы расчета средней величины, то рассчитываем по средней арифметической форме, если частота задана числителем логической формулы расчета средней величины, то рассчитываем по средней гармонической форме.

Рассмотрим на примерах использование данного алгоритма.

А. Так как данные представлены в строчку то используем простой способ расчета.

Б. В. Имеем только данные по величине пенсий, именно они и будут нашей вариантой – х. Данные представлены простым количеством (12 человек), для расчета используем среднюю арифметическую простую.

Средний размер пенсии пенсионера составляет 9208,3 рубля.

Б. Так как требуется найти средний размер выплаты на одного ребенка, то варианты находятся в первой колонке, туда ставим обозначение х , вторая колонка автоматически становится частотой f .

В. Частота (число детей) задана явным количеством (можно подставить слово штук детей, с точки зрения русского языка неверное словосочетание, но, по сути, очень удобно проверять), значит, для расчета используется средняя арифметическая взвешенная.

Эту же задачу модно решить не формульным способом, а табличным, то есть занести все данные промежуточных расчетов в таблицу.

В результате все, что нужно теперь сделать, это разделить два итоговых данных в правильно порядке.

Средний размер выплаты на одного ребенка в месяц составил 1910 рублей.

А. Так как данные представлены в таблице то для расчета используем взвешенную форму.

В. Частота (себестоимость выпуска) задана неявным количеством (частота задана в рублях пункт алгоритма В1 ), значит, для расчета используется средняя гармоническая взвешенная. Вообще же, по сути, себестоимость выпуска это сложный показатель, который получается перемножение себестоимости единицы изделия на количество таких изделий, вот это и есть суть средней гармонической величины.

Чтобы эта задача могла решаться по формуле средней арифметической необходимо, чтобы вместо себестоимости выпуска стояло число изделий с соответствующей себестоимостью.

Обратите внимание, что сумма в знаменателе, получившаяся после расчетов 410 (120+80+210) это и есть общее количество выпущенных изделий.

Средняя себестоимость единицы изделия составила 314,4 рубля.

А. Так как данные представлены в таблице то для расчета используем взвешенную форму.

Б. Так как требуется найти среднюю себестоимость единицы изделия, то варианты находятся в первой колонке, туда ставим обозначение х , вторая колонка автоматически становится частотой f .

В. Частота (общее число пропусков) задана неявным количеством (это произведение двух показателей числа пропусков и числа студентов, имеющих такое количество пропусков), значит, для расчета используется средняя гармоническая взвешенная. Будем использовать пункт алгоритма В2 .

Чтобы эта задача могла решаться по формуле средней арифметической необходимо, чтобы вместо общего числа пропусков стояло число студентов.

Составляем логическую формулу расчета среднего числа пропусков одного студента.

Частота по условию задачи Общее число пропусков. В логической формуле этот показатель находится в числителе, а значит, используем формулу средней гармонической.

Обратите внимание, что сумма в знаменателе, получившаяся после расчетов 31 (18+8+5) это и есть общее количество студентов.

Среднее число пропусков одного студента 13,8 дня.

Предположим, что нужно найти среднее число дней для выполнения задач, различными сотрудниками. Или вы хотите вычисление интервала времени 10 лет Средняя температура в определенный день. Вычисление среднего значения ряда чисел несколькими способами.

Среднее функция меры центральной тенденции, в которой находится центр ряда чисел в статистическое распределение. Три большинство общих критериями центральной тенденции выступают.

    Среднее Среднее арифметическое и вычисляется путем добавления ряда чисел и затем деления количества этих чисел. Например среднее значение 2, 3, 3, 5, 7 и 10 имеет 30, разделенных на 6, 5;

    Медиана Средний номер ряда чисел. Половина чисел имеют значения, которые больше, чем Медиана, а половина чисел имеют значения, которые меньше, чем Медиана. Например медиана 2, 3, 3, 5, 7 и 10 - 4.

    Режим Наиболее часто встречающееся число в группе чисел. Например режим 2, 3, 3, 5, 7 и 10 - 3.

Эти три меры центральной тенденции симметричную распределение ряда чисел, являются одни и те же. В асимметричное распределение ряда чисел они могут быть разными.

Вычисление среднего значения ячеек, расположенных непрерывно в одной строке или одном столбце

Выполните следующие действия.

Вычисление среднего значения ячеек, расположенных вразброс

Для выполнения этой задачи используется функция СРЗНАЧ . Скопируйте в приведенной ниже таблице на пустой лист.

Вычисление среднего взвешенного значения

СУММПРОИЗВ и сумм . Пример vThis вычисляет среднюю цену единицы измерения, оплаченная через три покупки, где находится каждый покупки для различное количество единиц измерения по различным ценам за единицу.

Скопируйте в приведенной ниже таблице на пустой лист.

Вычисление среднего значения чисел, без учета нулевых значений

Для выполнения этой задачи используются функции СРЗНАЧ и если . Скопируйте приведенную ниже таблицу и имейте в виду, что в этом примере чтобы проще было понять, скопируйте его на пустой лист.

Простая среднеарифметическая величина представляет собой среднее слагаемое, при определении которого общий объем данного признака всовокупности данных поровну распределяется между всеми единицами, входящими в данную совокупность. Так, среднегодовая выработка продукции на одного работающего - это такая величина объема продукции, которая приходилась бы на каждого работника, если бы весь объем выпущенной продукции в одинаковой степени распределялся между всеми сотрудниками организации. Среднеарифметическая простая величина исчисляется по формуле:

Простая средняя арифметическая - Равна отношению суммы индивидуальных значений признака к количеству признаков в совокупности

Пример 1 . Бригада из 6 рабочих получает в месяц 3 3,2 3,3 3,5 3,8 3,1 тыс.руб.

Найти среднюю заработную плату Решение: (3 + 3,2 + 3,3 +3,5 + 3,8 + 3,1) / 6 = 3,32 тыс. руб.

Средняя арифметическая взвешенная

Если объем совокупности данных большой и представляет собой ряд распределения, то исчисляется взвешенная среднеарифметическая величина. Так определяют средневзвешенную цену за единицу продукции: общую стоимость продукции (сумму произведений ее количества на цену единицы продукции) делят на суммарное количество продукции.

Представим это в виде следующей формулы:

Взвешенная средняя арифметическая - равна отношению (суммы произведений значения признака к частоте повторения данного признака) к (сумме частот всех признаков).Используется, когда варианты исследуемой совокупности встречаются неодинаковое количество раз.

Пример 2 . Найти среднюю заработную плату рабочих цеха за месяц

Заработная плата одного рабочего тыс.руб; X

Число рабочих F

Средняя заработная плата может быть получена путем деления общей суммы заработной платы на общее число рабочих:

Ответ: 3,35 тыс.руб.

Средняя арифметическая для интервального ряда

При расчете средней арифметической для интервального вариационного ряда сначала определяют среднюю для каждого интервала, как полусумму верхней и нижней границ, а затем - среднюю всего ряда. В случае открытых интервалов значение нижнего или верхнего интервала определяется по величине интервалов, примыкающих к ним.

Средние, вычисляемые из интервальных рядов являются приближенными.

Пример 3 . Определить средний возраст студентов вечернего отделения.

Возраст в годах!!х??

Число студентов

Среднее значение интервала

Произведение середины интервала (возраст) на число студентов

(18 + 20) / 2 =19 18 в данном случае граница нижнего интервала. Вычисляется как 20 - (22-20)

(20 + 22) / 2 = 21

(22 + 26) / 2 = 24

(26 + 30) / 2 = 28

30 и более

(30 + 34) / 2 = 32

Средние, вычисляемые из интервальных рядов являются приближенными. Степень их приближения зависит от того, в какой мере фактическое распределение единиц совокупности внутри интервала приближается к равномерному.

При расчете средних в качестве весов могут использоваться не только абсолютные, но и относительные величины (частость).