Коэффициент вариации означает. Статистические параметры

Вариация - это принятие единицами совокупности или группами различных, отичающихся друг от друга, значений знака. Вариация является результатом воздействия на единицу совокупности множества факторов. Синонимами терминация являются понятия изменение (изменчивость, вариативность’).

Вариация - одна из важнейших категорий статистической науки. Явления, подверженньие вариации, лежат в области исследования статистической науки, в то время как явления неизменные, статистические, постоянные в статистике не рассматриваются.

Практически все явления, имеющие естественный характер происхождения, подвержены изменчивости (например, химические процессы, изменчивость наследственных признаков у каждого человека и др.). Явления, а также ряд естественных законов могут иметь неизменный характер (например, минимальный размер заработной платы)

Необходимо подчеркнуть значение исследования вариации в статистической науке:

1 . Выявление измеычввости размеров явления дает возможность оценить степень зависимости изучаемого явления от других факторов, в свою очередь подверженньих изменчивости, или, другими словами, - оценить степень устойчивоти явленияк внешним воздействиям.

2. Вариация предполагает оценку однородности изучаемого явления, т. е. меру типичности, рассчитанной для этого явления средней величины.

Вариационным рядом называется последовательность различных вариант, записанных в возрастающем порядке вместе с соответствующими частотами.

В зависимости от типа признака различают дискретньие и интервальные вариационньие ряды. В зависимости от объема исходных данных и области допустимых значений одномерного количествснного признака, частотные распределения также подразделяются на дискретньие и интервальные. Если различных очень много (более 10-15), то эти варианты группируют вьибирая определенное число интервалов группировки и таким образом интервальное частотное распределение.

Первым шагом при построении интервального вариационого ряда является выбор определенного принципа, который дается в основу построения интервального ряда. Выбор этого принципа зависит от степени однородности рассматриваемой совокуности. Если совокупность однородна, то при построении ряда используют принцип равных интервалов. При этом вопрос однородности решается содержательным анализом изучаемых явлений.

Изменчивость явления в статистическом анализе отображается с помощью целого ряда характеристик, называемых системой показателей вариации . В нее входят:

абсолютные показатели вариации :

1) размах вариации;

2) средние величины (групповые и общие):

- степенные средние величины;

- структурные средние величины;


3) среднее линейное отклонение;

4) дисперсии (групповая, межгрулповая и общая) и среднее квадратическое отклонение;

относительные показатели вариации:

1) коэффициент осцилляции;

2) коэффициенты вариации (в том числе линейный);

3) коэффициенты детерминации (эмпирические и теоретические).

Размах вариации отражает пределы изменчивости признака или, другими словами, амплитуду вариации. Размах вариации рассчитывается как разность между максимальной величиной при знака (х) и минимальной величиной признака (х), т.е. по фор муле:

х - наибольшее значение признака;

х. - наименьшее значение признака.

Дисперсия - средний квадрат отклонений индивидуальньх значений признака от их средней величины:

Для вариационного ряда дисаерсия вычисляется по следующей формуле: (см. таблицу 2.)

Часто для исследования удобно представлять меру рассеяния в тех же единицах измерения, что и варианты. Тогда вместо дисперсии используют среднее квадратическое отклонение , которое является квадратным корнем из дисперсии, т.е. среднее квадратичное отклонение вычисляется по формуле: (см. таблицу 2)

Рассмотренные выше меры рассеявия (размах вариации, дисперсия, среднее квадратическое отклонение) являются абсолютными величинами, судить по ним о степени колеблимости признака не всегда возможно, в некоторых задачах необходимо использовать относительные показатели рассеяния. Таким показателем является коэффициент вариации (V), который представляет собой отношение среднего квадратичного отклонения к средней арифметической, выраженное в процентах:

Коэффициент вариации позволяет:

Сравнивать вариацию одного и того же признака у разных групп объектов;

Выявить степень различия одного и того же признака одной и той же группы объектов в разное время;

Сопоставить вариацию разных признаков у одних и тех групп объектов.

Если значение коэффициента вариации не превышает 33 то изучаемая совокупность считается однородной .

Рассмотрим на примере методику расчёта среднего квадратического отклонения и дисперсии признака.

ПРИМЕР 5 . В результате выборочной проверки расфасовки чая получены следующие данные:

Масса пачки чая, г. Число пачек чая, шт.

52 и выше 3

Исчислить среднюю массу пачки чая,среднее квадратическое отклонение,дисперсию признака.

Для расчёта используем формулы из таблицы 2.

Все расчёты желательно оформить в виде таблицы. Для определения середины интервала

В каждой группе,т.е. среднего значения,необходимо от интервального перейти к дискретному ряду. Величина интервала равна 1 (например,50 – 49 =1).Значит среднее значение для первой группы составит ((48 +49) /2 = 48,5 ;для второй и третьей групп соответственно 49,5 и 50,5 и т. д.

Масса Число Середина Х*f Х – Х (Х – Х) (Х – Х) * f

Вариация - это несовпадение значений одной и той же статистиче­ской величины у разных объектов в силу особенностей их собственного развития, а также различия условий, в которых они находятся. Вариация имеет объективный характер и помогает познать сущность изучаемого явления. Если средняя величина сглаживает индивидуальные различия, то вариация, наоборот, их подчеркивает, устанавливая типичность или не типичность найденной средней величины для конкретной статистической совокупности. Тем самым можно делать вывод о качественности подобранных статистических данных.

Вариация измеряется с помощью относительных величин, называе­мых коэффициентами вариации и определяемых в виде отношения среднего отклонения к средней величине. Поскольку среднее отклоне­ние может определяться линейным и квадратическим способами, то соответствующими могут быть и коэффициенты вариации. Следова­тельно, коэффициенты вариации надо определять по формулам

линейный; (1.28)

квадратический. (1.29) Значения коэффициента вариации изменяются от 0 до 1 и чем ближе он к нулю, тем типичнее найденная средняя величина для изучаемой статистической совокупности, а значит и качественнее подобраны статистические данные. При этом критериальным значением коэффициен­та вариации служит 1/3.

То есть средняя величина считается типичной для данной совокуп­ности при λ 0,333 или при ν 0,333. В ином случае средняя величина не типична и требуется пересмотреть статистическую совокупность с целью включения в нее более объективных статистических величин.

Обычно квадратический коэффициент вариации несколько (примерно на 25%) больше линейного, рассчитанные по одним и тем же данным. А значит возможен случай, когда λ 0,333 и ν 0,333, тогда необходимо взять среднюю из этих коэффициентов и по ее значению сделать окончательный вывод о не/типичности найденной средней величины.

С помощью линейного коэффици­ента вариации принципиальный вывод о типичности или не типичности средней величины можно получить проще и быстрее, чем с помощью квадратического. Однако квадратический коэффициент применяется чаще, так как существует несколько способов для вычисления дисперсии.

У такого способа оценки вариации есть и существенный недостаток. Действительно, пусть, например, исходная совокупность рабочих, имеющих средний стаж 15 лет, со стандартным отклонением σ = 10 лет, «состарилась» еще на 15 лет. Теперь= 30 лет, а стандартное отклонение по-прежнему равно 10. Совокупность, ранее бывшая неоднородной (10/15*100 = 66,7%), со временем оказывается, таким образом, вполне однородной (10/30*100 = 33,3 %).

Поэтому возможен дополнительный анализ статистической сово­купности с помощью коэффициента осцилляции , определяемого по формуле

где R - размах вариации в виде разности наибольшего и наимень­шего значений в совокупности статистических величин. То есть

R = Хмах –Хmin, (1.31)

где Xмax и Xmin - максимальное и минимальное значения в совокупно­сти.

При упорядочении статистических величин в совокупности образу­ются группировочные интервалы. Тогда под обозначением ∆Х пони­мается размах интервала, а среднее интервальное значение обозначается ХИ . В случае ориентировки только на квадратический коэффициент ва­риации могут применяться разные методы определения дисперсии.

Квадратный корень из дисперсии носит название среднего квадратического отклонения от средней, которое рассчитывается следующим образом:

Элементарное алгебраическое преобразование формулы среднего квадратического отклонения приводит ее к следующему виду:

Эта формула часто оказывается более удобной в практике расчетов.

Среднее квадратическое отклонение так же, как и среднее линейное отклонение, показывает, на сколько в среднем отклоняются конкретные значения признака от среднего их значения. Среднее квадратическое отклонение всегда больше среднего линейного отклонения. Между ними имеется такое соотношение:

Зная это соотношение, можно по известному показатели определить неизвестный, например, но (I рассчитать а и наоборот. Среднее квадратическое отклонение измеряет абсолютный размер колеблемости признака и выражается в тех же единицах измерения, что и значения признака (рублях, тоннах, годах и т.д.). Оно является абсолютной мерой вариации.

Для альтернативных признаков, например наличия или отсутствия высшего образования, страховки, формулы дисперсии и среднего квадратического отклонения такие:

Покажем расчет среднего квадратического отклонения по данным дискретного ряда, характеризующего распределение студентов одного из факультетов вуза по возрасту (табл. 6.2).

Таблица 6.2.

Результаты вспомогательных расчетов даны в графах 2-5 табл. 6.2.

Средний возраст студента, лет, определен по формуле средней арифметической взвешенной (графа 2):

Квадраты отклонения индивидуального возраста студента от среднего содержатся в графах 3-4, а произведения квадратов отклонений на соответствующие частоты - в графе 5.

Дисперсию возраста студентов, лет, найдем по формуле (6.2):

Тогда о = л/3,43 1,85 *ода, т.е. каждое конкретное значение возраста студента отклоняется от среднего значения на 1,85 года.

Коэффициент вариации

По своему абсолютному значению среднее квадратическое отклонение зависит не только от степени вариации признака, но и от абсолютных уровней вариантов и средней. Поэтому сравнивать средние квадратические отклонения вариационных рядов с различными средними уровнями непосредственно нельзя. Чтобы иметь возможность для такого сравнения, нужно найти удельный вес среднего отклонения (линейного или квадратического) в среднем арифметическом показателе, выраженном в процентах, т.е. рассчитать относительные показатели вариации.

Линейный коэффициент вариации вычисляют по формуле

Коэффициент вариации определяют по следующей формуле:

В коэффициентах вариации устраняется не только несопоставимость, связанная с различными единицами измерения изучаемого признака, но и несопоставимость, возникающая вследствие различий в величине средних арифметических. Кроме того, показатели вариации дают характеристику однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33%.

По данным табл. 6.2 и полученным выше результатам расчетов определим коэффициент вариации, %, по формуле (6.3):

Если коэффициент вариации превышает 33%, то это свидетельствует о неоднородности изучаемой совокупности. Полученное в пашем случае значение говорит о том, что совокупность студентов по возрасту однородна по своему составу. Таким образом, важная функция обобщающих показателей вариации - оценка надежности средних. Чем меньше с1, а2 и V, тем однороднее полученная совокупность явлений и надежнее полученная средняя. Согласно рассматриваемому математической статистикой "правилу трех сигм" в нормально распределенных или близких к ним рядах отклонения от средней арифметической, не превосходящие ±3ст, встречаются в 997 случаях из 1000. Таким образом, зная х и а, можно получить общее первоначальное представление о вариационном ряде. Если, например, средняя заработная плата работника по фирме составила 25 000 руб., а а равна 100 руб., то с вероятностью, близкой к достоверности, можно утверждать, что заработная плата работников фирмы колеблется в пределах (25 000 ± ± 3 х 100) т.е. от 24 700 до 25 300 руб.

Коэффициент вариации, VAR или CV, – ключевой показатель в оценке риска проектов и доходности ценных бумаг. Он позволяет заранее проанализировать сразу два показателя, которые обладают меняющимися во времени значениями. Если показатель оказывается менее 0,1, направление инвестирования характеризуется низким уровнем риска. При показателе свыше 0,3 уровень риска необоснованно высок. Для расчета удобнее всего использовать функции СТАНДОТКЛОН и СРЗНАЧ табличного редактора Excel.

 

Для того чтобы сформировать качественный инвестиционный портфель, инвесторам порой приходится прибегать к оценке входящих в него активов, которые обладают разным уровнем риска и доходности. Для этой цели используется широко известный в инвестиционном анализе и эконометрике показатель.

Коэффициент вариации (Coefficient of variation - CV, VAR) - относительный финансовый показатель, который демонстрирует сравнение рассеивания значений двух случайных показателей, которые имеют разные единицы измерения относительно ожидаемого значения.

Справка! Поскольку коэффициент вариации позволяет получить сопоставимые результаты, то его применение оптимально в рамках портфельного анализа. В ней он позволяет эффективно объединить значения риска и доходности и вывести результирующее значение.

Coefficient of variation - показатель из числа относительных методов статистики, который, как NPV и IRR, применяется в рамках инвестиционного анализа. Он измеряется в процентах и может применяться для сравнения вариаций двух несвязанных между собой критериев. Его чаще всего используют финансовые и инвестиционные аналитики.

Справка! На базе коэффициента вариации оценивается так называемый «унифицированный риск» (unitized risk), поскольку он оценивает относительный разброс двух показателей по отношению к прогнозному значению.

Для чего используют показатель VAR:

  • в целях сравнения двух разных показателей;
  • для определения степени устойчивости прогнозных моделей (в основном по инвестициям и портфельному инвестированию);
  • для осуществления XYZ-анализа.

Справка! XYZ-анализ - аналитический инструмент, в рамках которого продукция компании оценивается по двум параметрам: стабильность потребления и продаж.

Формула расчета коэффициента вариации

Суть расчета коэффициента вариации состоит в том, что по множеству значений рассчитывается сначала среднее квадратичное отклонение, а затем - среднее арифметическое, а после - найти их соотношение.

В общем виде формула расчета показателя VAR выглядит следующим образом:

CV = σ / t ср, где:

CV - коэффициент вариации;

σ - среднее квадратическое отклонение;

t - среднее арифметическое значение для случайной величины.

Формула расчета показателя VAR может принимать самые разнообразные интерпретации в зависимости от объекта оценки.

Важный момент! Очевидно, что применение представленных выше формул вручную, в особенности при наличии широкого круга значений, весьма затруднительно. Оттого для расчета применяется инструментарий табличного редактора Excel.

Значения показателя VAR в инвестиционном анализе

Нормативного значения этого показателя не существует. Однако имеются некоторые опорные критерии, которые помогают при его анализе и интерпретации.

Важный момент! Коэффициент CV имеет несколько недостатков - он не учитывает величины первоначальных вложений, предполагает симметричность разбросанных значений по отношению к среднему, а также не может использоваться для опционов, доходность которых может быть меньше 0. Оттого при наличии сомнений стоит дополнительно использовать показатели IRR и NPV.

Примеры расчета VAR в Excel

Расчет коэффициента вариации вручную − сложная и затяжная по времени процедура. Если выборка значительная, то расчёт по ней среднего квадратического отклонения вручную крайне чреват ошибками и неточностями.

Удобный способ определения VAR предлагает табличный редактор Excel. На его базе можно рассчитать:

  • среднее квадратическое отклонение (функция СТАНДОТКЛОН);
  • среднее арифметическое (функция СРЗНАЧ).

Для того чтобы разобраться в тонкостях использования CV, имеет смысл привести пример его расчета.

Пример расчета: оценка двух проектов с разной прибылью

Существует два бизнеса, которые на протяжении 5 лет демонстрируют разный финансовый результат. Для того чтобы сделать выбор между ними, инвестору стоит рассчитать коэффициент вариации.

Первоначально рассчитаем среднее квадратичное отклонение, используя статистическую функцию Excel СТАНДОТКЛОН.В.

Аналогичным образом на базе статистической функции СРЗНАЧ рассчитывается среднее арифметическое по обоим проектам

После этого остается разделить среднее квадратическое отклонение на среднее арифметическое и получить результат - значение коэффициента вариации.

Вывод! По проекту А уровень риска оказался равным 40%. При таком раскладе он представляется рискованным и неустойчивым. По проекту В уровень риска приемлемый - всего 11,64%. Инвестору уместно вложить средства в более надежный проект В, хотя в отдельные периоды проект А приносит большую прибыль.

Детальный алгоритм расчета показателя представлен в образце , составленном на базе табличного редактора Excel.

Детальный процесс расчета показателя вариации представлен в видеоролике.

Нам приходится сталкиваться с расчётом таких значений, как дисперсия, среднеквадратичное отклонение и, разумеется, коэффициент вариации. Именно расчёту последнего стоит уделить особое внимание. Очень важно, чтобы каждый новичок, который только приступает к работе с табличным редактором, мог быстро подсчитать относительную границу разброса значений.

Что такое коэффициент вариации и для чего он нужен?

Итак, как мне кажется, нелишним будет провести небольшой теоретический экскурс и разобраться в природе коэффициента вариации. Этот показатель необходим для отражения диапазона данных относительно среднего значения. Иными словами, он показывает отношение стандартного отклонения к среднему значению. Коэффициент вариации принято измерять в процентном выражении и отображать с его помощью однородность временного ряда.

Коэффициент вариации станет незаменимым помощником в том случае, когда вам необходимо будет сделать прогноз по данным из заданной выборки. Этот индикатор выделит главные ряды значений, которые будут наиболее полезными для последующего прогнозирования, а также очистит выборку от малозначительных факторов. Так, если вы видите, что значение коэффициента равно 0%, то с уверенностью заявляйте о том, что ряд является однородным, а значит, все значения в нём равны один с другим. В случае, если коэффициент вариации принимает значение, превышающее отметку в 33%, то это говорит о том, что вы имеете дело с неоднородным рядом, в котором отдельные значения существенно отличаются от среднего показателя выборки.

Как найти среднее квадратичное отклонение?

Поскольку для расчёта показателя вариации в Excel нам необходимо использовать среднее квадратичное отклонение, то вполне уместно будет выяснить, как нам посчитать этот параметр.

Из школьного курса алгебры мы знаем, что среднее квадратичное отклонение - это извлечённый из дисперсии квадратный корень, то есть этот показатель определяет степень отклонения конкретного показателя общей выборки от её среднего значения. С его помощью мы можем измерить абсолютную меру колебания изучаемого признака и чётко её интерпретировать.

Рассчитываем коэффициент в Экселе

К сожалению, в Excel не заложена стандартная формула , которая бы позволила рассчитать показатель вариации автоматически. Но это не значит, что вам придётся производить расчёты в уме. Отсутствие шаблона в «Строке формул» никоим образом не умаляет способностей Excel, потому вы вполне сможете заставить программу выполнить необходимый вам расчёт, прописав соответствующую команду вручную.

Для того чтобы рассчитать показатель вариации в Excel, необходимо вспомнить школьный курс математики и разделить стандартное отклонение на среднее значение выборки. То есть на деле формула выглядит следующим образом - СТАНДОТКЛОН(заданный диапазон данных)/СРЗНАЧ(заданный диапазон данных). Ввести эту формулу необходимо в ту ячейку Excel, в которой вы хотите получить нужный вам расчёт.

Не забывайте и о том, что поскольку коэффициент выражается в процентах, то ячейке с формулой нужно будет задать соответствующий формат. Сделать это можно следующим образом:

  1. Откройте вкладку «Главная».
  2. Найдите в ней категорию «Формат ячеек » и выберите необходимый параметр.

Как вариант, можно задать процентный формат ячейке при помощи клика по правой кнопке мыши на активированной клеточке таблицы. В появившемся контекстном меню, аналогично вышеуказанному алгоритму нужно выбрать категорию «Формат ячейки» и задать необходимое значение.

Выберите «Процентный», а при необходимости укажите число десятичных знаков

Возможно, кому-то вышеописанный алгоритм покажется сложным. На самом же деле расчёт коэффициента так же прост, как сложение двух натуральных чисел. Единожды выполнив эту задачу в Экселе, вы больше никогда не вернётесь к утомительным многосложным решениям в тетрадке.

Всё ещё не можете сделать качественное сравнение степени разброса данных? Теряетесь в масштабах выборки? Тогда прямо сейчас принимайтесь за дело и осваивайте на практике весь теоретический материал, который был изложен выше! Пусть статистический анализ и разработка прогноза больше не вызывают у вас страха и негатива. Экономьте свои силы и время вместе с