Построим матрицу коэффициентов парной корреляции. Матрица парной корреляции
1. ПОСТРОИМ МАТРИЦУ КОЭФФИЦИЕНТОВ ПАРНОЙ КОРРЕЛЯЦИИ.
Для этого рассчитаем коэффициенты парной корреляции по формуле:
Необходимые расчеты представлены в таблице 9.
-
связь между выручкой предприятия Y и объемом капиталовложений Х 1 слабая и прямая;
-
связи между выручкой предприятия Y и основными производственными фондами Х 2 практически нет;
-
связь между объемом капиталовложений Х 1 и основными производственными фондами Х 2 тесная и прямая;
Таблица 9
Вспомогательная таблица для расчета коэффициентов парных корреляций
t | Y | X1 | X2 | (y-yср)* | (y-yср)* | (х1-х1ср)* |
|||
1998 | 3,0 | 1,1 | 0,4 | 0,0196 | 0,0484 | 0,0841 | 0,0308 | 0,0406 | 0,0638 |
1999 | 2,9 | 1,1 | 0,4 | 0,0576 | 0,0484 | 0,0841 | 0,0528 | 0,0696 | 0,0638 |
2000 | 3,0 | 1,2 | 0,7 | 0,0196 | 0,0144 | 1E-04 | 0,0168 | -0,0014 | -0,0012 |
2001 | 3,1 | 1,4 | 0,9 | 0,0016 | 0,0064 | 0,0441 | -0,0032 | -0,0084 | 0,0168 |
2002 | 3,2 | 1,4 | 0,9 | 0,0036 | 0,0064 | 0,0441 | 0,0048 | 0,0126 | 0,0168 |
2003 | 2,8 | 1,4 | 0,8 | 0,1156 | 0,0064 | 0,0121 | -0,0272 | -0,0374 | 0,0088 |
2004 | 2,9 | 1,3 | 0,8 | 0,0576 | 0,0004 | 0,0121 | 0,0048 | -0,0264 | -0,0022 |
2005 | 3,4 | 1,6 | 1,1 | 0,0676 | 0,0784 | 0,1681 | 0,0728 | 0,1066 | 0,1148 |
2006 | 3,5 | 1,3 | 0,4 | 0,1296 | 0,0004 | 0,0841 | -0,0072 | -0,1044 | 0,0058 |
2007 | 3,6 | 1,4 | 0,5 | 0,2116 | 0,0064 | 0,0361 | 0,0368 | -0,0874 | -0,0152 |
Σ | 31,4 | 13,2 | 6,9 | 0,684 | 0,216 | 0,569 | 0,182 | -0,036 | 0,272 |
Средн. | 3,14 | 1,32 | 0,69 |
Также матрицу коэффициентов парных корреляций можно найти в среде Excel с помощью надстройки АНАЛИЗ ДАННЫХ, инструмента КОРРЕЛЯЦИЯ.
Матрица коэффициентов парной корреляции имеет вид:
Y | X1 | X2 | |
Y | 1 | ||
X1 | 0,4735 | 1 | |
X2 | -0,0577 | 0,7759 | 1 |
Матрица парных коэффициентов корреляции показывает, что результативный признак у (выручка) имеет слабую связь с объемом капиталовложений х 1 , а с Размером ОПФ связи практически нет. Связь между факторами в модели оценивается как тесная, что говорит о их линейной зависимости, мультиколлинеарности.
2. ПОСТРОИТЬ ЛИНЕЙНУЮ МОДЕЛЬ МНОЖЕСТВЕННОЙ РЕГРЕССИИ
Параметры модели найдем с помощью МНК. Для этого составим систему нормальных уравнений.
Расчеты представлены в таблице 10.
Решим систему уравнений, используя метод Крамера:
Таблица 10
Вспомогательные вычисления для нахождения параметров линейной модели множественной регрессии
y | |||||||
3,0 | 1,1 | 0,4 | 1,21 | 0,44 | 0,16 | 3,3 | 1,2 |
2,9 | 1,1 | 0,4 | 1,21 | 0,44 | 0,16 | 3,19 | 1,16 |
3,0 | 1,2 | 0,7 | 1,44 | 0,84 | 0,49 | 3,6 | 2,1 |
3,1 | 1,4 | 0,9 | 1,96 | 1,26 | 0,81 | 4,34 | 2,79 |
3,2 | 1,4 | 0,9 | 1,96 | 1,26 | 0,81 | 4,48 | 2,88 |
2,8 | 1,4 | 0,8 | 1,96 | 1,12 | 0,64 | 3,92 | 2,24 |
2,9 | 1,3 | 0,8 | 1,69 | 1,04 | 0,64 | 3,77 | 2,32 |
3,4 | 1,6 | 1,1 | 2,56 | 1,76 | 1,21 | 5,44 | 3,74 |
3,5 | 1,3 | 0,4 | 1,69 | 0,52 | 0,16 | 4,55 | 1,4 |
3,6 | 1,4 | 0,5 | 1,96 | 0,7 | 0,25 | 5,04 | 1,8 |
31,4 | 13,2 | 6,9 | 17,64 | 9,38 | 5,33 | 41,63 | 21,63 |
Линейная модель множественной регрессии имеет вид:
Если объем капиталовложений увеличить на 1 млн. руб., то выручка предприятия увеличиться в среднем на 2,317 млн. руб. при неизменных размерах основных производственных фондов.
Если основные производственные фонды увеличить на 1 млн. руб., то выручка предприятия уменьшиться в среднем на 1,171 млн. руб. при неизменном объеме капиталовложений.
3. РАССЧИТАЕМ:
коэффициент детерминации:
67,82% изменения выручки предприятия обусловлено изменением объема капиталовложений и основных производственных фондов, на 32,18% - влиянием факторов, не включенных в модель.
F – критерий Фишера
Проверим значимость уравнения
Табличное значение F – критерия при уровне значимости α = 0,05 и числе степеней свободы d.f. 1 = k = 2 (количество факторов), числе степеней свободы d.f. 2 = (n – k – 1) = (10 – 2 – 1) = 7 составит 4,74.
Так как F расч. = 7,375 > F табл. = 4.74, то уравнение регрессии в целом можно считать статистически значимым.
Рассчитанные показатели можно найти в среде Excel с помощью надстройки АНАЛИЗА ДАННЫХ, инструмента РЕГРЕССИЯ.
Таблица 11
Вспомогательные вычисления для нахождения средней относительной ошибки аппроксимации
y | А | ||||
3,0 | 1,1 | 0,4 | 2,97 | 0,03 | 0,010 |
2,9 | 1,1 | 0,4 | 2,97 | -0,07 | 0,024 |
3,0 | 1,2 | 0,7 | 2,85 | 0,15 | 0,050 |
3,1 | 1,4 | 0,9 | 3,08 | 0,02 | 0,007 |
3,2 | 1,4 | 0,9 | 3,08 | 0,12 | 0,038 |
2,8 | 1,4 | 0,8 | 3,20 | -0,40 | 0,142 |
2,9 | 1,3 | 0,8 | 2,96 | -0,06 | 0,022 |
3,4 | 1,6 | 1,1 | 3,31 | 0,09 | 0,027 |
3,5 | 1,3 | 0,4 | 3,43 | 0,07 | 0,019 |
3,6 | 1,4 | 0,5 | 3,55 | 0,05 | 0,014 |
0,353 |
среднюю относительную ошибку аппроксимации
В среднем расчетные значения отличаются от фактических на 3,53 %. Ошибка небольшая, модель можно считать точной.
4. Построить степенную модель множественной регрессии
Для построения данной модели прологарифмируем обе части равенства
lg y = lg a + β 1 ∙ lg x 1 + β 2 ∙ lg x 2 .
Сделаем замену Y = lg y, A = lg a, X 1 = lg x 1 , X 2 = lg x 2 .
Тогда Y = A + β 1 ∙ X 1 + β 2 ∙ X 2 – линейная двухфакторная модель регрессии. Можно применить МНК.
Расчеты представлены в таблице 12.
Таблица 12
Вспомогательные вычисления для нахождения параметров степенной модели множественной регрессии
y | lg y | |||||||||
3,0 | 1,1 | 0,4 | 0,041 | -0,398 | 0,477 | 0,002 | -0,016 | 0,020 | 0,158 | -0,190 |
2,9 | 1,1 | 0,4 | 0,041 | -0,398 | 0,462 | 0,002 | -0,016 | 0,019 | 0,158 | -0,184 |
3,0 | 1,2 | 0,7 | 0,079 | -0,155 | 0,477 | 0,006 | -0,012 | 0,038 | 0,024 | -0,074 |
3,1 | 1,4 | 0,9 | 0,146 | -0,046 | 0,491 | 0,021 | -0,007 | 0,072 | 0,002 | -0,022 |
3,2 | 1,4 | 0,9 | 0,146 | -0,046 | 0,505 | 0,021 | -0,007 | 0,074 | 0,002 | -0,023 |
2,8 | 1,4 | 0,8 | 0,146 | -0,097 | 0,447 | 0,021 | -0,014 | 0,065 | 0,009 | -0,043 |
2,9 | 1,3 | 0,8 | 0,114 | -0,097 | 0,462 | 0,013 | -0,011 | 0,053 | 0,009 | -0,045 |
3,4 | 1,6 | 1,1 | 0,204 | 0,041 | 0,531 | 0,042 | 0,008 | 0,108 | 0,002 | 0,022 |
3,5 | 1,3 | 0,4 | 0,114 | -0,398 | 0,544 | 0,013 | -0,045 | 0,062 | 0,158 | -0,217 |
3,6 | 1,4 | 0,5 | 0,146 | -0,301 | 0,556 | 0,021 | -0,044 | 0,081 | 0,091 | -0,167 |
31,4 | 13,2 | 6,9 | 1,178 | -1,894 | 4,955 | 0,163 | -0,165 | 0,592 | 0,614 | -0,943 |
Решаем систему уравнений применяя метод Крамера.
Степенная модель множественной регрессии имеет вид:
В степенной функции коэффициенты при факторах являются коэффициентами эластичности. Коэффициент эластичности показывает на сколько процентов измениться в среднем значение результативного признака у, если один из факторов увеличить на 1 % при неизменном значении других факторов.
Если объем капиталовложений увеличить на 1%, то выручка предприятия увеличиться в среднем на 0,897% при неизменных размерах основных производственных фондов.
Если основные производственные фонды увеличить на 1%, то выручка предприятия уменьшиться на 0,226% при неизменных капиталовложениях.
5. РАССЧИТАЕМ:
коэффициент множественной корреляции:
Связь выручки предприятия с объемом капиталовложений и основными производственными фондами тесная.
Таблица 13
Вспомогательные вычисления для нахождения коэффициента множественной корреляции, коэффициента детерминации, ср.относ.ошибки аппроксимации степенной модели множественной регрессии
Y | (Y-Y расч.) 2 | A | ||||
3,0 | 1,1 | 0,4 | 2,978 | 0,000 | 0,020 | 0,007 |
2,9 | 1,1 | 0,4 | 2,978 | 0,006 | 0,058 | 0,027 |
3,0 | 1,2 | 0,7 | 2,838 | 0,026 | 0,020 | 0,054 |
3,1 | 1,4 | 0,9 | 3,079 | 0,000 | 0,002 | 0,007 |
3,2 | 1,4 | 0,9 | 3,079 | 0,015 | 0,004 | 0,038 |
2,8 | 1,4 | 0,8 | 3,162 | 0,131 | 0,116 | 0,129 |
2,9 | 1,3 | 0,8 | 2,959 | 0,003 | 0,058 | 0,020 |
3,4 | 1,6 | 1,1 | 3,317 | 0,007 | 0,068 | 0,024 |
3,5 | 1,3 | 0,4 | 3,460 | 0,002 | 0,130 | 0,012 |
3,6 | 1,4 | 0,5 | 3,516 | 0,007 | 0,212 | 0,023 |
31,4 | 13,2 | 6,9 | 0,198 | 0,684 | 0,342 |
коэффициент детерминации:
71,06% изменения выручки предприятия в степенной модели обусловлено изменением объема капиталовложений и основных производственных фондов, на 28,94 % - влиянием факторов, не включенных в модель.
F – критерий Фишера
Проверим значимость уравнения
Табличное значение F – критерия при уровне значимости α = 0,05 и числе степеней свободы d.f. 1 = k = 2, числе степеней свободы d.f. 2 = (n – k – 1) = (10 – 2 – 1) = 7 составит 4,74.
Так как F расч. = 8,592 > F табл. = 4.74, то уравнение степенной регрессии в целом можно считать статистически значимым.
Посадка невозможна, в каком из реализуемых случаев расход топлива меньше. Получить программу оптимального управления, когда до некоторого момента t1 управление отсутствует u*=0, а начиная с t=t1, управление равно своему максимальному значению u*=umax, что соответствует минимальному расходу топлива. 6.) Решить каноническую систему уравнений, рассматривая ее для случаев, когда и управление...
К составлению математических моделей. Если математическая модель - это диагноз заболевания, то алгоритм - это метод лечения. Можно выделить следующие основные этапы операционного исследования: наблюдение явления и сбор исходных данных; постановка задачи; построение математической модели; расчет модели; тестирование модели и анализ выходных данных. Если полученные результаты не удовлетворяют...
Математических построений по аналогии с выявляет в плоском приближении продольно-скалярную электромагнитную волну с электрической - (28) и магнитной (29) синфазными составляющими. Математическая модель безвихревой электродинамики характеризуется скалярно-векторной структурой своих уравнений. Основополагающие уравнения безвихревой электродинамики сведены в таблице 1. Таблица 1 , ...
Y | X 1 | X 2 | X 3 | X 4 | X 5 | X 6 | |
Y | |||||||
X 1 | 0,519 | ||||||
X 2 | -0,273 | 0,030 | |||||
X 3 | 0,610 | 0,813 | -0,116 | ||||
X 4 | -0,572 | -0,013 | -0,022 | -0,091 | |||
X 5 | 0,297 | 0,043 | -0,461 | 0,120 | -0,359 | ||
X 6 | 0,118 | -0,366 | -0,061 | -0,329 | -0,100 | -0,290 |
Анализ межфакторных (между «иксами»!) коэффициентов корреляции показывает, что значение 0,8 превышает по абсолютной величине только коэффициент корреляции между парой факторов Х 1 –Х 3 (выделен жирным шрифтом). Факторы Х 1 –Х 3 , таким образом, признаются коллинеарными.
2. Как было показано в пункте 1, факторы Х 1 –Х 3 являются коллинеарными, а это означает, что они фактически дублируют друг друга, и их одновременное включение в модель приведет к неправильной интерпретации соответствующих коэффициентов регрессии. Видно, что фактор Х 3 имеет больший по модулю коэффициент корреляции с результатом Y , чем фактор Х 1: r y , x 1 =0,519; r y , x 3 =0,610; (см. табл. 1 ). Это свидетельствует о более сильном влиянии фактора Х 3 на изменение Y . Фактор Х 1 , таким образом, исключается из рассмотрения.
Для построения уравнения регрессии значения используемых переменных (Y , X 2 , X 3 , X 4 , X 5 , X 6) скопируем на чистый рабочий лист (прил. 3) . Уравнение регрессии строим с помощью надстройки «Анализ данных… Регрессия » (меню «Сервис» ® «Анализ данных… » ® «Регрессия »). Панель регрессионного анализа с заполненными полями изображена на рис. 2 .
Результаты регрессионного анализа приведены в прил. 4 и перенесены в табл. 2 . Уравнение регрессии имеет вид (см. «Коэффициенты» втабл. 2 ):
Уравнение регрессии признается статистически значимым, так как вероятность его случайного формирования в том виде, в котором оно получено, составляет 8,80×10 -6 (см. «Значимость F» втабл. 2 ), что существенно ниже принятого уровня значимости a=0,05.
Х 3 , Х 4 , Х 6 ниже принятого уровня значимости a=0,05 (см. «P-Значение» втабл. 2 ), что свидетельствует о статистической значимости коэффициентов и существенном влиянии этих факторов на изменение годовой прибыли Y .
Вероятность случайного формирования коэффициентов при факторах Х 2 и Х 5 превышает принятый уровень значимости a=0,05 (см. «P-Значение» втабл. 2 ), и эти коэффициенты не признаются статистически значимыми.
рис. 2. Панель регрессионного анализа модели Y (X 2 , X 3 , X 4 , X 5 , X 6)
Таблица 2
Y (X 2 , X 3 , X 4 , X 5 , X 6)
Регрессионная статистика | |||||||||
Множественный R | 0,868 | ||||||||
R-квадрат | 0,753 | ||||||||
Нормированный R-квадрат | 0,694 | ||||||||
Стандартная ошибка | 242,3 | ||||||||
Наблюдения | |||||||||
Дисперсионный анализ | |||||||||
df | SS | MS | F | Значимость F | |||||
Регрессия | 3749838,2 | 749967,6 | 12,78 | 8,80E-06 | |||||
Остаток | 1232466,8 | 58688,9 | |||||||
Итого | 4982305,0 | ||||||||
Уравнение регрессии | |||||||||
Коэффициенты | Стандартная ошибка | t-статистика | P-Значение | ||||||
Y-пересечение | 487,5 | 641,4 | 0,760 | 0,456 | |||||
X2 | -0,0456 | 0,0373 | -1,224 | 0,235 | |||||
X3 | 0,1043 | 0,0194 | 5,375 | 0,00002 | |||||
X4 | -0,0965 | 0,0263 | -3,674 | 0,001 | |||||
X5 | 2,528 | 6,323 | 0,400 | 0,693 | |||||
X6 | 248,2 | 113,0 | 2,197 | 0,039 | |||||
3. По результатам проверки статистической значимости коэффициентов уравнения регрессии, проведенной в предыдущем пункте, строим новую регрессионную модель, содержащую только информативные факторы, к которым относятся:
· факторы, коэффициенты при которых статистически значимы;
· факторы, у коэффициентов которых t ‑статистика превышает по модулю единицу (другими словами, абсолютная величина коэффициента больше его стандартной ошибки).
К первой группе относятся факторы Х 3 , Х 4 , Х 6 , ко второй - фактор X 2 . Фактор X 5 исключается из рассмотрения как неинформативный, и окончательно регрессионная модель будет содержать факторы X 2 , X 3 , X 4 , X 6 .
Для построения уравнения регрессии скопируем на чистый рабочий лист значения используемых переменных (прил. 5) и проведем регрессионный анализ (рис. 3 ). Его результаты приведены в прил. 6 и перенесены в табл. 3 . Уравнение регрессии имеет вид:
(см. «Коэффициенты» втабл. 3 ).
рис. 3. Панель регрессионного анализа модели Y (X 2 , X 3 , X 4 , X 6)
Таблица 3
Результаты регрессионного анализа модели Y (X 2 , X 3 , X 4 , X 6)
Регрессионная статистика | |||||||||
Множественный R | 0,866 | ||||||||
R-квадрат | 0,751 | ||||||||
Нормированный R-квадрат | 0,705 | ||||||||
Стандартная ошибка | 237,6 | ||||||||
Наблюдения | |||||||||
Дисперсионный анализ | |||||||||
df | SS | MS | F | Значимость F | |||||
Регрессия | 3740456,2 | 935114,1 | 16,57 | 2,14E-06 | |||||
Остаток | 1241848,7 | 56447,7 | |||||||
Итого | 4982305,0 | ||||||||
Уравнение регрессии | |||||||||
Коэффициенты | Стандартная ошибка | t-статистика | P-Значение | ||||||
Y-пересечение | 712,2 | 303,0 | 2,351 | 0,028 | |||||
X2 | -0,0541 | 0,0300 | -1,806 | 0,085 | |||||
X3 | 0,1032 | 0,0188 | 5,476 | 0,00002 | |||||
X4 | -0,1017 | 0,0223 | -4,560 | 0,00015 | |||||
X6 | 227,5 | 98,5 | 2,310 | 0,031 | |||||
Уравнение регрессии статистически значимо: вероятность его случайного формирования ниже допустимого уровня значимости a=0,05 (см. «Значимость F» втабл. 3 ).
Статистически значимыми признаются и коэффициенты при факторах Х 3 , Х 4 , Х 6: вероятность их случайного формирования ниже допустимого уровня значимости a=0,05 (см. «P-Значение» втабл. 3 ). Это свидетельствует о существенном влиянии годового размера страховых сборов X 3 , годового размера страховых выплат X 4 и формы собственности X 6 на изменение годовой прибыли Y .
Коэффициент при факторе Х 2 (годовой размер страховых резервов) не является статистически значимым. Однако этот фактор все же можно считать информативным, так как t ‑статистика его коэффициента превышает по модулю единицу, хотя к дальнейшим выводам относительно фактора Х 2 следует относиться с некоторой долей осторожности.
4. Оценим качество и точность последнего уравнения регрессии, используя некоторые статистические характеристики, полученные в ходе регрессионного анализа (см. «Регрессионную статистику » в табл. 3 ):
· множественный коэффициент детерминации
показывает, что регрессионная модель объясняет 75,1 % вариации годовой прибыли Y , причем эта вариация обусловлена изменением включенных в модель регрессии факторов X 2 , X 3 , X 4 и X 6 ;
· стандартная ошибка регрессии
тыс. руб.
показывает, что предсказанные уравнением регрессии значения годовой прибыли Y отличаются от фактических значений в среднем на 237,6 тыс. руб.
Средняя относительная ошибка аппроксимации определяется по приближенной формуле:
где тыс. руб. - среднее значение годовой прибыли (определено с помощью встроенной функции «СРЗНАЧ »; прил. 1 ).
Е отн показывает, что предсказанные уравнением регрессии значения годовой прибыли Y отличаются от фактических значений в среднем на 26,7 %. Модель имеет неудовлетворительную точность (при - точность модели высокая, при - хорошая, при - удовлетворительная, при - неудовлетворительная).
5. Для экономической интерпретации коэффициентов уравнения регрессии сведем в таблицу средние значения и стандартные отклонения переменных в исходных данных (табл. 4 ) . Средние значения были определены с помощью встроенной функции «СРЗНАЧ », стандартные отклонения - с помощью встроенной функции «СТАНДОТКЛОН » (см. прил. 1 ).
ВАРИАНТ 5
Изучается зависимость средней ожидаемой продолжительности жизни от нескольких факторов по данным за 1995 г., представленным в табл. 5.
Таблица 5
Мозамбик |
|||||
…………………………………………………………………………………….. |
|||||
Швейцария |
Принятые в таблице обозначения:
· Y -- средняя ожидаемая продолжительность жизни при рождении, лет;
· X 1 -- ВВП в паритетах покупательной способности;
· X 2 -- цепные темпы прироста населения, %;
· X 3 -- цепные темпы прироста рабочей силы, %;
· Х 4 -- коэффициент младенческой смертности, %.
Требуется:
1. Составить матрицу парных коэффициентов корреляции между всеми исследуемыми переменными и выявить коллинеарные факторы.
2. Построить уравнение регрессии, не содержащее коллинеарных факторов. Проверить статистическую значимость уравнения и его коэффициентов.
3. Построить уравнение регрессии, содержащее только статистически значимые и информативные факторы. Проверить статистическую значимость уравнения и его коэффициентов.
Пункты 4 -- 6 относятся к уравнению регрессии, построенному при выполнении пункта 3.
4. Оценить качество и точность уравнения регрессии.
5. Дать экономическую интерпретацию коэффициентов уравнения регрессии и сравнительную оценку силы влияния факторов на результативную переменную Y .
6. Рассчитать прогнозное значение результативной переменной Y , если прогнозные значения факторов составят 75 % от своих максимальных значений. Построить доверительный интервал прогноза фактического значения Y c надежностью 80 %.
Решение. Для решения задачи используется табличный процессор EXCEL.
1. С помощью надстройки «Анализ данных… Корреляция» строим матрицу парных коэффициентов корреляции между всеми исследуемыми переменными (меню «Сервис» «Анализ данных…» «Корреляция»). На рис. 1 изображена панель корреляционного анализа с заполненными полямиДля копирования снимка окна в буфер обмена данных WINDOWS используется комбинация клавиш Alt+Print Screen (на некоторых клавиатурах -- Alt+PrtSc).. Результаты корреляционного анализа приведены в прил. 2 и перенесены в табл. 1.
рис. 1. Панель корреляционного анализа
Таблица 1
Матрица парных коэффициентов корреляции
Анализ межфакторных коэффициентов корреляции показывает, что значение 0,8 превышает по абсолютной величине коэффициент корреляции между парой факторов Х 2 -Х 3 (выделен жирным шрифтом). Факторы Х 2 -Х 3 таким образом, признаются коллинеарными.
2. Как было показано в пункте 1, факторы Х2-Х3 являются коллинеарными, а это означает, что они фактически дублируют друг друга, и их одновременное включение в модель приведет к неправильной интерпретации соответствующих коэффициентов регрессии. Видно, что фактор Х2 имеет больший по модулю коэффициент корреляции с результатом Y, чем фактор Х3: ry,x2=0,72516; ry,x3=0,53397; |ry,x2|>|ry,x3| (см. табл. 1). Это свидетельствует о более сильном влиянии фактора Х2 на изменение Y. Фактор Х3, таким образом, исключается из рассмотрения.
Для построения уравнения регрессии значения используемых переменных (Y , X 1 , X 2 , X 4) скопируем на чистый рабочий лист (прил. 3) . Уравнение регрессии строим с помощью надстройки «Анализ данных… Регрессия » (меню «Сервис» «Анализ данных… » «Регрессия »). Панель регрессионного анализа с заполненными полями изображена на рис. 2 .
Результаты регрессионного анализа приведены в прил. 4 и перенесены в табл. 2 . Уравнение регрессии имеет вид (см. «Коэффициенты» в табл. 2 ):
y = 75.44 + 0.0447 ? x 1 - 0.0453 ? x 2 - 0.24 ? x 4
Уравнение регрессии признается статистически значимым, так как вероятность его случайного формирования в том виде, в котором оно получено, составляет 1.04571?10 -45 (см. «Значимость F» в табл. 2 ), что существенно ниже принятого уровня значимости =0,05.
Вероятность случайного формирования коэффициентов при факторе Х 1 ниже принятого уровня значимости =0,05 (см. «P-Значение» в табл. 2 ), что свидетельствует о статистической значимости коэффициентов и существенном влиянии этих факторов на изменение годовой прибыли Y .
Вероятность случайного формирования коэффициентов при факторах Х 2 и Х 4 превышает принятый уровень значимости =0,05 (см. «P-Значение» в табл. 2 ), и эти коэффициенты не признаются статистически значимыми.
рис. 2. Панель регрессионного анализа модели Y (X 1 ,X 2 ,X 4 )
Таблица 2
Y (X 1 , X 2 , X 4 )
Дисперсионный анализ |
||||||||
Значимость F |
||||||||
Регрессия |
||||||||
Уравнение регрессии |
||||||||
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
Нижние 95,0% |
Верхние 95,0% |
|
Y-пересечение |
||||||||
3. По результатам проверки статистической значимости коэффициентов уравнения регрессии, проведенной в предыдущем пункте, строим новую регрессионную модель, содержащую только информативные факторы, к которым относятся:
· факторы, коэффициенты при которых статистически значимы;
· факторы, у коэффициентов которых t _статистика превышает по модулю единицу (другими словами, абсолютная величина коэффициента больше его стандартной ошибки).
К первой группе относится фактор Х 1 ко второй -- фактор X 4 . Фактор X 2 исключается из рассмотрения как неинформативный, и окончательно регрессионная модель будет содержать факторы X 1 , X 4 .
Для построения уравнения регрессии скопируем на чистый рабочий лист значения используемых переменных (прил. 5) и проведем регрессионный анализ (рис. 3 ). Его результаты приведены в прил. 6 и перенесены в табл. 3 . Уравнение регрессии имеет вид:
y = 75.38278 + 0.044918 ? x 1 - 0.24031 ? x 4
(см. «Коэффициенты» в табл.3 ).
рис. 3. Панель регрессионного анализа модели Y (X 1 , X 4 )
Таблица 3
Результаты регрессионного анализа модели Y (X 1 , X 4 )
Регрессионная статистика |
|||||
Множественный R |
|||||
R-квадрат |
|||||
Нормированный R-квадрат |
|||||
Стандартная ошибка |
|||||
Наблюдения |
|||||
Дисперсионный анализ |
|||||
Значимость F |
|||||
Регрессия |
|||||
Уравнение регрессии |
|||||
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
||
Y-пересечение |
|||||
Уравнение регрессии статистически значимо: вероятность его случайного формирования ниже допустимого уровня значимости =0,05 (см. «Значимость F» в табл.3 ).
Статистически значимым признается и коэффициент при факторе Х 1 вероятность его случайного формирования ниже допустимого уровня значимости =0,05 (см. «P-Значение» в табл. 3 ). Это свидетельствует о существенном влиянии ВВП в паритетах покупательной способности X 1 на изменение годовой прибыли Y .
Коэффициент при факторе Х 4 (годовой коэффициент младенческой смертности) не является статистически значимым. Однако этот фактор все же можно считать информативным, так как t _статистика его коэффициента превышает по модулю единицу, хотя к дальнейшим выводам относительно фактора Х 4 следует относиться с некоторой долей осторожности.
4. Оценим качество и точность последнего уравнения регрессии, используя некоторые статистические характеристики, полученные в ходе регрессионного анализа (см. «Регрессионную статистику» в табл. 3):
· множественный коэффициент детерминации
R 2 = _ i=1 ____________ =0.946576
R 2 = показывает, что регрессионная модель объясняет 94,7 % вариации средней ожидаемой продолжительности жизни при рождении Y , причем эта вариация обусловлена изменением включенных в модель регрессии факторов X 1 , X 4 ;
· стандартная ошибка регрессии
показывает, что предсказанные уравнением регрессии значения средней ожидаемой продолжительности жизни при рождении Y отличаются от фактических значений в среднем на 2,252208 лет.
Средняя относительная ошибка аппроксимации определяется по приближенной формуле:
E отн?0,8 ? -- ? 100%=0.8 ? 2.252208/66.9 ? 100%?2.7
где тыс. руб. -- среднее значение продолжительности жизни (определено с помощью встроенной функции «СРЗНАЧ »; прил. 1 ).
Е отн показывает, что предсказанные уравнением регрессии значения годовой прибыли Y отличаются от фактических значений в среднем на 2,7 %. Модель имеет высокую точность (при -- точность модели высокая, при -- хорошая, при -- удовлетворительная, при -- неудовлетворительная).
5. Для экономической интерпретации коэффициентов уравнения регрессии сведем в таблицу средние значения и стандартные отклонения переменных в исходных данных (табл. 4). Средние значения были определены с помощью встроенной функции «СРЗНАЧ», стандартные отклонения -- с помощью встроенной функции «СТАНДОТКЛОН» (см. прил. 1).
Коллинеарными являются факторы …
И коллинеарны.
4. В модели множественной регрессии определитель матрицы парных коэффициентов корреляции между факторами , и близок к нулю. Это означает, что факторы , и … мультиколлинеарность факторов.
5. Для эконометрической модели линейного уравнения множественной регрессии вида построена матрица парных коэффициентов линейной корреляции (y – зависимая переменная; х (1) , х (2) , х (3) , x (4) – независимые переменные):
Коллинеарными (тесно связанными) независимыми (объясняющими) переменными не являются
…x (2)
и x (3)
1. Дана таблица исходных данных для построения эконометрической регрессионной модели:
Фиктивными переменными не являются …
стаж работы
производительность труда
2. При исследовании зависимости потребления мяса от уровня дохода и пола потребителя можно рекомендовать …
использовать фиктивную переменную – пол потребителя
разделить совокупность на две: для потребителей женского пола и для потребителей мужского пола
3. Изучается зависимость цены квартиры (у
) от ее жилой площади (х
) и типа дома. В модель включены фиктивные переменные, отражающие рассматриваемые типы домов: монолитный, панельный, кирпичный. Получено уравнение регрессии: ,
где ,
Частными уравнениями регрессии для кирпичного и монолитного являются …
для типа дома кирпичный
для типа дома монолитный
4. При анализе промышленных предприятий в трех регионах (Республика Марий Эл, Республика Чувашия, Республика Татарстан) были построены три частных уравнения регрессии:
для Республики Марий Эл;
для Республики Чувашия;
для Республики Татарстан.
Укажите вид фиктивных переменных и уравнение с фиктивными переменными, обобщающее три частных уравнения регрессии.
5. В эконометрике фиктивной переменной принято считать …
переменную, принимающую значения 0 и 1
описывающую количественным образом качественный признак
1. Для регрессионной модели зависимости среднедушевого денежного дохода населения (руб., у ) от объема валового регионального продукта (тыс. р., х 1 ) и уровня безработицы в субъекте (%, х 2 ) получено уравнение . Величина коэффициента регрессии при переменной х 2 свидетельствует о том, что при изменении уровня безработицы на 1% среднедушевой денежный доход ______ рубля при неизменной величине валового регионального продукта.
изменится на (-1,67)
2. В уравнении линейной множественной регрессии: , где – стоимость основных фондов (тыс. руб.); – численность занятых (тыс. чел.); y – объем промышленного производства (тыс. руб.) параметр при переменной х 1 , равный 10,8, означает, что при увеличении объема основных фондов на _____ объем промышленного производства _____ при постоянной численности занятых.
на 1 тыс. руб. … увеличится на 10,8 тыс. руб.
3. Известно, что доля остаточной дисперсии зависимой переменной в ее общей дисперсии равна 0,2. Тогда значение коэффициента детерминации составляет … 0,8
4. Построена эконометрическая модель для зависимости прибыли от реализации единицы продукции (руб., у ) от величины оборотных средств предприятия (тыс. р., х 1 ): . Следовательно, средний размер прибыли от реализации, не зависящий от объема оборотных средств предприятия, составляет _____ рубля. 10,75
5. F-статистика рассчитывается как отношение ______ дисперсии к ________ дисперсии, рассчитанных на одну степень свободы. факторной … остаточной
1. Для эконометрической модели уравнения регрессии ошибка модели определяется как ______ между фактическим значением зависимой переменной и ее расчетным значением. Разность
2. Величина называется … случайной составляющей
3. В эконометрической модели уравнения регрессии величина отклонения фактического значения зависимой переменной от ее расчетного значения характеризует … ошибку модели
4. Известно, что доля объясненной дисперсии в общей дисперсии равна 0,2. Тогда значение коэффициента детерминации составляет … 0,2
5. При методе наименьших квадратов параметры уравнения парной линейной регрессии определяются из условия ______ остатков . минимизации суммы квадратов
1. Для обнаружения автокорреляции в остатках используется …
статистика Дарбина – Уотсона
2. Известно, что коэффициент автокорреляции остатков первого порядка равен –0,3. Также даны критические значения статистики Дарбина – Уотсона для заданного количества параметров при неизвестном и количестве наблюдений , . По данным характеристикам можно сделать вывод о том, что …автокорреляция остатков отсутствует
Для определения степени зависимости между несколькими показателями применяется множественные коэффициенты корреляции. Их затем сводят в отдельную таблицу, которая имеет название корреляционной матрицы. Наименованиями строк и столбцов такой матрицы являются названия параметров, зависимость которых друг от друга устанавливается. На пересечении строк и столбцов располагаются соответствующие коэффициенты корреляции. Давайте выясним, как можно провести подобный расчет с помощью инструментов Excel.
Принято следующим образом определять уровень взаимосвязи между различными показателями, в зависимости от коэффициента корреляции:
- 0 – 0,3 – связь отсутствует;
- 0,3 – 0,5 – связь слабая;
- 0,5 – 0,7 – средняя связь;
- 0,7 – 0,9 – высокая;
- 0,9 – 1 – очень сильная.
Если корреляционный коэффициент отрицательный, то это значит, что связь параметров обратная.
Для того, чтобы составить корреляционную матрицу в Экселе, используется один инструмент, входящий в пакет «Анализ данных» . Он так и называется – «Корреляция» . Давайте узнаем, как с помощью него можно вычислить показатели множественной корреляции.
Этап 1: активация пакета анализа
Сразу нужно сказать, что по умолчанию пакет «Анализ данных» отключен. Поэтому, прежде чем приступить к процедуре непосредственного вычисления коэффициентов корреляции, нужно его активировать. К сожалению, далеко не каждый пользователь знает, как это делать. Поэтому мы остановимся на данном вопросе.
После указанного действия пакет инструментов «Анализ данных» будет активирован.
Этап 2: расчет коэффициента
Теперь можно переходить непосредственно к расчету множественного коэффициента корреляции. Давайте на примере представленной ниже таблицы показателей производительности труда, фондовооруженности и энерговооруженности на различных предприятиях рассчитаем множественный коэффициент корреляции указанных факторов.
Этап 3: анализ полученного результата
Теперь давайте разберемся, как понимать тот результат, который мы получили в процессе обработки данных инструментом «Корреляция» в программе Excel.
Как видим из таблицы, коэффициент корреляции фондовооруженности (Столбец 2 ) и энерговооруженности (Столбец 1 ) составляет 0,92, что соответствует очень сильной взаимосвязи. Между производительностью труда (Столбец 3 ) и энерговооруженностью (Столбец 1 ) данный показатель равен 0,72, что является высокой степенью зависимости. Коэффициент корреляции между производительностью труда (Столбец 3 ) и фондовооруженностью (Столбец 2 ) равен 0,88, что тоже соответствует высокой степени зависимости. Таким образом, можно сказать, что зависимость между всеми изучаемыми факторами прослеживается довольно сильная.
Как видим, пакет «Анализ данных» в Экселе представляет собой очень удобный и довольно легкий в обращении инструмент для определения множественного коэффициента корреляции. С его же помощью можно производить расчет и обычной корреляции между двумя факторами.