2.2 Обоснование и выбор факторов модели
В большинстве исследований зависимости энергопотребления от экономического роста страны используется такой фактор как ВВП на душу населения, тем самым авторы анализировали или временные ряды для случаев каждой страны, или проводили однофакторный анализ панельных данных. В данной работе поставлена задача проанализировать зависимость удельного энергопотребления от иных факторов, которые, также как и ВВП, отражают экономическое развитие страны.
Исходя из пункта 1.3, были выбраны следующие количественные и качественные факторы:
Экспорт;
Импорт;
Зарубежные инвестиции;
Инфляция;
Инвестиции в основной капитал;
Безработица;
Доля городского населения;
Общая сумма конечного потребления государственных расходов.
Предполагается, что во всех странах наблюдается односторонняя зависимость удельного энергопотребления от экономического роста страны.
Выдвигаются следующие предположения о влиянии факторов:
С ростом экспорта растет энергопотребление, так как производство товаров и услуг осуществляется не только для удовлетворения спроса на внутреннем рынке, но и для торговли между странами, что приводит к увеличению затрат на энергию для производства товаров и услуг;
С ростом импорта падает энергопотребление, так как стране-получателю нет необходимости производить импортируемый товар в большем количестве для удовлетворения спроса на данные товары и услуги;
Более близким фактором, влияющим на уровень энергоемкости экономики, может выступать уровень зарубежных инвестиций. В следующем исследовании доказано, что иностранные инвестиции играют значительную роль в сокращении энергоемкости экономики [Omri, 2014];
Рост инфляции характеризует рост цен на используемые ресурсы: увеличение тарифов на электроэнергию приводит к увеличению индекса цен производителей, вследствие чего производители стараются уменьшить энергопотребление путем его меньшего использования или через переход на энергоэффективные технологии, поэтому величина энергопотребления уменьшается;
Влияние инвестиций в качестве доли в основном капитале потенциально может осуществлять влияние на энергопотребление экономики, но этот показатель может быть не столь однозначным. С одной стороны, инвестиции в развивающихся странах могут быть направлены на рост производственных мощностей, в том числе в наиболее энергозатратных. С другой стороны, инвестиции могут быть направлены на структурную перестройку экономики, ввод новых высокотехнологичных, энергоэффективных мощностей [Эдер, 2015];
С ростом безработицы экономика не в состоянии создать достаточное количество рабочих мест для всех желающих, следовательно, экономика теряет часть объема продукции из-за неспособности в полной мере использовать свой производственный потенциал, происходит сокращение производства, вследствие чего энергопотребление уменьшается.
Рост доли городского населения (урбанизация) положительно влияет на энергопотребление, так как, с одной стороны, для удовлетворения спроса на блага городского населения требуется больше электроэнергии в связи с развитой инфраструктурой, а с другой стороны в городе, по сравнению с сельской местностью, сконцентрированы основные промышленные центры, количество работников на которых растет с ростом городского населения, вследствие чего производится больше товаров, что приводит к росту энергопотребления производств.
Рост государственных расходов может привести как к снижению энергопотребления, так и к его росту, в зависимости от целей, на которые были использованы эти средства.
2.3 Построение эконометрической модели
Для анализа зависимости энергопотребления от экономического развития в ряде стран используются панельные данные. Они представляют собой наблюдения над однородными объектами в течение определенного периода времени.
,
|
(2.3)
|
Пусть i=1,…,n – индекс объекта, t=1,..,T – индекс момента времени, тогда линейная модель панельных данных (2.3) будет иметь вид:
где yit – наблюдения над зависимой переменной;
xit – транспонированный вектор наблюдений над k независимыми переменными;
β – вектор коэффициентов регрессии;
uit – ошибка регрессии.
В чем преимущества использования панельных данных в отличие от кросс-секций и временных рядов? Во-первых, большое количество наблюдений увеличивает число степеней свободы, уменьшает коллинеарность независимых переменных, что позволяет в итоге получить более эффективные оценки. Но главным преимуществом является возможность контролировать неоднородность объектов в выборке. [Коломак, 2011]
Панель считается сбалансированной, если общее количество наблюдений равняется n*T , где n – количество факторов, а T – количество лет. Если для некоторых n и/или t наблюдения отсутствуют, то такая панель считается несбалансированной.
Для того чтобы модель стала сбалансированной, применяются вариации метода максимального правдоподобия (если механизм пропусков несущественен):
Детерминистическое пополнение данных на основе линейной регрессии (linear imputation);
Оценивается линейная регрессия по имеющимся переменным в качестве регрессоров, а в качестве зависимой переменной выступают пропущенные переменные и строится прогнозное значение для пропущенной переменной. [StataCorp., 2013.]
Метод «горячей колоды» (hot deck imputation);
Довольно неоднозначный метод, так как под собой не имеет строгую теоретическую базу: в пропущенные ячейки вставляются уже наблюденные переменные с похожими признаками поведения в тренде. [Mander, 1999.]
Метод множественного восстановления (multiply imputation).
Данный метод был предложен Дональдом Рубиным в 1978 году и имеет наибольший исследовательский интерес, так как данные восстанавливаются не один раз, а несколько, обобщая при этом результаты оценивания модели с помощью стандартных методов анализа полных данных. На первом шаге генерируются M наборов данных, исходя из предложенной модели; на втором шаге под названием проводится анализ сгенерированных данных для каждого m=1..M набора; на третьем шаге производится множественное восстановление данных, исходя из полученных результатов на втором шаге. [Rubin, 1986]
С помощью метода множественного восстановления панель становится сбалансированной, поэтому к ней можно применять стандартные методы анализа панельных данных.
Обратимся к структуре ошибок панельных данных. Выделяют два вида структуры ошибок: однонаправленная и двунаправленная модель ошибки. [Коломак, 2011]
Однонаправленная модель ошибки имеет в своей структуре две компоненты (2.4):
,
|
(2.4)
|
где µi – ненаблюдаемые индивидуальные эффекты;
νit– остаточные идиосинкратические компоненты.
Двунаправленная модель ошибки, в отличие от однонаправленной, имеет в своей структуре три компоненты (2.5):
,
|
(2.5)
|
где– ненаблюдаемые временные эффекты.
Предполагается, что , , являются независимыми одинаково распределенными случайными величинами с нулевой средней и постоянной дисперсией соответственно.
В модели, рассматриваемой в третьей главе, данные избавлены от сезонности, поэтому рассматривается однонаправленная модель ошибки.
Индивидуальные и временные эффекты могут трактоваться как фиксированные или случайные.
В однонаправленной модели с фиксированными эффектами (2.6) индивидуальные эффекты предполагаются фиксированными неизвестными параметрами, поэтому остаётся только идиосинкратическая компонента:
,
|
(2.6)
|
|
|
В этой модели индивидуальные эффекты являются фиктивными переменными:
В однонаправленной модели со случайными эффектами (2.7) предполагается, что индивидуальные эффекты являются случайными переменными, поэтому остается в ошибке:
|
(2.7)
|
На вопрос о том, модель с какими эффектами лучше выбрать, отвечает тест Хаусмана, который проверяет следующую гипотезу H0: E[ui|xi]=0 , то есть проверяется некоррелированность полных ошибок с регрессорами.
Рассчитывается статистика Хаусмана (2.8) и сравнивается с табличным значением распределения :
,
|
(2.8)
|
где – разность между GLS-оценкой и Within-оценкой параметров.
Если гипотеза H0 принимается, то более адекватной спецификацией является модель со случайными эффектами, иначе – с фиксированными. [Hausman, 1978]
Перед тем как выбирать модель с подходящими эффектами необходимо проверить переменные на стационарность, так как регрессия, основанная на нестационарных панельных переменных, может оказаться ложной (исключение – коинтегрированные временные ряды).
Панельные данные подразделяются на короткие и длинные. Короткие модели априори стационарны, так как в них рассматривается множество объектов в короткий промежуток времени (меньше 10 лет), в то время как длинные (с большим промежутком времени и с относительно небольшим количеством объектов) необходимо проверять на стационарность и коинтегрированность [Cameron and Trivedi, 2010]. Одним из способов проверки переменных на стационарность в панельных данных является the Levin–Lin–Chu unit-root test. [Levin, 2002] Тест включает в себя проверку каждой панели по расширенному критерию Дики-Фуллера и предполагает наличие общего параметра авторегрессии для всех панелей с выдвижением следующей гипотезы: H0 :панели содержат единичные корни. Альтернативная гипотеза HA: панели являются стационарными.
Проверка панельных данных на контегрированность процессов осуществляется, при наличии нестационарных рядов. В данной работе используется Westerlund ECM panel cointegration test. Основная идея теста состоит в том, чтобы проверить отсутствие коинтеграции, определив, существует ли коррекция ошибок для отдельных членов панели или для панели в целом. Рассчитываются статистики Gt ,Ga , которые позволяют принять или отвергнуть гипотезу о том, что существует коинтеграция по крайней мере с одним рядом; а также рассчитываются статистики Pt , Pa , которые принимают или отклоняют гипотезу о том, что вся модель является коинтегрированной. [Westerlund,2008]
Для оценивания выбранной эконометрической модели используются следующие критерии:
t-критерий Стьюдента;
Проверяет значимость факторов в эконометрической модели. Выдвигается гипотеза H0: βj=0 , где – βj истинные значения параметров регрессии.
Если , то нулевая гипотеза отклоняется и, следовательно, фактор значимый, иначе незначимый.
Критерий Фишера.
Проверяет значимость всей модели. Выдвигается гипотеза H0: все βj =0.
Оценка значимости всей модели регрессии проверяется при помощи сравнения рассчитанного и табличного значений статистик Фишера: – рассчитанное значение, где R2 – коэффициент детерминации, N – число наблюдений, n – число факторов регрессии.
Если , то нулевая гипотеза отклоняется и, следовательно, линейная регрессия значима, иначе незначима. [Суслов, 2005]
|