Понятие регрессионного анализа

Тип работы:
Реферат
Предмет:
Экономика


Узнать стоимость

Детальная информация о работе

Выдержка из работы

СОДЕРЖАНИЕ

Введение

Теоретическая часть

1. Понятие регрессионного анализа

2. Прогнозирование показателей внешней торговли по уравнению регрессии

Заключение

Список источников и литературы

ВВЕДЕНИЕ

В настоящее время ни одна сфера жизни общества не может обойтись без прогнозов как средства познания будущего. Особенно важное значение имеют прогнозы внешней торговли, обоснование основных направлений экономической политики, предвидение последствий принимаемых решений.

Внешнеторговое предвидение предполагает использование специальных вычислительных и логических приемов, позволяющих определить параметры функционирования отдельных элементов производительных сил в их взаимосвязи и взаимозависимости.

Систематизированное научно обоснованное прогнозирование внешней торговли на основе специализированных осуществляется с первой половины 50-х годов, хотя некоторые методики прогнозирования были известны и ранее.

Особую роль в современном мире играет прогнозирование как предвидение результатов развития хозяйственной структуры и перспективное планирование в качестве системы мер, необходимых для преодоления отклонения прогнозируемых итогов от установленных параметров.

Органической частью планирования является составление прогнозов, показывающих возможные направления будущего развития хозяйственной структуры.

Целью работы является изучение прогнозирования внешней торговли по уравнению регрессии.

Средством достижения указанной цели является решение следующих задач:

Рассмотреть регрессионный анализ;

Проанализировать прогнозирование внешней торговли по уравнению регрессии.

Объект исследования: внешнеторговая деятельность РФ.

Предмет исследования: развитие внешнеэкономической деятельности, а также совершенствование структуры экспорта и импорта товаров.

ТЕОРЕТИЧЕСКАЯ ЧАСТЬ

1. ПОНЯТИЕ РЕГРЕССИОННОГО АНАЛИЗА

Регрессионный анализ — метод моделирования измеряемых данных и исследования их свойств. Данные состоят из пар значений зависимой переменной (переменной отклика) и независимой переменной (объясняющей переменной). Регрессионная модель есть функция независимой переменной и параметров с добавленной случайной переменной.

Корреляционный анализ и регрессионный анализ являются смежными разделами математической статистики, и предназначаются для изучения по выборочным данным статистической зависимости ряда величин; некоторые из которых являются случайными. При статистической зависимости величины не связаны функционально, но как случайные величины заданы совместным распределением вероятностей. Социальная статистика: учеб. -метод. комплекс / Е. С. Нечаева, В. И. Нечаев; ТулГУ. -- Тула: Изд-во ТулГУ, 2010. -- С. 67

Исследование зависимости случайных величин приводит к моделям регрессии и регрессионному анализу на базе выборочных данных. Теория вероятностей и математическая статистика представляют лишь инструмент для изучения статистической зависимости, но не ставят своей целью установление причинной связи. Представления и гипотезы о причинной связи должны быть привнесены из некоторой другой теории, которая позволяет содержательно объяснить изучаемое явление.

Числовые данные обычно имеют между собой явные (известные) или неявные (скрытые) связи.

Явно связаны показатели, которые получены методами прямого счета, т. е. вычислены по заранее известным формулам. Например, проценты выполнения плана, уровни, удельные веса, отклонения в сумме, отклонения в процентах, темпы роста, темпы прироста, индексы и т. д.

Связи же второго типа (неявные) заранее неизвестны. Однако необходимо уметь объяснять и предсказывать (прогнозировать) сложные явления для того, чтобы управлять ими. Поэтому специалисты с помощью наблюдений стремятся выявить скрытые зависимости и выразить их в виде формул, т. е. математически смоделировать явления или процессы. Одну из таких возможностей предоставляет регрессионный анализ.

Математические модели строятся и используются для трех обобщенных целей:

* для объяснения;

* для предсказания;

* для управления.

Пользуясь методами корреляционно-регрессионного анализа, аналитики измеряют тесноту связей показателей с помощью коэффициента корреляции. При этом обнаруживаются связи, различные по силе (сильные, слабые, умеренные и др.) и различные по направлению (прямые, обратные). Если связи окажутся существенными, то целесообразно будет найти их математическое выражение в виде регрессионной модели и оценить статистическую значимость модели. Курс социально-экономической статистики: учеб. Для студентов вузов, обучающихся по специальности Статистика / под ред. М. Г. Назарова. 6-е изд., исправл. и доп. М.: Омега-Л, 2007 г. — С. 561

Регрессионный анализ называют основным методом современной математической статистики для выявления неявных и завуалированных связей между данными наблюдений.

Постановка задачи регрессионного анализа формулируется следующим образом.

Имеется совокупность результатов наблюдений. В этой совокупности один столбец соответствует показателю, для которого необходимо установить функциональную зависимость с параметрами объекта и среды, представленными остальными столбцами. Требуется: установить количественную взаимосвязь между показателем и факторами. В таком случае задача регрессионного анализа понимается как задача выявления такой функциональной зависимости y = f (x2, x3, …, xn), которая наилучшим образом описывает имеющиеся экспериментальные данные. Статистика: учебник / [И. И. Елисеева и др.]. — Москва: Проспект, 2011. — С. 356

Допущения:

— количество наблюдений достаточно для проявления статистических закономерностей относительно факторов и их взаимосвязей;

— обрабатываемые данные содержат некоторые ошибки (помехи), обусловленные погрешностями измерений, воздействием неучтенных случайных факторов;

— матрица результатов наблюдений является единственной информацией об изучаемом объекте, имеющейся в распоряжении перед началом исследования.

Функция f (x2, x3, …, xn), описывающая зависимость показателя от параметров, называется уравнением (функцией) регрессии. Термин «регрессия» (regression (лат.) — отступление, возврат к чему-либо) связан со спецификой одной из конкретных задач, решенных на стадии становления метода.

Решение задачи регрессионного анализа целесообразно разбить на несколько этапов:

— предварительная обработка данных;

— выбор вида уравнений регрессии;

— вычисление коэффициентов уравнения регрессии;

— проверка адекватности построенной функции результатам наблюдений.

Предварительная обработка включает стандартизацию матрицы данных, расчет коэффициентов корреляции, проверку их значимости и исключение из рассмотрения незначимых параметров.

Выбор вида уравнения регрессии задача определения функциональной зависимости, наилучшим образом описывающей данные, связана с преодолением ряда принципиальных трудностей.

В общем случае для стандартизованных данных функциональную зависимость показателя от параметров можно представить в виде:

y = f (x1, x2, …, xn) + e

где f — заранее не известная функция, подлежащая определению;

e — ошибка аппроксимации данных.

Указанное уравнение принято называть выборочным уравнением регрессии. Это уравнение характеризует зависимость между вариацией показателя и вариациями факторов. А мера корреляции измеряет долю вариации показателя, которая связана с вариацией факторов. Иначе говоря, корреляцию показателя и факторов нельзя трактовать как связь их уровней, а регрессионный анализ не объясняет роли факторов в создании показателя.

Еще одна особенность касается оценки степени влияния каждого фактора на показатель. Регрессионное уравнение не обеспечивает оценку раздельного влияния каждого фактора на показатель, такая оценка возможна лишь в случае, когда все другие факторы не связаны с изучаемым. Если изучаемый фактор связан с другими, влияющими на показатель, то будет получена смешанная характеристика влияния фактора. Эта характеристика содержит как непосредственное влияние фактора, так и опосредованное влияние, оказанное через связь с другими факторами и их влиянием на показатель.

В регрессионное уравнение не рекомендуется включать факторы, слабо связанные с показателем, но тесно связанные с другими факторами. Не включают в уравнение и факторы, функционально связанные друг с другом (для них коэффициент корреляции равен 1). Включение таких факторов приводит к вырождению системы уравнений для оценок коэффициентов регрессии и к неопределенности решения.

Функция f должна подбираться так, чтобы ошибка e в некотором смысле была минимальна. В целях выбора функциональной связи заранее выдвигают гипотезу о том, к какому классу может принадлежать функция f, а затем подбирают «лучшую» функцию в этом классе. Выбранный класс функций должен обладать некоторой «гладкостью», т. е. «небольшие» изменения значений аргументов должны вызывать «небольшие» изменения значений функции. Социальная статистика: учеб. -метод. комплекс / Е. С. Нечаева, В. И. Нечаев; ТулГУ. -- Тула: Изд-во ТулГУ, 2010. -- С. 41

Частным случаем, широко применяемым на практике, является полином первой степени или уравнение линейной регрессии.

Для выбора вида функциональной зависимости можно рекомендовать следующий подход:

— в пространстве параметров графически отображают точки со значениями показателя. При большом количестве параметров можно строить точки применительно к каждому из них, получая двумерные распределения значений;

— по расположению точек и на основе анализа сущности взаимосвязи показателя и параметров объекта делают заключение о примерном виде регрессии или ее возможных вариантах;

— после расчета параметров оценивают качество аппроксимации, т. е. оценивают степень близости расчетных и фактических значений;

— если расчетные и фактические значения близки во всей области задания, то задачу регрессионного анализа можно считать решенной. В противном случае можно попытаться выбрать другой вид полинома или другую аналитическую функцию, например периодическую.

Вычисление коэффициентов уравнения регрессии

Систему уравнений на основе имеющихся данных однозначно решить невозможно, так как количество неизвестных всегда больше количества уравнений. Для преодоления этой проблемы нужны дополнительные допущения. Здравый смысл подсказывает: желательно выбрать коэффициенты полинома так, чтобы обеспечить минимум ошибки аппроксимации данных. Могут применяться различные меры для оценки ошибок аппроксимации. В качестве такой меры нашла широкое применение среднеквадратическая ошибка. На ее основе разработан специальный метод оценки коэффициентов уравнений регрессии — метод наименьших квадратов (МНК). Этот метод позволяет получить оценки максимального правдоподобия неизвестных коэффициентов уравнения регрессии при нормальном распределения вариант, но его можно применять и при любом другом распределении факторов.

В основе МНК лежат следующие положения:

— значения величин ошибок и факторов независимы, а значит, и некоррелированы, т. е. предполагается, что механизмы порождения помехи не связаны с механизмом формирования значений факторов;

— математическое ожидание ошибки e должно быть равно нулю (постоянная составляющая входит в коэффициент a0), иначе говоря, ошибка является центрированной величиной;

— выборочная оценка дисперсии ошибки должна быть минимальна.

Если же линейная модель неточна или параметры измеряются неточно, то и в этом случае МНК позволяет найти такие значения коэффициентов, при которых линейная модель наилучшим образом описывает реальный объект в смысле выбранного критерия среднеквадратического отклонения.

Качество полученного уравнения регрессии оценивают по степени близости между результатами наблюдений за показателем и предсказанными по уравнению регрессии значениями в заданных точках пространства параметров. Если результаты близки, то задачу регрессионного анализа можно считать решенной. В противном случае следует изменить уравнение регрессии и повторить расчеты по оценке параметров.

При наличии нескольких показателей задача регрессионного анализа решается независимо для каждого из них.

Анализируя сущность уравнения регрессии, следует отметить следующие положения. Рассмотренный подход не обеспечивает раздельной (независимой) оценки коэффициентов — изменение значения одного коэффициента влечет изменение значений других. Полученные коэффициенты не следует рассматривать как вклад соответствующего параметра в значение показателя. Уравнение регрессии является всего лишь хорошим аналитическим описанием имеющихся данных, а не законом, описывающим взаимосвязи параметров и показателя. Это уравнение применяют для расчета значений показателя в заданном диапазоне изменения параметров. Оно ограниченно пригодно для расчета вне этого диапазона, т. е. его можно применять для решения задач интерполяции и в ограниченной степени для экстраполяции.

Главной причиной неточности прогноза является не столько неопределенность экстраполяции линии регрессии, сколько значительная вариация показателя за счет неучтенных в модели факторов. Ограничением возможности прогнозирования служит условие стабильности неучтенных в модели параметров и характера влияния учтенных факторов модели. Если резко меняется внешняя среда, то составленное уравнение регрессии потеряет свой смысл. Экономическая статистика: учебник / [А. Р. Алексеев и др.]. — Москва: Инфра-М, 2011. — С. 256

Прогноз, полученный подстановкой в уравнение регрессии ожидаемого значения параметра, является точечным. Вероятность реализации такого прогноза ничтожна мала. Целесообразно определить доверительный интервал прогноза. Для индивидуальных значений показателя интервал должен учитывать ошибки в положении линии регрессии и отклонения индивидуальных значений от этой линии.

Для проведения регрессионного анализа необходимо следующее:

* Выбор одного блока, из которого берется координатный интервал, чьи данные (переменная значения) дают зависимую переменную регрессии. Например, в качестве переменной Y из блока заболеваемости берется обращаемость в координатном интервале «пневмония» координаты «диагноз».

* Выбор одного или нескольких блоков, из которых аналогично берутся факторы в качестве независимых переменных регрессии. Например, данные в координатном интервале «концентрация SO2» берутся в качестве X1, а в координатном интервале «скорость ветра» — в качестве X2. При этом необходимо, чтобы блок, дающий зависимую переменную, и все блоки, дающие независимые переменные, имели какие-либо общие координаты (обычно пространство и время), которые служат переменными развертки и дают точки, по которым проводится регрессионная кривая или поверхность.

* Выбор типа и «степени» функций от независимых переменных, которые включаются в регрессию. Например, при выборе полиномиальных функций с максимальной степенью 2 и при двух независимых переменных X1 и X2 регрессия ищется в виде

Y = a + bX1 + cX2 + dX12 + eX22 + fX1X2

(a — f -регрессионные коэффициенты).

* Задание координатных интервалов переменных сравнения, внутри которых регрессионная функция не должна значимо изменяться. Так, в вышеописанном случае можно потребовать, чтобы регрессионная функция вообще не зависела от половозрастной группы, или была одной для всех мужчин и другой — для всех женщин, или своей в каждой половозрастной группе. Эта информация используется для регуляризации регрессии гребневым или энтропийным методом.

* Регрессия проводится последовательно с увеличением числа независимых переменных и степени регрессионной функции. При этом общесистемным оптимизатором находится минимум среднеквадратичного отклонения точек данных от регрессионной кривой. Статистика: учеб. пособие / Э. В. Хлынин, Н. И. Коровкина; ТулГУ. -- Тула: Изд-во ТулГУ, 2010. -- С. 102

Для регрессионной кривой вычисляются характеристики неопределенности — показатели тесноты регрессии: кривые доверительного интервала и коэффициент детерминации. Последний может вычисляться сразу для всех комбинаций «зависимая переменная — независимая переменная» и представляться в виде цветокодированной таблицы. Такое представление близко к цветокодированию коэффициента корреляции. Разница между ними связана с возможностью выбора типа и степени регрессионной функции при регрессионном анализе.

Аналогично построению таблицы условных корреляций, в регрессионном анализе может строиться таблица «условных» коэффициентов детерминации. При этом в регрессию для каждой пары факторов дополнительно включается еще несколько факторов, выбранных пользователем. Например, строятся регрессии данных обращаемости по каждому диагнозу на концентрацию каждого загрязнителя, и при этом в регрессию дополнительно включается в качестве независимой переменной скорость ветра. Сравнение таких таблиц с аналогичными «безусловными» позволяет определить, в какие регрессии нужно дополнительно включить факторы, выбранные пользователем в качестве условных.

Как и для коэффициентов корреляции, для коэффициентов детерминации можно строить дерево вкладов координатных интервалов переменных развертки. Оно позволяет скорректировать выборку для достижения более тесной регрессии. Кроме того, выбрав координатный интервал в дереве, можно построить отдельные регрессионные функции во всех его подынтервалах и по результатам расслоить выборку на части с более устойчивой регрессией. В частности, можно построить «иерархическую регрессию», при которой коэффициенты регрессии внутри каждого координатного интервала рассчитываются как поправки к коэффициентам регрессии координатного интервала, следующего вверх по иерархии. При использовании такой регрессии в качестве эмпирической модели, разные коэффициенты выступают как варианты модели. Годин, А. М. Статистика: учебник / А. М. Годин. — Москва: Дашков 2012. — С. 100

Как и корреляция, регрессия рассчитывается для фиксированных координатных интервалов каждой переменной сравнения. Как указано выше, проверяется устойчивость регрессии к смене координатного интервала на том же уровне иерархии. Строится также дерево вкладов подынтервалов для выбранных пользователем переменной сравнения и координатного интервала. Возможно также построение иерархической регрессии по дереву выбранной переменной сравнения. При этом, в отличие от иерархической регрессии по дереву переменной значения, разные регрессии в дереве выступают не как варианты, а применяются соответственно значениям переменных сравнения, подаваемым на вход модели. Возможно также построение отдельной регрессии для каждого диапазона значений независимой или зависимой переменной. В первом случае получаются сплайны с числом узлов, задаваемым пользователем. Во втором случае различные регрессии образуют пакет вариантов, так что выбор подходящего диапазона при использовании такой регрессии в качестве эмпирической модели осуществляется в рамках общей идеологии выбора оптимального варианта. Статистика / под ред. И. И. Елисеевой. М.: изд-во ЮРАЙТ. 2010. — С. 407

Для визуализации многофакторной регрессии пользователь выбирает тот фактор, который представляется как абсцисса регрессионной кривой, и фиксирует значения прочих независимых факторов. На коэффициенты регрессии это не влияет.

2. ПРОГНОЗИРОВАНИЕ ПОКАЗАТЕЛЕЙ ВНЕШНЕЙ ТОРГОВЛИ ПО УРАВНЕНИЮ РЕГРЕССИИ

прогнозирование внешний торговля регрессия

Непременным элементом системы долгосрочных, среднесрочных и краткосрочных прогнозов социально-экономического развития, являются прогнозы внешней торговли. Динамика объема и структуры экспорта, импорта, внешнеторговых цен оказывают непосредственное влияние на отраслевые и территориальные пропорции, объемы ВВП, доходы федерального и регионального бюджетов, поступление таможенных платежей, рентабельность предприятий, уровень розничных цен, реальные доходы населения. Годин, А. М. Статистика: учебник / А. М. Годин. — Москва: Дашков 2012. — С. 88

По данным таможенной статистики в январе-апреле 2014 года внешнеторговый оборот России составил 262,7 млрд. долларов США и по сравнению с январем-апрелем 2013 года снизился на 2,8%.

Импорт составил 92,5 млрд. долларов США и уменьшился и по сравнению с январем-апрелем 2013 года, но уже значительнее — на 6,8%. (см рис. 1)

Рис. 1 Статистика внешней торговли России

Как же составить прогноз внешней торговли?

Чтобы получить прогнозное значение показателя внешней торговли, необходимо в построенное уравнение связи подставить ожидаемое, предполагаемое, ранее спрогнозированное или нормативное значение факторного признака. В результате будет получен точечный прогноз, который будет содержать ошибки. Поэтому прогноз показателя внешней торговли следует давать в виде доверительного интервала с заданной вероятностью. Для получения доверительного интервала прогноза рассчитываются ошибки прогноза. Средняя ошибка прогноза определяется по формуле:

.

Где — прогнозное значение факторного признака.

Затем рассчитывается предельная ошибка прогноза по формуле:

.

Значение t-критерия Стьюдента определяется по таблице с учетом числа степеней свободы системы (n-m) и с заданной вероятностью (см. рис. 2). При этом n- число единиц совокупности, а m- число параметров уравнения регрессии. При оценке прогноза, как правило, задаются вероятностью 95% или 90%. Зная предельную ошибку можно определить доверительный интервал прогноза:

.

Рис. 2. Значения t-критерия Стьюдента

Доверительный интервал показывает, что фактическая реализация прогноза будет заключена в данном интервале с заданной вероятностью.

ЗАКЛЮЧЕНИЕ

На основании проведенного исследования можно сделать следующие выводы и предложения:

1. Под прогнозом понимается система научно обоснованных представлений о возможных состояниях объекта в будущем, об альтернативных путях его развития. Прогноз выражает предвидение на уровне конкретно-прикладной теории, в то же время прогноз неоднозначен и носит вероятностный и многовариантный характер. Процесс разработки прогноза называется прогнозированием.

2. Прогнозирование по своему составу шире планирования, так как включает не только показатели деятельности хозяйствующего субъекта, но и в большей степени учитывает изменяющиеся параметры внешней среды.

3. Важнейшим составным элементом методологии планирования и прогнозирования являются методологические принципы, под которыми понимаются исходные положения, основополагающие правила формирования и обоснования планов и прогнозов. Они обеспечивают целенаправленность, целостность, определенную структуру и логику разрабатываемых планов и прогнозов.

4. Методы планирования и прогнозирования -- это способы, приемы, с помощью которых обеспечивается разработка и обоснование планов и прогнозов.

СПИСОК ИСТОЧНИКОВ И ЛИТЕРАТУРЫ

Литература

1. Годин, А. М. Статистика: учебник / А. М. Годин. — Москва: Дашков 2012. — 451 с.

2. Курс социально-экономической статистики: учеб. Для студентов вузов, обучающихся по специальности Статистика / под ред. М. Г. Назарова. 6-е изд., исправл. и доп. М.: Омега-Л, 2007 г. 984 с.

3. Социальная статистика: учеб. -метод. комплекс / Е. С. Нечаева, В. И. Нечаев; ТулГУ. -- Тула: Изд-во ТулГУ, 2010. -- 306 с.

4. Статистика: учеб. пособие / Э. В. Хлынин, Н. И. Коровкина; ТулГУ. -- Тула: Изд-во ТулГУ, 2010. -- 196 с.

5. Статистика / под ред. И. И. Елисеевой. М.: изд-во ЮРАЙТ. 2010. 565 с. (Университеты России)

6. Статистика: учебник / [И. И. Елисеева и др.]. — Москва: Проспект, 2011. — 443 с.

7. Экономическая статистика: учебник / [А. Р. Алексеев и др.]. — Москва: Инфра-М, 2011. — 666 с.

8. Таможенное право: учебник для вузов / под общ. ред. Андриашина Х. А. — ЗАО «Юстицинформ», 2010 г.

9. Чалиев А. А. Овчаров О.А. Таможенная статистика. Учебно-методическое пособие. Нижний Новгород: Издательство Нижегородского госуниверситета, 2008. 148 с.

Интернет-ресурсы

10. Федеральная таможенная служба РФ: http: //www. customs. ru

ПоказатьСвернуть
Заполнить форму текущей работой