Обработка экспериментальных данных по методу наименьших квадратов

Тип работы:
Курсовая
Предмет:
Программирование


Узнать стоимость новой

Детальная информация о работе

Выдержка из работы

Оглавление

Введение

Теоретические сведения

Ход выполнения работы

Заключение

Список литературы

Введение

Курс математических методов обработки данных необходим для приобретения знаний и навыков в обработки экспериментальных данных, проведению эксперимента.

Исследовательская работа построена на проведение различных экспериментов и очень важно владеть методами обработки результатов и правильно их оценивать.

Целью курсовой работы является закрепление знаний, полученных на II курсе при решении задач, связанных с будущей профессиональной деятельностью студентов в области автоматизации. Курсовая работа предполагает решение студентом задачи по полученным результатам в лаборатории установить зависимость этих данных и оценить ее.

При проведении опыта целью которого, является определение зависимости одной физической величины от другой неизбежно возникают ошибки измерения, поэтому возникает задача по имеющимся экспериментальным точкам наилучшим способом воспроизвести искомую зависимость. Для решения подобных задач часто применяют метод наименьших квадратов, именно с помощью этого метода я буду решать свою задачу.

Курсовую работу по обработке данных буду проводить с помощью программного обеспечения Mathcad.

Теоретические сведения

Метод наименьших квадратов.

До начала XIX века учёные не имели определённых правил для решения системы уравнений, в которой число неизвестных меньше, чем число уравнений; до этого времени употреблялись частные приёмы, зависевшие от вида уравнений и от остроумия вычислителей, и потому разные вычислители, исходя из тех же данных наблюдений, приходили к различным выводам. Гауссу от 1795 принадлежит первое применение метода, а Лежандр в 1805 году независимо открыл и опубликовал его под современным названием (Methode des moindres quarres).

Лаплас связал метод с теорией вероятностей, а американский математик Эдрейн в 1808 году рассмотрел его теоретико-вероятностные приложения. Метод распространён и усовершенствован дальнейшими изысканиями Энке, Бесселя, Ганзена и других.

Метод наименьших квадратов -- один из базовых методов регрессионного анализа для оценки неизвестных параметров регрессионных моделей по выборочным данным. Метод основан на минимизации суммы квадратов остатков регрессии.

Необходимо отметить, что собственно методом наименьших квадратов можно назвать метод решения задачи в любой области, если решение заключается или удовлетворяет некоторому критерию минимизации суммы квадратов некоторых функций от искомых переменных. Поэтому метод наименьших квадратов может применяться также для приближённого представления (аппроксимации) заданной функции другими (более простыми) функциями, при нахождении совокупности величин, удовлетворяющих уравнениям или ограничениям, количество которых превышает количество этих величин и т. д.

Итак, суть метода наименьших квадратов сводится к тому, что сумма квадратов отклонений экспериментальных данных от сглаживающей кривой сводится к минимуму

где yi и xi экспериментальных значений в i-опыте

N — число экспериментов,

?(xi) — искомая зависимость y от x.

При выборе вида зависимости y=f (x) возможны следующие случаи:

1. Общий вид зависимости y от f (x) известен заранее на основании теоретических предпосылок. Задача состоит в нахождении численных значений параметров этой зависимости.

2. Зависимость y=f (x) априори не известна и нет никаких предпосылок о ее математической форме. В этом случае для экспериментального описания исследуемой закономерности в области ее существования ограниченными пределами изменения аргумента необходимо применить алгебраический полином определенной степени (ряд Тейлора). Для определения параметров зависимости y=f (x) запишем ее зависимость не только от аргумента х, но и от параметров аj где j от нуля до s

Тогда условие примет вид:

(1)

Ряд Тейлора:

y=a0x0+a1x1+a2x2+…+asxs

Нахождение значений параметров, удовлетворяющих этому условию сводится к нахождению экстремума функции aj. Для этого необходимо взять производные по параметрам от выражения (1) и приравнять к нулю. Таким образом мы получим систему s + 1 уравнений, решение которой дает возможность найти параметры аj, то есть при аппроксимации искомой зависимости полинома s-того порядка система уравнений даст решение численному значению параметра aj

Пусть изученная зависимость y от x, в результате опытов получено N пар чисел с координатами xi и yi, при этом зависимость y от х представлена в виде y=a0 + a1x в соответствии с методом наименьших квадратов, параметры этой зависимости должны удовлетворять условию:

(2)

Взяв частные производные от выражения (2) по параметрам а0 и а1 и приняв их за ноль, получим систему нормальных уравнений

a0 x0+a1 x1= x0y

a0 x1+a1 x2= x1y

решая полученную систему уравнений находим а0 и а1, тем самым полностью определяем функцию, которая наилучшим образом аппроксимирует искомую функцию y (x).

Аппроксимация -- научный метод, состоящий в замене одних объектов другими, в том или ином смысле близкими к исходным, но более простыми.

Аппроксимация

Аппроксимация — это описание экспериментальных точек какой либо функцией.

Аппроксимация позволяет исследовать числовые характеристики и качественные свойства объекта, сводя задачу к изучению более простых или более удобных объектов (например, таких, характеристики которых легко вычисляются или свойства которых уже известны).

В теории чисел изучаются диофантовы приближения, в частности, приближения иррациональных чисел рациональными.

В геометрии рассматриваются аппроксимации кривых ломаными. Некоторые разделы математики в сущности целиком посвящены аппроксимации, например, теория приближения функций, численные методы анализа.

Корреляция. Корреляционный анализ.

Любые две случайные величины, входящие в систему, являются независимыми или зависимыми. Поскольку степень взаимной зависимости может быть различной, целесообразно вести количественную меру взаимной зависимости. В качестве такой меры могут служить корреляционный момент и коэффициент корреляции, к определению которых мы перейдем.

Корреляционный анализ позволяет оценить тесноту связи одной физической величины от другой. Описывается это как

где mx, my — математическое ожидание x и y соответственно.

Корреляция от латинского это соотношение, взаимосвязь

В свою очередь корреляционная зависимость это статистическая взаимосвязь двух или нескольких случайных величин (либо величин, которые можно с некоторой допустимой степенью точности считать таковыми). При этом изменения значений одной или нескольких из этих величин сопутствуют систематическому изменению значений другой или других величин. Математической мерой корреляции двух случайных величин служит корреляционное отношение, либо коэффициент корреляции. В случае, если изменение одной случайной величины не ведёт к закономерному изменению другой случайной величины, но приводит к изменению другой статистической характеристики данной случайной величины, то подобная связь не считается корреляционной, хотя и является статистической.

Впервые в научный оборот термин «корреляция» ввёл французский палеонтолог Жорж Кювье в XVIII веке. Он разработал «закон корреляции» частей и органов живых существ, с помощью которого можно восстановить облик ископаемого животного, имея в распоряжении лишь часть его останков. В статистике слово «корреляция» первым стал использовать английский биолог и статистик Фрэнсис Гальтон в конце XIX века.

Корреляционные моменты, коэффициент корреляции — это числовые характеристики, тесно связанные во введенным выше понятием случайной величины, а точнее с системой случайных величин. Поэтому для введения и определения их значения и роли необходимо пояснить понятие системы случайных величин и некоторые свойства присущие им.

И так, коэффициент корреляции это

Корреляционный момент это

Корреляционный момент так же принимает значения от -1 до 1, значения ±1 свидетельствует о наличии линейной зависимости между величинами x и y при коэффициенте корреляции равном нулю.

Таким образом корреляционный момент может служить характеристикой тесноты линейной связи между величинами x и y. Чем ближе коэффициент корреляции по абсолютному значению к единице, тем эта связь сильнее. Абсолютное значение этой величины это модуль получено значения.

Интерпретация величины корреляционного момента осуществляется в соответствии с таблицей

значение

интерпретация

0−0. 2

очень слабая

0. 2−0. 5

слабая

0. 5−0. 7

средняя

0. 7−0. 9

высокая

0. 9−1

очень высокая

В следствии необходимости не линейной связи между случайными величинами x и y вводится новая характеристика: отношение корреляции.

Формула корреляционного отношения

?xy=

в которой это межгрупповое среднее квадратичное отклонение случайной величины y. Если корреляционное отношение равно нулю, то x и y зависимостью не связаны, в том случае, когда корреляционное отношение равно 1 величины x и y связаны функциональной зависимостью.

Коэффициент детерминации.

Коэффициент детерминации это доля дисперсии зависимой переменной, объясняемая рассматриваемой моделью зависимости, то есть объясняющими переменными. Более точно -- это единица минус доля необъяснённой дисперсии (дисперсии случайной ошибки модели, или условной по факторам дисперсии зависимой переменной) в дисперсии зависимой переменной. Его рассматривают как универсальную меру связи одной случайной величины от множества других. В частном случае линейной зависимости является квадратом так называемого множественного коэффициента корреляции между зависимой переменной и объясняющими переменными. В частности, для модели парной линейной регрессии коэффициент детерминации равен квадрату обычного коэффициента корреляции между y и x.

Коэффициент детерминации, как и коэффициент корреляции, принимает значения от -1 до +1. Чем ближе его значение коэффициента по модулю к 1, тем теснее связь результативного признака Y с исследуемыми факторами X.

R2=

метод наименьший квадрат mathcad

Ход выполнения работы

Решая, какую выбрать зависимость, что бы она как можно точно описала мою функцию я взяла полином второй степени

Свои исходные данные я задаю в виде матрицы x и y:

Далее с помощью функции минимайз рассчитываю значения аппроксимирующей функции, в моем случае у7(х).

Вставляем график, на котором наглядно видно как найденная мною зависимость описывает исходную.

Далее рассчитываю

1. факторную сумму квадратов отклонений средних значений у в каждом опыте от общего среднего значения у. Эта сумма характеризует рассеяние групповых средних значений во всех опытах;

2. общую сумму квадратов отклонений у от общего среднего значения, которая характеризует рассеяние всех опытных значений величины у вокруг общего среднего значения;

3. остаточную сумму квадратов отклонений величины у от ее значения в каждом опыте, которая характеризует рассеяние величины у от ее среднего значения внутри опыта.

Суммы я рассчитывала для того чтобы далее рассчитать численное значение коэффициента детерминации

Коэффициент детерминации получила равный 0. 658 что свидетельствует о слабой связи.

Далее я проделываю программу по той же схеме.

Так как при нескольких одинаковых значения X у меня разные значения Y, я решила взять для X среднее между ними значение и повторила свой эксперимент.

Получила коэффициент детерминации равный 0. 78, это выше чем в первом опыте, следовательно связь сильнее, чем в первом опыте.

Чтобы еще увеличить коэффициент детерминации для первого опыта, я решила взять тригонометрическую функцию

Величина коэффициента детерминации служит важным критерием оценки качества линейных и нелинейных моделей. В моей работе коэффициент детерминации равен 0. 97, это значит что модель регрессии хорошо аппроксимирует исходные данные и такой регрессионной моделью можно воспользоваться для прогноза значений результативного показателя.

Заключение

В курсовой работе мне была поставлена задача по данным эксперимента проведенным в лаборатории установить зависимость и оценить ее адекватность.

Эту задачу я решала с помощью программного обеспечения Mathcad.

Мною был построен график по полученным значениям на котором наглядно видно, что коэффициент детерминации получился близким к единице, при дальнейших расчетах я установила, что он равен 0. 97, это свидетельствует о том, что модель адекватна, следовательно, установленная мною зависимость верна.

ПоказатьСвернуть
Заполнить форму текущей работой