Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов

Тип работы:
Курсовая
Предмет:
Физико-математические науки


Узнать стоимость

Детальная информация о работе

Выдержка из работы

Федеральное государственное образовательное бюджетное учреждение высшего профессионального образования

«Финансовый университет при Правительстве Российской Федерации»

Кафедра «Теория вероятности и математическая статистика»

Курсовая работа на тему:

«Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов»

Вид исследуемых данных:

Котировки акций компаний, входящих в индекс

AMEX Major Market

Выполнила:

студентка группы ПМ2−1

Радостева М.В.

Научный руководитель:

проф. Браилов А. В.

Москва 2014 г.

Содержание

  • Введение
  • 1. Предварительный анализ данных
    • 1. 1 Количество торговых дней
    • 1. 2 Скачки цен
  • 2. Теоретическая справка по проверке гипотез
    • 2. 1 Статистическая гипотеза и ошибки первого и второго рода
    • 2. 2 Схема проверки статистической гипотезы
    • 2. 3 Р-значение критерия
    • 2. 4 Критерий -Пирсона
    • 2. 5 Критерий Колмогорова
  • 3. Проверка гипотез для модельных данных
  • 4. Выбор альтернативной гипотезы и оценка мощности критерия
    • 4. 1 Альтернативные гипотезы
    • 4. 2 Мощность критерия
  • 5. Проверка гипотез для реальных данных
  • Заключение
  • Литература
  • Приложения

Введение

Целью исследования является проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (для каждого года и каждого тиккера будем искать эмпирическое распределение логарифмических доходностей, а затем, делая выборку меньше квантиля 1/3 уровня, от 1/3 до 2/3 и больше 2/3, получим соответственно малый, средний и большой объем торгов для каждого года и каждого тиккера). Альтернативные гипотезы будут такие: зависимость прямая и зависимость обратная.

В качестве объекта исследования выступают котировки акций компаний, входящих в индекс AMEX Major Market в период с 1 января 2010 года по 31 декабря 2013 года. Используются данные 20 компаний входящие в индекс, тиккеры этих компаний следующие:

AXP, BA, CVX, DD, DIS, DOW, GE, HPQ, IBM, JNJ, JPM, KO, MCD, MMM, MRK, MSFT, PG, WFC, WMT, XOM.

Проверка гипотезы будет осуществляться 20*4=80 раз.

Главный критерий: — критерий Пирсона.

Планируемая новизна состоит в том, что я использую 2 альтернативные гипотезы вместо одной.

1. Предварительный анализ данных

В качестве исследуемых данных я взяла индекс AMEX Major Market и входящие в него 20 компаний. Источники списка компаний, входящих в индекс и соответствующие им котировки акций взяла с сайта http: //finance. yahoo. com. Таблица тикеров и соответствующих им компаниям приведена ниже. логарифмический гипотеза критерий колмогоров

Таблица 1. Компании и тикеры

Компания

Тикер

American Express Company

AXP

The Boeing Company

BA

Chevron Corporation

CVX

E. I. du Pont de Nemours and Company

DD

The Walt Disney Company

DIS

The Dow Chemical Company

DOW

General Electric Company

GE

Hewlett-Packard Company

HPQ

International Business Machines Corporation

IBM

Johnson & Johnson

JNJ

JPMorgan Chase & Co.

JPM

The Coca-Cola Company

KO

McDonald’s Corp.

MCD

3M Company

MMM

Merck & Co. Inc.

MRK

Microsoft Corporation

MSFT

The Procter & Gamble Company

PG

Wells Fargo & Company

WFC

Wal-Mart Stores Inc.

WMT

Exxon Mobil Corporation

XOM

1.1 Количество торговых дней

Для получения более точных выводов просмотрим количество торговых дней для каждого тикера, используя программу Число торговых дней. mtc и выберем только те года и тикеры, количество рабочих дней которых превышает 240 дней.

Таблица 2. Количество торговых дней

год/тикер

2010

2011

2012

2013

AXP

252

252

250

252

BA

252

252

250

252

CVX

252

252

250

252

DD

252

252

250

252

DIS

252

252

250

252

DOW

252

252

250

252

GE

252

252

250

252

HPQ

252

252

250

252

IBM

252

252

250

252

JNJ

252

252

250

252

JPM

252

252

250

252

KO

252

252

250

252

MCD

252

252

250

252

MMM

252

252

250

252

MRK

252

252

250

252

MSFT

252

252

250

252

PG

252

252

250

252

WFC

252

252

250

252

WMT

252

252

250

252

XOM

252

252

250

252

Как видно из данной таблицы количество торговых дней для каждого года и тикера больше 240.

1. 2 Скачки цен

Оценим максимальные скачки цен для каждого тикера и каждого года, чтобы исключить резкие скачки вверх или вниз. Для этого необходимо у каждого года и тикера найти логарифмическую доходность за каждый день, которая покажет найти максимум и минимум и занести в таблицу. По итоговой таблице следует исключить те компании или года, у которых максимальный скачок цен превышает 50%. Для вычисления относительных изменений цены буду использовать поле CLOSE, которое показывает цену по закрытию торгов на текущий день и выражается в долларах. Для составления таблицы используем программу Скачки цен. mtc.

Таблица 3. Скачки цен вверх

год/тикер

2010

2011

2012

2013

AXP

0,6 133

0,71 097

0,35 023

0,51 232

BA

0,73 124

0,61 829

0,52 862

0,53 396

CVX

0,47 747

0,55 755

0,34 304

0,2 525

DD

0,55 479

0,60 145

0,28 906

0,52 777

DIS

0,56 271

0,59 469

0,39 443

0,3 176

DOW

0,76 078

0,84 595

0,56 144

0,55 953

GE

0,6 872

0,7 108

0,35 088

0,46 128

HPQ

0,50 717

0,67 201

0,72 191

0,170 984

IBM

0,4 563

0,56 652

0,44 316

0,44 064

JNJ

0,25 897

0,53 821

0,21 718

0,22 846

JPM

0,58 684

0,84 384

0,70 301

0,44 724

KO

0,26 011

0,39 243

0,2 376

0,56 872

MCD

0,37 789

0,46 888

0,26 807

0,16 686

MMM

0,40 421

0,56 998

0,27 994

0,33 564

MRK

0,50 044

0,46 629

0,41 252

0,46 892

MSFT

0,5 283

0,44 935

0,56 543

0,72 862

PG

0,34 986

0,33 157

0,37 459

0,40 407

WFC

0,6 976

0,8 068

0,57 759

0,3 327

WMT

0,0282

0,38 839

0,42 068

0,24 521

XOM

0,37 869

0,52 183

0,33 247

0,28 837

Таблица 4. Скачки цен вниз

год/тикер

2010

2011

2012

2013

AXP

-0,8 468

-0,8 833

-0,4 299

-0,3 633

BA

-0,0633

-0,7 908

-0,3 621

-0,4 688

CVX

-0,3 916

-0,0754

-0,4 184

-0,0281

DD

-0,3 969

-0,6 791

-0,9 064

-0,2 227

DIS

-0,4 193

-0,9 107

-0,5 955

-0,3 653

DOW

-0,9 989

-0,10 424

-0,4 001

-0,6 963

GE

-0,5 794

-0,6 541

-0,0342

-0,4 058

HPQ

-0,9 709

-0,20 027

-0,1296

-0,12 451

IBM

-0,3 927

-0,0473

-0,4 915

-0,8 279

JNJ

-0,2 945

-0,3 215

-0,1 495

-0,0264

JPM

-0,0659

-0,9 415

-0,9 278

-0,3 506

KO

-0,3 698

-0,4 079

-0,50 121

-0,3 168

MCD

-0,2 698

-0,0404

-0,4 458

-0,2 683

MMM

-0,5 865

-0,6 255

-0,4 107

-0,4 367

MRK

-0,4 184

-0,6 622

-0,3 436

-0,3 283

MSFT

-0,4 114

-0,5 395

-0,4 004

-0,114

PG

-0,3 416

-0,2 936

-0,3 634

-0,6 567

WFC

-0,5 645

-0,9 044

-0,5 897

-0,0302

WMT

-0,3 281

-0,4 742

-0,0466

-0,2 605

XOM

-0,3 446

-0,6 188

-0,3 744

-0,2 809

Заметим, что компания с тикером KO скачок вниз превышает 50%, значит ее нужно исключить, потому что такие данные не вызывают доверия.

Построю графики цен для акций с максимальным однодневным снижением и повышением цены при помощи программы Графики со скачками. mtc. В программе используется поле CLOSE

Рисунок 1. График с максимальным однодневным повышением цены (HPQ)

Рисунок 2. График с максимальным однодневным снижением цены (KO)

2. Теоретическая справка по проверке гипотез

2.1 Статистическая гипотеза и ошибки первого и второго рода

Для начала следует отметить, что мы подразумеваем под статистической гипотезой.

Статистическая гипотеза — это всякое высказывание о виде неизвестного распределения или о параметрах известных распределений. [2, c. 253]

Статистические гипотезы бывают параметрическими, то есть гипотезы о параметрах распределения известного вида и непараметрические, которые предполагают о виде неизвестного распределения.

Одну из гипотез выдвигают в качестве основной и называют, а другую, являющуюся ее логическим отрицанием, то есть противоположную — в качестве конкурирующей (или альтернативной) гипотезы и обозначают. 5, c. 245]

Статистическая гипотеза бывает простой или сложной. Статистическая гипотеза называется простой, если параметр определен однозначно, соответственно сложной называется такая гипотеза, параметр которой не определен однозначно. Например, гипотеза: =5 — простая, а альтернативные ей, : : — сложные.

На основе выборки из генерального распределения необходимо принять либо гипотезу, либо. Правило, по которому принимается одна из гипотез и отвергается другая, называют статистическим критерием проверки гипотезы.

При проверке выдвинутой гипотезы могут возникать ошибки первого и второго рода.

Если отклоняется нулевая гипотеза, которая на самом деле верна, то это ошибка первого рода, а если принимается нулевая гипотеза, которая на самом деле не верна, то это ошибка второго рода.

Вероятность ошибки первого рода обозначается через и называется уровнем значимости. Вероятность ошибки второго рода обозначается.

Желательно, чтобы и первая, и вторая ошибки были малы, однако более важным является контроль уровня. Вероятность задается заранее, обычно малым числом, поскольку это — вероятность ошибочного заключения. 4, c. 289]

Например, уровень значимости =0,05 будет означать, что при проверке гипотезы в среднем в 5 из 100 случаев мы совершим ошибку первого рода.

Таблица 5. Таблица принятия решения при ошибках 1-го и 2-го рода

Статистическое решение

Реальная ситуация

верна

ложна

отвергается

не отвергается

Множество значений критерия, при которых нулевая гипотеза отклоняется, называется областью критических значений (обозначим). Для критериев проверки гипотез выбираются надлежащие «уровни значимости"(0,01; 0,05; и др.), которые считаются практически невозможными (с некоторым риском).

Критическая область данного критерия — это такая область, вероятность попадания в которую в случае, когда гипотеза верна, в точности равна уровню значимости. 4, c. 293]

Под мощностью критерия (обозначим) понимается вероятность не совершить ошибку второго рода.

Чем больше мощность критерия, тем вероятность ошибки второго рода меньше. Также стоит отметить, что одновременное уменьшение ошибок 1-го и 2-го рода возможно только при увеличении объема выборок. Поэтому обычно при заданном уровне значимости отыскивается критерий с наибольшей мощностью.

2.2 Схема проверки статистической гипотезы

1) Для основной гипотезы формируются альтернативные гипотезы.

2) Задается значение уровня значимости.

3) Рассматриваются теоретические выборки значений случайных величин, о которых сформулирована гипотеза, и формулируется случайная величина T. Значения и распределение T определяется по выборкам при предположении о верности гипотезы. Т — статистика критерия.

4) Задается область критических значений и область принятия гипотезы (область принятия решения D — это область, вероятность попадания в которую статистики T определяется как).

5) Вычисляются наблюдаемые значения статистики критерия, и проверяется попадание статистики критерия в одну из областей. Если статистика попала в область принятия гипотезы, то принимается, в противном случае — отвергается.

2. 3 Р-значение критерия

В своей работе я буду использовать такое понятие как Р-значение, поэтому стоит дать определение этому понятию.

Для фиксированной реализации случайной выборки Р-значением статистического критерия называется такое число для любого уровня значимости, при котором гипотеза принимается, и для любого уровня значимости, при котором гипотеза отвергается.

Пусть — наблюдаемое фиксированное значение статистики критерия, а — наблюдаемые значения статистики критерия для случайной выборки, тогда Р-значение удовлетворяет соотношению:

1) Если критическая область представлена в виде, где — непрерывно убывающая функция, то

2) Если критическая область представлена в виде, где — непрерывно возрастающая функция, то

P-значение с гораздо большей точностью, чем обычные способы проверки статистических гипотез, позволяет установить, принимается ли гипотеза или отвергается.

2. 4 Критерий -Пирсона

Для начала стоит отметить, что я применяю критерий Пирсона для проверки независимости логарифмических доходностей, поэтому теоретическая справка будет касаться непосредственно проверки независимости по данному критерию.

Пусть имеется случайная выборка из генеральной совокупности двумерной дискретной случайной величины, где случайная величина может принимать значения, а случайная величина — значения. Определим случайную величину, реализация которой равна количеству элементов выборки, совпадающих с элементом

Определим случайные величины

При этом — количество элементов выборки, в которых встретилось значение, а — количество элементов выборки, в которых встретилось значение, кроме того, имеются очевидные равенства

Результаты наблюдений удобно оформлять в виде таблицы, называемой таблицей сопряженности признаков.

Таблица 6. Сопряженность признаков

X

Y

Пусть далее

,.

Дискретные случайные величины и независимы тогда и только тогда, когда ,

Потому основная гипотеза о независимости дискретных случайных величин записывается следующим образом:

А соответствующая альтернативная гипотеза:

Для проверки основной гипотезы К. Пирсон предложил использовать статистику, называемую статистикой Фишера — Пирсона, реализация которой определяется формулой

Из закона больших чисел следует, что при

.

Поэтому при истинности гипотезы и больших объемах выборки должно выполняться приближенное равенство

Значит значение статистики должны быть «не слишком большими». Стоит отметить, что в данном случае — наблюдаемые частоты, а — ожидаемые при выполнении гипотезы частоты. В общем случае величина =, где Н-наблюдаемые частоты, Т — теоретические частоты.

Теорема. Если истина гипотеза, то распределение статистики при слабо сходится к случайной величине, имеющей -распределение с числом степеней свободы

В соответствии с теоремой критерий независимости отклоняет гипотезу на уровне значимости, если

где — квантиль уровня значимости -распределения с числом степеней свободы. При этом считается, что критерий можно использовать, если. [2,c. 229]

2. 5 Критерий Колмогорова

Для проверки равномерности распределения P-значения основного критерия используется критерий Колмогорова.

Пусть — конкретная выборка из распределения с неизвестной непрерывной функцией распределения и — эмпирическая функция распределения. Выдвигается простая гипотеза: (альтернативная).

Сущность критерия Колмогорова состоит в том, что вводят в рассмотрение функцию

называемой статистикой Колмогорова, представляющей собой максимальное отклонение эмпирической функции распределения от гипотетической функции распределения. 5, c. 218]

Колмогоров доказал, что при закон распределения случайной величины независимо от вида распределения случайной величины X стремится к закону распределения Колмогорова:

где

Вследствие этой теоремы критерий согласия с критической областью

где — корень уравнения, имеет при уровень стремящийся к. Другими словами, — асимптотический уровень значимости. Именно этот критерий и называется критерием Колмогорова. 1, c. 110]

3. Проверка гипотез для модельных данных

При помощи программы Квантили распределения статистики критерия. mtc найду квантили распределения статистики. В этой программе используется модель Геометрического броуновского движения как закон распределения цены. Методом Монте-Карло из закона формируется вектор лог доходностей, из которого извлекаются два независимых вектора с лагом (для проверки независимости лог доходностей за различные интервалы времени). По этим векторам составляется статистика Фишера — Пирсона, для нее формируется эмпирический закон, по которому строятся 999 квантилей.

Таблица 7. Квантили распределения статистики основного критерия

Квантиль

Год

Полугодие

Квартал

Квантиль

Год

Полугодие

Квартал

0,01

0,212 209

0,190 866

0,270 893

0,26

1,348 938

1,366 501

1,47 774

0,02

0,29 627

0,288 334

0,274 617

0,27

1,390 744

1,412 067

1,481 946

0,03

0,364 877

0,383 766

0,277 533

0,28

1,424 658

1,449 122

1,492 978

0,04

0,421 587

0,432 326

0,353 039

0,29

1,463 484

1,490 348

1,504 944

0,05

0,474 784

0,481 633

0,533 717

0,3

1,505 292

1,52 572

1,508 504

0,06

0,522 376

0,530 711

0,565 893

0,31

1,540 634

1,568 695

1,524 439

0,07

0,569 517

0,572 774

0,592 452

0,32

1,58 461

1,604 254

1,548 935

0,08

0,621 419

0,611 021

0,676 011

0,33

1,6301

1,647 083

1,592 983

0,09

0,666 182

0,673 119

0,682 049

0,34

1,667 164

1,689 975

1,642 586

0,1

0,710 072

0,713 267

0,69 203

0,35

1,708 413

1,721 693

1,782 258

0,11

0,758 454

0,766 168

0,834 539

0,36

1,746 473

1,759 768

1,787 561

0,12

0,796 424

0,811 475

0,866 205

0,37

1,786 811

1,802 213

1,842 816

0,13

0,841 143

0,861 614

0,881 731

0,38

1,820 294

1,85 263

1,861 932

0,14

0,881 345

0,899 595

0,888 882

0,39

1,857 478

1,89 051

1,90 949

0,15

0,923 983

0,948 974

0,905 634

0,4

1,904 023

1,931 484

1,947 937

0,16

0,958 279

1,3 884

0,98 703

0,41

1,9395

1,980 798

1,981 577

0,17

0,996 083

1,37 002

1,105 524

0,42

1,979 172

2,25 527

2,61 731

0,18

1,40 536

1,73 771

1,15 342

0,43

2,23 613

2,67 322

2,71 946

0,19

1,82 136

1,12 282

1,177 975

0,44

2,72 715

2,118 749

2,91 278

0,2

1,119 096

1,161 194

1,186 946

0,45

2,111 856

2,165 422

2,109 638

0,21

1,160 081

1,191 907

1,192 258

0,46

2,161 316

2,216 254

2,156 932

0,22

1,197 078

1,225 916

1,263 278

0,47

2,20 531

2,269 086

2,210 036

0,23

1,239 606

1,268 261

1,291 518

0,48

2,25 519

2,312 832

2,230 974

0,24

1,272 526

1,297 406

1,370 875

0,49

2,296 319

2,356 298

2,309 355

0,25

1,307 549

1,32 795

1,40 098

0,5

2,353 332

2,40 329

2,379 999

Следует отметить, что для модельных данных я проверяю независимость для различных объемов выборки и различных интервалов времени, не беря во внимание объемы торгов. Так как объемы торгов и цены могут, как зависеть друг от друга, так и на отдельных интервалах времени идти в разрез, что проследить для меня не представляется возможным, однако для реальных данных я буду рассматривать нужные объемы торгов.

При помощи программы Гистограммы P-значений. mtc строится гистограмма Р-значения при большом, среднем и малом объеме торгов.

Рисунок 3. Гистограмма P-значения при объеме выборки соответствующему году

Рисунок 4. Гистограмма Р-значения при объеме выборки соответствующему полугодию

Рисунок 5. Гистограмма Р-значения при объеме выборки соответствующему кварталу

Для проверки гипотезы о равномерном распределении статистики основного критерия по критерию Колмогорову используется программа Проверка равномерности распределения по Колмогорову. mtc, по результатам которой получено, что при объеме выборки соответствующему году, полугодию и кварталу равномерность подтверждается.

4. Выбор альтернативной гипотезы и оценка мощности критерия

4.1 Альтернативные гипотезы

В качестве альтернативных гипотез были выбраны:

зависимость прямая и зависимость обратная

Как известно, при прямой зависимости коэффициент корреляции положителен, а при обратной зависимости — отрицателен. Исходя и этого, я буду использовать коэффициент корреляции и -, где.

Таблица 8. Шкала Чеддока для оценки связи величин

Коэффициент корреляции

0,1−0,3

0,3−0,5

0,5−0,7

0,7−0,9

0,9−1

Характеристика связи

Слабая

Умеренная

Заметная

Высокая

Весьма высокая

Чтобы сгенерировать столбец лог доходностей с нужным коэффициентом корреляции, можно использовать следующее наблюдение:

Если взять две случайные величины и такие, что и, где (и независимы), то коэффициент корреляции будет определен следующим образом: Браилов А. В.

Учитывая, что можем высчитать теоретические частоты для критерия Пирсона, чтобы были верны альтернативные гипотезы, необходимо, чтобы выполнялось равенство:

где.

4. 2 Мощность критерия

Используя программу Мощность критерия. mtc, найду мощность критерия. Эта программа генерирует зависимые векторы лог доходностей, находит критическую точку из эмпирического закона квантилей распределения статистики основного критерия при уровне значимости 0,05 и подсчитывает количество значений статистики основного критерия, когда гипотеза отвергается.

Таблица 9. Мощность критерия Пирсона (при альтернативных гипотезах)

Год

Полугодие

Квартал

cor=0. 1

0,189

0,143 322

0,963

cor=-0. 1

0,20 275

0,160 641

0,56 869

Таблица 10. Мощность критерия Пирсона (при альтернативных гипотезах)

Год

Полугодие

Квартал

cor=0. 45

0,8735

0,705 066

0,62 323

cor=-0. 45

0,996 875

0,835 729

0,223 866

Таблица 11. Мощность критерия Пирсона (при альтернативных гипотезах)

Год

Полугодие

Квартал

cor=0. 7

1

0,992 746

0,623 306

cor=-0. 7

1

1

0,750 456

Из полученных таблиц можно сделать следующие выводы, используя шкалу Чеддока:

1) критерий Пирсона при объеме выборки, соответствующим году и полугодию различает умеренную, заметную, высокую и весьма высокую связь, но «не видит» слабую связь.

2) критерий Пирсона при объеме выборки, соответствующему кварталу может выявить только высокую и весьма высокую связи.

5. Проверка гипотез для реальных данных

Осуществлю проверку гипотезы для реальных данных. Используя программу Таблица P-значений для реальных данных. mtc, построю таблицы P-значений для разных лет, увеличивая интервал с одного года до трех лет с целью проверки гипотезы для разных интервалов времени, плюс ко всему возьму еще временные лаги внутри интервала и среднее P-значение для интервала буду записывать в таблицу. Проверка гипотезы осуществляется, как и для модельных данных.

Таблица 12. Р-значение для 2010 года

Таблица 13. Р-значение для 2010−2011 года

Тикер

LoVol

MidVol

HiVol

Тикер

LoVol

MidVol

HiVol

AXP

0,557 914

*

0,400 567

AXP

0,326 861

0,397 901

0,665 877

BA

*

*

0,397 486

BA

0,450 909

0,541 213

0,597 816

CVX

*

0,36 422

0,455 713

CVX

0,480 225

0,558 233

0,440 618

DD

*

*

0,628 117

DD

0,474 186

0,473 104

0,48 183

DIS

0,428 474

*

0,46 461

DIS

0,556 177

0,537 366

0,470 059

DOW

0,402 894

0,500 714

0,445 179

DOW

0,45 598

0,543 201

0,421 619

GE

*

0,464 988

0,414 716

GE

0,408 725

0,308 426

0,465 294

HPQ

0,511 029

0,619 891

0,447 884

HPQ

0,528 725

0,439 844

0,635 754

IBM

0,141 832

0,540 194

0,582 706

IBM

0,447 186

0,459 201

0,419 221

JNJ

0,540 445

0,551 198

0,40 995

JNJ

0,453 775

0,391 611

0,568 046

JPM

0,425 264

0,572 697

0,522 786

JPM

0,436 953

0,367 436

0,488 387

MCD

*

*

0,331 444

MCD

0,603 153

0,598 473

0,475 952

MMM

0,346 181

0,449 117

0,658 432

MMM

0,418 066

0,385 329

0,490 713

MRK

0,51 303

0,313 206

0,554 154

MRK

0,433 396

0,601 723

0,434 701

MSFT

0,434 989

*

0,480 137

MSFT

0,504 703

0,49 188

0,513 336

PG

0,383 791

0,39 558

*

PG

0,377 388

0,322 722

0,515 827

WFC

0,587 041

0,314 507

0,482 952

WFC

0,607 685

0,381 943

0,387 109

WMT

0,608 907

*

0,364 565

WMT

0,560 696

0,593 696

0,475 119

XOM

0,633 724

*

0,550 189

XOM

0,303 261

0,36 408

0,485 668

Таблица 14. Р-значение для 2010−2012 года

Таблица 15. Р-значение для 2010−2013 года

Тикер

LoVol

MidVol

HiVol

Тикер

LoVol

MidVol

HiVol

AXP

0,412 745

0,515 418

0,394 794

AXP

0,521 679

0,340 627

0,438 692

BA

0,396 126

0,408 306

0,515 569

BA

0,32 797

0,370 844

0,412 125

CVX

0,493 677

0,67 446

0,432 729

CVX

0,563 931

0,521 064

0,448 528

DD

0,407 298

0,42 981

0,538 101

DD

0,604 508

0,497 683

0,295 598

DIS

0,430 522

0,547 582

0,546 618

DIS

0,460 859

0,566 999

0,558 142

DOW

0,612 919

0,539 571

0,613 542

DOW

0,399 373

0,260 319

0,377 966

GE

0,514 242

0,361 082

0,500 587

GE

0,401 584

0,506 217

0,496 939

HPQ

0,508 279

0,529 314

0,452 316

HPQ

0,494 285

0,33 891

0,629 783

IBM

0,506 052

0,531 967

0,412 422

IBM

0,396 862

0,59 184

0,485 678

JNJ

0,353 095

0,567 353

0,47 607

JNJ

0,633 337

0,407 489

0,490 151

JPM

0,521 271

0,358 118

0,42 221

JPM

0,446 384

0,431 656

0,411 316

MCD

0,56 318

0,446 386

0,507 871

MCD

0,339 997

0,469 438

0,507 178

MMM

0,395 935

0,636 341

0,40 173

MMM

0,342 824

0,384 554

0,472 047

MRK

0,432 286

0,461 236

0,503 718

MRK

0,362 647

0,405 695

0,355 256

MSFT

0,55 388

0,461 645

0,550 172

MSFT

0,501 458

0,427 457

0,415 952

PG

0,57 843

0,664 752

0,60 946

PG

0,431 453

0,52 199

0,556 742

WFC

0,570 051

0,546 203

0,38 627

WFC

0,453 614

0,52 142

0,401 999

WMT

0,337 808

0,482 247

0,6452

WMT

0,616 505

0,493 713

0,592 804

XOM

0,542 863

0,348 985

0,382 743

XOM

0,484 994

0,501 198

0,42 633

Далее по полученным данным построю гистограммы Р-значений при большом, среднем и малом объеме торгов, используя программу Гистограммы Р-значений для реальных данных. mtc

Рисунок 6. Гистограмма Р-значений при малом объеме торгов

Рисунок 7. Гистограмма Р-значений при среднем объеме торгов

Рисунок 8. Гистограмма Р-значений при большом объеме торгов

Программа Доля проверок, в которых гипотеза принималась. mtc, ищет критическую точку для распределения Пирсона, затем сравнивает полученное значение со статистикой критерия по реальным данным, подсчитывая количество тех значений статистики критерия, которые не попадают в критическую область. Полученное количество делится на общее количество статистики критерия.

Таблица 16. Доля проверок, в которых гипотеза принималась при 1% и 5% уровнях значимости

Уровень значимости

LoVol

MidVol

HiVol

1%

0,993 573

0,998 695

0,991 587

5%

0,96 401

0,977 807

0,959 135

С помощью программы Медианы Р-значений. mtc найду медианы Р-значений. Эта программа ищет Р-значение, которое лежит в середине ранжированного ряда.

Таблица 17. Медианы Р-значений по годам

Год

LoVol

MidVol

HiVol

2010

0,473 009

0,464 988

0,460 161

2011

0,453 775

0,459 201

0,48 183

2012

0,506 052

0,515 418

0,500 587

2013

0,453 614

0,469 438

0,448 528

Таблица 18. Медианы Р-значений по тикерам

Тикер

LoVol

MidVol

HiVol

AXP

0,467 212

0,397 901

0,41 963

BA

0,396 126

0,408 306

0,463 847

CVX

0,493 677

0,539 649

0,444 573

DD

0,474 186

0,473 104

0,509 966

DIS

0,44 569

0,547 582

0,508 339

DOW

0,429 437

0,520 142

0,433 399

GE

0,408 725

0,413 035

0,481 117

HPQ

0,509 654

0,484 579

0,541 049

IBM

0,422 024

0,53 608

0,45 245

JNJ

0,49 711

0,479 344

0,483 111

JPM

0,441 669

0,399 546

0,455 299

MCD

0,56 318

0,469 438

0,491 565

MMM

0,371 058

0,417 223

0,48 138

MRK

0,432 841

0,433 466

0,46 921

MSFT

0,503 081

0,461 645

0,496 736

PG

0,407 622

0,458 785

0,556 742

WFC

0,578 546

0,451 681

0,394 554

WMT

0,584 801

0,493 713

0,533 962

XOM

0,513 928

0,36 408

0,455 999

Исходя из того, что медиана — это численное значение признака, которое находится в середине ранжированного ряда, то это адекватное среднее значение признака. Максимум Р-значений по компаниям приходится на компанию Wal-Mart Stores Inc.(американская компания-ритейлер, управляющая крупнейшей в мире розничной сетью), а минимум на 3M Company (американская диверсифицированная инновационно-производственная компания). 3 М Company ориентирована на повышение качества продукции, так как связана с инновациями, а Wal-Mart Stores Inc. ориентирована на количество, так как развивает розничную торговлю. По полученной таблице логарифмические доходности более независимы у WMT, значит, их доход практически не зависит от полученной прибыли накануне, а у МММ наблюдается зависимость, возможно это происходит следующим образом: если инновационный продукт прижился, то они получают прибыль, которую вкладывают в более крупный проект, если он окажется успешен, то они получат еще больше прибыли, если нет, то им придется вкладывать в мелкие проекты и от них ждать доходов, но уже не таких крупных. Все равно прослеживается зависимость, а для розничной торговли все может быть спонтаннее, но все равно зависимость тоже для отдельных лет может наблюдаться. Если смотреть по годам, то здесь зависимость лог доходностей по тикерам рассматривается, здесь максимальная зависимость может наблюдаться для компаний, которые зависят друг от друга, в той или иной степени, производят взаимодополняющие блага, а снижение зависимости может наблюдаться из- за того, что одна из компаний перешла на производство других предметов быта.

Заключение

В результате проведенной работы получилось, что гипотеза о независимости логарифмических доходностей для различных интервалов времени при большом, среднем и малом объеме торгов принимается при 0,01 и 0,05 уровнях значимости практически всегда, однако гистограмма Р-значений не равномерна на отрезке [0,1], что не дает мне с полной уверенностью сказать, что они независимы и гипотеза принимается в отличие от результатов прошлого года.

Новизна состоит в том, что в работе были использованы новые программы и две альтернативные гипотезы

Литература

1) Браилов А. В. Лекции по математической статистике. -М.: Финакадемия, 2007

2) Гмурман В. Е. — Руководство к решению задач по теории вероятностей и математической статистике: Учеб. Пособие — 12-е изд., перераб. -М. :Высшее образование, 2006−476 с. (Основы наук)

3) Горяинов Б. В., Павлов И. В., Цветкова Г. М. и др. Математическая статистика: под ред. ЗарубинаВ.С., Крищенко А. П. — М. :Изд-во МГТУ им. Н. Э. Баумана, 2001. — 424 с. (Сер. Математика в техническом университете; Вып. XVII).

4) Ниворожкина Л. И., Морозова З. А. Теория вероятностей и математическая статистика — М. :Эксмо, 2008. — 432 с. — (Техническое образование).

5) Письменный Д. Конспект лекций по теории вероятностей и математической статистике и случайным процессам. — М.: Айрис-пресс, 2008. — 256 с. — (Высшее образование).

6) http: //finance. yahoo. com.

7) Аюпов Д. (2013). Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов Москва: ФГОУ ВПО «Финансовый университет при Правительстве РФ».

8) Безделина Е. (2013). Проверка следствий гипотезы о независимости логарифмической доходности за различные интервалы времени Москва: ФГОУ ВПО «Финансовый университет при Правительстве РФ».

9) Петухова С. (2013). Проверка гипотезы о нормальном распределении дневной логарифмической доходности по модифицированному критерию Пирсона. Москва: ФГОУ ВПО «Финансовый университет при Правительстве РФ».

Приложение 1

Таблица 19. Характеристики компьютера

Тип процессора

Intel Core i5 2450M

Тактовая частота

2. 50 GHz

Частота системной шины

99. 76 MHz

Объем кэш-памяти второго уровня

512KB

Таблица 20. Список программ, работающих более 10 секунд

Гистограмма Р-значений. mtc

15 c.

Квантили распределения статистики критерия. mtc

2 м. 35 с.

Мощность критерия. mtc

29 с.

Приложение 2

1. Число торговых дней

//источник [7]

//время работы 656 мс

Y=2010: 2013;

T=loadtextcol («Tickers. txt»,"Tickers");

NT=0(#T,#Y);

for (y in Y)

{

d1=date (y, 1,1);

d2=date (y, 12,31);

for (t in T)

{

X=loaddaily (d1,d2,t+". csv","CLOSE");

NT (t. num, y. num)=sum (X>0);

}

}

F=["год/тикер","2010″,"2011″,"2012″,"2013"];

tiker=[F; T, NT];

savetable (tiker,"Число торговых дней. csv");

3,4. Скачки цен

//источник [7]

//Радостева 2014 г.

//717 мс

Y=2010: 2013;

T=loadtextcol («Tickers. txt»,"Tickers");

NT=0(#T,#Y);

NT1=0(#T,#Y);

for (y in Y)

{

d1=date (y, 1,1);

d2=date (y, 12,31);

for (t in T)

{

X=loaddaily (d1,d2,t+". csv","CLOSE");

I=select (X, X> 0);

I1=I (2: #I);

I=I (1: (#I-1));

NT (t. num, y. num)=max (I1/I);

NT1(t. num, y. num)=min (I1/I);

}

}

F=["год/тикер","2010″,"2011″,"2012″,"2013"];

U=[F; T, NT-1];

savetable (U,"Скачки цен вверх. csv");

U=[F; T, NT1−1];

savetable (U,"Скачки цен вниз. csv");

1, 2. Графики со скачками

//источник [7]

//2.8 c

Tickers=loadtextcol («Tickers. txt»,"Tickers");

Max = 0; MaxTic = super (1);

Min = 1; MinTic = super (1);

d1 = date (2010,1,1);

d2 = date (2013,12,31);

for (i in Tickers)

{

Close = loaddaily (d1,d2,i + «. csv»,"CLOSE");

I=select (Close, Close> 0);

C1=I (2: #I);

C= I (1: (#I-1));

if (max (C1/C) > Max)

{

Max = max (C1/C); MaxTic = i;

}

if (min (C1/C) < Min)

{

Min = min (C1/C); MinTic = i;

}

}

//Построение графиков цен акций с мин. и макс. скачками

for (i in [MaxTic; MinTic])

{

Close = loadnumcol (i + «. csv»,"CLOSE");

C = select (Close, Close> 0);

X = 1: #C;

XX = select (X, Close> 0);

wintitle (i);

line (XX, C, blue);

axes ();

show ();

erase ();

}

7. Квантили распределения статистики критерия

//Источник [7] и [8]

//Радостева 2014 г.

//2м 35с

timer (0);

//число дней для года, полугодия, квартала,

//которые соответствуют большому, среднему и малому объемам торгов

k=[240; 120;60];

//временной лаг

lag=1: 8;

m=10 000;

St=0(m,#k);

PV=0(m,#k);

//закон геометрического броуновского движения

law L ()=exp (sum (nlaw (0,1)(1)));

for (j in 1: #k)

{

for (i in 1: m)

{

//содаем два независимых вектора, показывающих лог доходность

Log=dif (ln (L (k (j))));

for (lg in 1: 8)

{

X=Log (1: #Log-lg);

Y=Log (lg+1: #Log);

p=#Y;

maxX=max (X)+1;

maxY=max (Y)+1;

minX=min (X)-1;

minY=min (Y)-1;

rY=elaw (Y). invpg (1/3);

rX=elaw (X). invpg (1/3);

//интервалы для вычисления частот торгов

DX=[minX; -rX;rX;maxX];

DY=[minY; -rY;rY;maxY];

r1=#DX-1; //количество интервалов для X

r2=#DY-1; //то же самое для Y

n=0(r1,r2);

//создаем таблицу частот

for (c in 1: r1)

for (d in 1: r2)

n (c, d)=sum (X> =DX (c)& X< DX (c+1) &

Y> =DY (d) & Y< DY (d+1));

l=(r1−1)*(r2−1); //степень свободы

n1=sum (rows (n));

n2=sum (cols (n));

//создаем таблицу произведения частот

t=n1& *n2;

//проверка условия использования критерия

if (min (t/k (j))> 5)

x2=sum ((n-t/p)^2/t)*p; //статистика критерия

St (i, j)=x2;

}

}

}

Lew=0. 001:0. 999:0. 001;

qi=[Lew];

for (i in 1: #k)

{

El=elaw (St. c (i));

qi=[qi, El. q (Lew)];

}

savetable (["Квантиль","Год","Полугодие","Квартал"; qi],

«Квантили распределния статистики. csv»);

3,4,5. Гистограммы Р-значений

//источники [7] и [8]

//Радостева 2014 г.

//15 c

timer (0);

q=loadnumcol («Квантили распределения статистики. csv»,"Квантиль");

y=loadnumcol («Квантили распределния статистики. csv»,"Год");

hy=loadnumcol («Квантили распределения статистики. csv»,"Полугодие");

quarter=loadnumcol («Квантили распределения статистики. csv»,"Квартал");

//эмпирические законы распределения

Qy=elaw (y);

Qhy=elaw (hy);

Qquarter=elaw (quarter);

m=1000;

//объем выборок для года, полугодия, квартала

k=[240; 120;60];

//временной лаг

lag=1: 8;

PV=0(m,#k);

//закон геометрического броуновского движения

law L ()=exp (sum (nlaw (0,1)(1)));

for (j in 1: #k)

{

for (i in 1: m)

{

Log=dif (ln (L (k (j))));

for (lg in lag)

{

//создаём два независимых вектора,

//показывающих лог доходность

X=Log (1: #Log-lg);

Y=Log (1+lg: #Log);

p=#Y;

maxX=max (X)+1;

maxY=max (Y)+1;

minX=min (X)-1;

minY=min (Y)-1;

rY=elaw (Y). invpg (1/3);

rX=elaw (X). invpg (1/3);

//интервалы для вычисления частот

DX=[minX; -rX;rX;maxX];

DY=[minY; -rY;rY;maxY];

r1=#DX-1; //количество интервалов для X

r2=#DY-1; //то же самое для Y

n=0(r1,r2);

//создаем таблицу частот

for (c in 1: r1)

for (d in 1: r2)

n (c, d)=sum (X> =DX (c)& X< DX (c+1) &

Y> =DY (d) & Y< DY (d+1));

n1=sum (rows (n));

n2=sum (cols (n));

//создаем таблицу произведения частот

t=n1& *n2;

if (min (t/k (j))> 5)

x2=sum ((n-t/p)^2/t)*p;

s=x2;

//находим Р-значение для года, полугодия, квартала

if (j==1) PV (i, j)=Qy. pg (s);

if (j==2) PV (i, j)=Qhy. pg (s);

if (j==3) PV (i, j)=Qquarter. pg (s);

}

}

}

h=0. 001;

Pt=0: 1: h;

TOF1=PV. c (1). intfrgel (Pt);

TOF2=PV. c (2). intfrgel (Pt);

TOF3=PV. c (3). intfrgel (Pt);

savetable (["PV","Год","Полугодие","Квартал";

[Pt (2: #Pt), PV. c (1), PV. c (2), PV. c (3)]],"Таблица Р-значений. csv");

hist (TOF1,blue);

wintitle («При объеме выборки соответствующему году»);

axes ();

show ();

erase ();

hist (TOF2,blue);

wintitle («При объеме выборки соответствующему полугодию»);

axes ();

show ();

erase ();

hist (TOF3,blue);

wintitle («При объеме выборки соответствующему кварталу»);

axes ();

Проверка равномерности распределения по Колмогорову

//Радостева 2014г

//32мс

Yh=loadnumcol («Таблица Р-значений. csv»,"Год");

Ym=loadnumcol («Таблица Р-значений. csv»,"Полугодие");

Yl=loadnumcol («Таблица Р-значений. csv»,"Квартал");

Lteor=ulaw (0,1);

Lnab1=elaw (Yh); Lnab2=elaw (Ym);Lnab3=elaw (Yl);

XX=0: 1:0. 1;

//Критерий Колмогорова

DD1=max (abs (Lnab1. pl (XX)-Lteor. pl (XX)))*(#Yh)^0. 5;

DD2=max (abs (Lnab2. pl (XX)-Lteor. pl (XX)))*(#Ym)^0. 5;

DD3=max (abs (Lnab3. pl (XX)-Lteor. pl (XX)))*(#Yl)^0. 5;

Z1=pvKolm (DD1);

Z2=pvKolm (DD2);

Z3=pvKolm (DD3);

k1="Не принимается при объеме выборки соответствующему году";

k2="Не принимается при объеме выборки соответствующему полугодию";

k3="Не принимается при объеме выборки соответствующему кварталу";

if (Z1>0. 05)

k1="При объеме выборки соответствующему году принимается";

if (Z2>0. 05)

k2="При объеме выборки соответствующему полугодию принимается";

if (Z3>0. 05)

k3="При объеме выборки соответствующему кварталу принимается";

[k1; k2;k3];

9,10,11. Мощность критерия

//источник [7]

//Радостева 2014 г.

//29c

timer (0);

q=loadnumcol («Квантили распределения статистики. csv»,"Квантиль");

y=loadnumcol («Квантили распределения статистики. csv»,"Год");

hy=loadnumcol («Квантили распределения статистики. csv»,"Полугодие");

quarter=loadnumcol («Квантили распределения статистики. csv»,"Квартал");

S=[240; 120;60];

//временной лаг

lag=1: 8;

g=0(2,3);

//критические точки для года, полугодия, квартала

Tkr=[elaw (y). q (1−0. 05/2);elaw (hy). q (1−0. 05/2);elaw (quarter). q (1−0. 05/2)];

Count=0(2,3);

m=1000;

//коэффициент корреляции

po=0. 7;//0. 1,0. 45

K=0(2,3);

C=[po; -po];

law L ()=exp (sum (nlaw (0,1)(1)));

for (a in 1: #C)

{

for (j in 1: #S)

{

for (i in 1: m)

{

Log=dif (ln (L (S (j))));

for (lg in lag)

{

//создаем зависимые лог доходности

LnX=Log (1: #Log-lg);

LnY=LnX*C (a)+(1-C (a)^2)^0. 5*Log (1+lg:#Log);

maxX=max (LnX)+1; maxY=max (LnY)+1;

minX=min (LnX)-1; minY=min (LnY)-1;

rX=elaw (LnX). invpg (1/3); rY=elaw (LnY). invpg (1/3);

D1=[minX; -rX;rX;maxX];

D2=[minY; -rY;rY;maxY];

//количество интервалов

r1=#D1−1;

r2=#D2−1;

k=#LnX;

//создаем таблицу частот частоты

n=0(r1,r2);

for (c in 1: r1)

for (d in 1: r2)

n (c, d)=sum (LnX> =D1(c)&LnX<D2(c+1)&

LnY> =D2(d)&LnY<D2(d+1));

n2=sum (cols (n));

n1=sum (rows (n));

//таблица произведения частот

t=n1& *n2;

if (min (t/k)> 5)

{

//сколько раз проверялась гипотеза

g (a, j)=g (a, j)+1;

z=sum ((n-t/k)^2/t)*k;

//количество раз, когда гипотеза не выполнялась

if (Tkr (j)< abs (z)) Count (a, j)=Count (a, j)+1;

}

}

}

}

}

Count=Count/g;

savetable ([" «,"Год»,"Полугодие","Квартал"; ["cor="+po;"cor="+(-po)], Count],

«Мощность критерия. csv»);

12,13,14,15. Таблица Р-значений для реальных данных

//источник [7] и [8]

//Радостева 2014 г.

//2. 8с

d1 = date (2010,1,1);

d2 = date (2010,12,31);

Tickers = loadtextcol («Tickers2. txt»,"Tickers");

Vars = ["LoVol","MidVol","HiVol"];

//временной лаг

lag=[1: 5;10:25:5;30:50:10];

//суперматрица, размер которой определяется количеством элементов

//матрицы Tickers и количеством элементов матрицы Vars,

//все элементы которой являются «пустыми» строками символов

TabPV = super (#Tickers,#Vars);

Y=2010: 2013;

for (y in Y)

{

d1 = date (2010,1,1);

d2 = date (y, 12,31);

for (ticker in Tickers)

{

V0 = loaddaily (d1,d2,ticker + «. csv»,"Volume");

V = select (V0,V0> 0);//отбираются акции только по рабочим дням

LV = elaw (V); //эмпирическое распределение

//эмпирические квантили (определяется объем торгов уровня квантили 1/3)

v1 = LV. invpl (1/3);

//эмпирические квантили (определяется объем торгов уровня квантили 2/3)

v2 = LV. invpl (2/3);

P0 = loaddaily (d1,d2,ticker + «. csv»,"Adj Close");

P = select (P0,V0> 0);

assert (min (P)> 0);

for (nv in 1: #Vars)

{

TabPV (ticker. num, nv) ="*"; //-1 для построения диаграммы

if (nv==1) C = (V< =v1)(1:#V-1);

if (nv==2) C = (V> v1 & V< v2)(1:#V-1);

if (nv==3) C = (V> =v2)(1:#V-1);

//определяется дневная логдоходность для C

lnR = select (dif (ln (P)), C);

m = #lnR; //число наблюдений

//если число наблюдений меньше 50,

//то прерывается выполнение тела оператора for

// и начинается переход к следующему элементу матрицы

if (m< 50) continue;

minR = min (lnR)-1; //нижняя граница

maxR = max (lnR)+1; //верхняя граница

r = elaw (lnR). invpg (1/3);

Q = [-r; r];

D1 = [minR; Q; maxR]; //разбиваем на интервалы

D2 = [minR; Q; maxR]; //разбиваем на интервалы

r1 = #D1−1; //количество интервалов, на которые разбили

r2 = #D2−1; //количество интервалов, на которые разбили

pv=0(#lag);

for (lg in 1: #lag)

{

//случайные величины с учетом временных лагов

lnR1 = lnR (1: m-lag (lg));

lnR2 = lnR (1+lag (lg): m);

n = #lnR1;

//условие использования критерия

if (n< 50) continue;

p = 0(r1,r2);

// p — матрица вероятностей попадания доходностей

//в получившиеся интервалы

for (i in 1: r1)

{

for (j in 1: r2)

{

p (i, j) = sum (lnR1> =D1(i)&lnR1<D1(i+1) &

lnR2> =D2(j)&lnR2<D2(j+1))/n;

}

}

//проверка того, что логдоходность попадает вся

//в общий интервал

assert (abs (sum (p)-1) < 0. 1);

k = (r1−1)*(r2−1); // степень свободы критерия

p2 = sum (cols (p)); //сумма столбцов матрицы p

p1 = sum (rows (p)); //сумма строк матрицы р

t = p1& *p2;

if (min (t*n) > 5)

{

//если выполняется условие, при котором можно

//использовать критерий Пирсона:

//теоритические частоты > =5

z=n*sum ((p-t)^2/t);

//сколько раз считался критерий для одного года //и тикера

Count=Count+1;

pv (lg) = x2law (k). pg (z); // P-значение

}

}

//среднее значение

if (Count) TabPV (ticker. num, nv) =sum (pv)/Count;

}

}

H = ["Тикер", Vars];

Out = [H; [Tickers, TabPV]];

savetable (Out,"tab"+y+". csv");

}

6,7,8. Гистограмма Р-значений для реальных данных

//Радостева 2014 г.

//1. 8с

Y=2011: 2013;

//загружаем данные по каждому объему торгов

X1=loadnumcol («tab2010. csv»,"LoVol");

X2=loadnumcol («tab2010. csv»,"MidVol");

X3=loadnumcol («tab2010. csv»,"HiVol");

//убираем данные, где статистика не посчиталась

LoVol=select (X1,X1> 0&X2>0&X3>0);

MidVol=select (X2,X1> 0&X2>0&X3>0);

HiVol=select (X3,X1> 0&X2>0&X3>0);

//строим векторы Р-начений для каждого объема торгов

for (y in Y)

{

LoVol=[LoVol; loadnumcol («tab"+y+». csv","LoVol")];

MidVol=[MidVol; loadnumcol («tab"+y+». csv","MidVol")];

HiVol=[HiVol; loadnumcol («tab"+y+». csv","HiVol")];

}

//выбираем шаг

h=0. 01;

Pt=0: 1: h;

//разбиваем на интервалы

TOF1=LoVol. intfrgel (Pt);

TOF2=MidVol. intfrgel (Pt);

TOF3=HiVol. intfrgel (Pt);

//рисуем

hist (TOF1,blue);

wintitle («При малом объеме торгов»);

axes ();

show ();

erase ();

hist (TOF2,blue);

wintitle («При большом среднем торгов»);

axes ();

show ();

erase ();

hist (TOF3,blue);

wintitle («При большом объеме торгов»);

axes ();

16. Доля проверок, в которых гипотеза проверялась

//источник [7]

//Радостева 2014 г.

//5. 8c

d1 = date (2010,1,1);

d2 = date (2010,12,31);

Tickers = loadtextcol («Tickers2. txt»,"Tickers");

Vars = ["LoVol","MidVol","HiVol"];

//временной лаг

lag=[1: 5;10:25:5;30:50:10];

TabPV = super (#Tickers,#Vars);

Y=2010: 2013;

Res=0(2,3);

Cou=0(2,3);

for (y in Y)

{

d1 = date (2010,1,1);

d2 = date (y, 12,31);

for (ticker in Tickers)

{

V0 = loaddaily (d1,d2,ticker + «. csv»,"Volume");

V = select (V0,V0> 0);//отбирабтся акции только по рабочим дням

LV = elaw (V); //эмпирическое распределение

//эмпирические квантили (определяется объем торгов

//уровня квантили 1/3)

v1 = LV. invpl (1/3);

//эмпирические квантили (определяется объем торгов

//уровня квантили 2/3)

v2 = LV. invpl (2/3);

P0 = loaddaily (d1,d2,ticker + «. csv»,"Adj Close");

P = select (P0,V0> 0);

assert (min (P)> 0);

for (nv in 1: #Vars)

{

TabPV (ticker. num, nv) ="*"; //-1 для построения диаграммы

if (nv==1) C = (V< =v1)(1:#V-1);

if (nv==2) C = (V> v1 & V< v2)(1:#V-1);

if (nv==3) C = (V> =v2)(1:#V-1);

//определяется дневная логдоходность для C

lnR = select (dif (ln (P)), C);

m = #lnR; //число наблюдений

if (m< 50) continue;

minR = min (lnR)-1; //нижняя граница

maxR = max (lnR)+1; //верхняя граница

r = elaw (lnR). invpg (1/3);

Q = [-r; r];

D1 = [minR; Q; maxR]; //разбиваем на интервалы

D2 = [minR; Q; maxR]; //разбиваем на интервалы

r1 = #D1−1; //количество интервалов, на которые разбили

r2 = #D2−1; //количество интервалов, на которые разбили

pv=0(#lag);

for (lg in 1: #lag)

{

//случайные величины с учетом временных лагов

lnR1 = lnR (1: m-lag (lg));

lnR2 = lnR (1+lag (lg): m);

n = #lnR1;

if (n< 50) continue;

p = 0(r1,r2);

//p — матрица вероятностей попадания доходностей

//в получившиеся интервалы

for (i in 1: r1)

{

for (j in 1: r2)

{

p (i, j) = sum (lnR1> =D1(i)&lnR1<D1(i+1) &

lnR2> =D2(j)&lnR2<D2(j+1))/n;

}

}

//проверка того, что логдоходность попадает вся

//в общий интервал

assert (abs (sum (p)-1) < 0. 1);

k = (r1−1)*(r2−1); // степень свободы критерия

p2 = sum (cols (p)); //сумма столбцов матрицы p

p1 = sum (rows (p)); //сумма строк матрицы р

t = p1& *p2;

L=x2law (k);

Tkr=[L. q (1−0. 01/2);L. q (1−0. 05/2)];

if (min (t*n) > 5)

{

//если выполняется условие, при котором

//можно использовать критерий Пирсона:

// теоритические частоты > =5

z=n*sum ((p-t)^2/t);

for (kr in 1: #Tkr)

{

Cou (kr, nv)=Cou (kr, nv)+1;

//сколько раз гипотеза выполнялась

if (Tkr (kr)> abs (z))

Res (kr, nv)=Res (kr, nv)+1;

}

}

}

}

}

}

savetable (["Уровень значимости","LoVol","MidVol","HiVol";

[["1%"; «5%"], Res/Cou]],

«Доля проверок, в которых гипотеза принималась. csv»);

17,18. Медиана Р-значений

//Радостева 2014г

//16мс

Y=2011: 2013;

//загружаем таблицу Р-значений при разных объемов торгов

LoVol=loadnumcol («tab2010. csv»,"LoVol");

MidVol=loadnumcol («tab2010. csv»,"MidVol");

HiVol=loadnumcol («tab2010. csv»,"HiVol");

for (y in Y)

{

LoVol=[LoVol, loadnumcol («tab"+y+». csv","LoVol")];

MidVol=[MidVol, loadnumcol («tab"+y+». csv","MidVol")];

HiVol=[HiVol, loadnumcol («tab"+y+». csv","HiVol")];

}

Tickers=loadtextcol («Tickers2. txt»,"Tickers");

Y=2010: 2013;

MedYear=0(#Y, 3);

MedTic=0(#Tickers, 3);

//медианы по годам

for (y in 1: #Y)

{

X1=LoVol. c (y);X2=MidVol. c (y);X3=HiVol. c (y);

X1=select (X1,X1> 0);X2=select (X2,X2>0);X3=select (X3,X3>0);

MedYear (y, 1)=median (X1);

MedYear (y, 2)=median (X2);

MedYear (y, 3)=median (X3);

}

//медианы по тикерам

for (tic in 1: #Tickers)

{

X1='LoVol. r (tic);X2='MidVol. r (tic);X3='HiVol. r (tic);

X1=select (X1,X1> 0);X2=select (X2,X2>0);X3=select (X3,X3>0);

MedTic (tic, 1)=median (X1);

MedTic (tic, 2)=median (X2);

MedTic (tic, 3)=median (X3);

}

savetable (["Год","LoVol","MidVol","HiVol"; Y, MedYear],

«Медианы Р-значений по годам. csv»);

savetable (["Тикер","LoVol","MidVol","HiVol"; Tickers, MedTic],

«Медианы Р-значений по тикерам. csv»);

ПоказатьСвернуть
Заполнить форму текущей работой