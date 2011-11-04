Введение

Одна из важнейших задач технического анализа – это определить, в каком направлении двинется рынок в ближайшее время. С точки зрения статистики задача сводится к тому, чтобы выбрать индикаторы и определить их значения, на основании которых можно было бы разделить будущее состояние рынка на категории: 1) двинется вверх, 2) двинется вниз.

Одним из способов принятия решения о том, какие индикаторы и какие их значения лучше позволяют различать эти категории, является дискриминантный анализ. Другими словами, дискриминантный анализ дает возможность построить "модель", которая будет предсказать на основе данных от индикаторов - куда двинется рынок.

Однако такой анализ является сравнительно сложным и требует большого количества данных на входе. Поэтому использование его в ручном режиме для анализа движения рынка весьма трудоемко. К счастью, с появлением языка MQL5 и статистических программ появилась возможность автоматизировать действия по сбору, подготовке данных и применению к ним дискриминантного анализа.

В статье предлагается пример создания советника для сбора данных с рынка. Статья является методическим руководством по использованию дискриминантного анализа в программе Statistica для построения прогностических моделей для рынка FOREX.

1. Что же такое - дискриминантный анализ



Дискриминантный анализ (далее ДА) относится к одному из методов распознавания образов. Можно сказать, что нейронные сети являются частным случаем ДА. Большинство успешных военных систем, использующих распознавание образов, используют именно ДА.

ДА позволяет решить задачу о том, какие переменные и как разделяют (дискриминируют) входящий поток данных на группы.

Рассмотрим упрощенный пример использования ДА для рынка FOREX. У нас есть данные по значениям индикаторов Relative Strength Index (RSI), MACD, Relative Vigor Index (RVI). Нужно спрогнозировать направление, в котором двинется цена. Выполнив ДА, мы в итоге можем получить следующее.

a. Индикатор RVI не помогает делать прогноз. Исключаем его из анализа.

b. ДА выдал два дискриминантных уравнения:

G1 = a1*RSI+b1*MACD+с1, уравнение для случаев, когда цена двинулась вверх; G2 = a2*RSI+b2*MACD+с2, уравнение для случаев, когда цена двинулась вниз.

Вычисляя значение G1 и G2 в начале каждого бара, мы прогнозируем, что если G1 > G2, то цена двинется вверх; если G1 < G2, то цена двинется вниз.

ДА может быть полезным для начального знакомства с нейронными сетями. При использовании ДА мы получаем уравнения, аналогичные тем, которые рассчитываются для работы нейронных сетей. Это помогает лучше понять внутреннее их устройство, а также предварительно определить, имеет ли смысл использовать нейронные сети в ваших стратегиях.

2. Этапы дискриминантного анализа

Выполнение анализа можно разделить на несколько этапов.

Подготовка данных; Выбор лучших переменных из подготовленных данных; Анализ полученной модели и ее проверка на тестовых данных; Построение модели на основе дискриминантных уравнений.

Дискриминатный анализ включен практически во все современные программные пакеты, предназначенные для статистического анализа данных. Наиболее популярными пакетами являются Statistica (StatSoft Inc.) и SPSS (IBM Corporation). Далее мы будем рассматривать применение дискриминантного анализа с помощью программы Statistica. Снимки экранов сделаны для версии Statistica 8.0. Примерно также это выглядит и в более ранних версиях программы. Следует заметить, что Statistica содержит также много других полезных инструментов для трейдера, включая нейронные сети.





2.1. Подготовка данных



Сбор данных зависит от поставленной задачи. Сформулируем задачу следующим образом: использовав индикаторы, попытаемся предсказать движение ценового графика на баре следующем после бара, для которого значения индикаторов известны. Для сбора данных напишем советник, который будет сохранять значения индикаторов и данные о цене в файл.

Файл должен быть в формате CSV и иметь следующую структуру. Переменные должны быть расположены в столбик, т.е. каждому столбику соответствует какой-либо один индикатор. В строках должны располагаться последовательные измерения (случаи), т.е. значения индикаторов для конкретных баров. Другими словами, в заголовках таблицы по горизонтали расположены индикаторы, по вертикали последовательные бары.

В таблице должна быть переменная, по которой будет выполняться разделение на группы (группирующая переменная). В нашем случае такая переменная будет основана на изменении цены на следующем баре, идущем за баром для которого были получены значения индикатора. Группирующая переменная должна содержать номер группы, к которой относятся данные, содержащиеся в той же строке. Например, номер 1 для случаев, когда цена пошла вверх, и номер 2 для случаев, когда цена пошла вниз.

Индикаторы, значения которых нам понадобятся:

В функции OnInit() производится создание индикаторов (получение хендлов индикаторов), создание файла MasterData.csv и запись в него заголовка столбцов данных:

int OnInit () { h_AC= iAC ( Symbol (), Period ()); h_BearsPower= iBearsPower ( Symbol (), Period (),BearsPower_PeriodBears); h_BullsPower= iBullsPower ( Symbol (), Period (),BullsPower_PeriodBulls); h_AO= iAO ( Symbol (), Period ()); h_CCI= iCCI ( Symbol (), Period (),CCI_PeriodCCI,CCI_Applied); h_DeMarker= iDeMarker ( Symbol (), Period (),DeM_PeriodDeM); h_FrAMA= iFrAMA ( Symbol (), Period (),FraMA_PeriodMA,FraMA_Shift,FraMA_Applied); h_MACD= iMACD ( Symbol (), Period (),MACD_PeriodFast,MACD_PeriodSlow,MACD_PeriodSignal,MACD_Applied); h_RSI= iRSI ( Symbol (), Period (),RSI_PeriodRSI,RSI_Applied); h_RVI= iRVI ( Symbol (), Period (),RVI_PeriodRVI); h_Stoch= iStochastic ( Symbol (), Period (),Stoch_PeriodK,Stoch_PeriodD,Stoch_PeriodSlow, MODE_SMA ,Stoch_Applied); h_WPR= iWPR ( Symbol (), Period (),WPR_PeriodWPR); if (h_AC== INVALID_HANDLE || h_BearsPower== INVALID_HANDLE || h_BullsPower== INVALID_HANDLE || h_AO== INVALID_HANDLE || h_CCI== INVALID_HANDLE || h_DeMarker== INVALID_HANDLE || h_FrAMA== INVALID_HANDLE || h_MACD== INVALID_HANDLE || h_RSI== INVALID_HANDLE || h_RVI== INVALID_HANDLE || h_Stoch== INVALID_HANDLE || h_WPR== INVALID_HANDLE ) { Print ( "Ошибка создания индикаторов" ); return ( 1 ); } ArraySetAsSeries (buf_AC, true ); ArraySetAsSeries (buf_BearsPower, true ); ArraySetAsSeries (buf_BullsPower, true ); ArraySetAsSeries (buf_AO, true ); ArraySetAsSeries (buf_CCI, true ); ArraySetAsSeries (buf_DeMarker, true ); ArraySetAsSeries (buf_FrAMA, true ); ArraySetAsSeries (buf_MACD_m, true ); ArraySetAsSeries (buf_MACD_s, true ); ArraySetAsSeries (buf_RSI, true ); ArraySetAsSeries (buf_RVI_m, true ); ArraySetAsSeries (buf_RVI_s, true ); ArraySetAsSeries (buf_Stoch_m, true ); ArraySetAsSeries (buf_Stoch_s, true ); ArraySetAsSeries (buf_WPR, true ); FileHandle= FileOpen ( "MasterData2.csv" , FILE_ANSI | FILE_WRITE | FILE_CSV | FILE_SHARE_READ , ';' ); if (FileHandle!= INVALID_HANDLE ) { Print ( "FileOpen OK" ); FileWrite (FileHandle, "Time" , "Hour" , "Price" , "AC" , "dAC" , "Bears" , "dBears" , "Bulls" , "dBulls" , "AO" , "dAO" , "CCI" , "dCCI" , "DeMarker" , "dDeMarker" , "FrAMA" , "dFrAMA" , "MACDm" , "dMACDm" , "MACDs" , "dMACDs" , "MACDms" , "dMACDms" , "RSI" , "dRSI" , "RVIm" , "dRVIm" , "RVIs" , "dRVIs" , "RVIms" , "dRVIms" , "Stoch_m" , "dStoch_m" , "Stoch_s" , "dStoch_s" , "Stoch_ms" , "dStoch_ms" , "WPR" , "dWPR" ); } else { Print ( "Операция FileOpen неудачна, ошибка " , GetLastError ()); ExpertRemove (); } return ( 0 ); }

В обработчике события OnTick() производится определение поступления нового бара и сохранение данных в файл.

Движение цены будем определять по последнему сформированному бару, а значения индикаторов берем с предшествующего ему бара. Помимо абсолютного значения индикатора сохраняем его разницу с предыдущим значением, чтобы учитывать направление его изменения. Такие переменные в предложенном примере будут иметь в названии префикс "d".

Для индикаторов с сигнальной линией сохраняем разницу между главной и сигнальной линией, а также ее динамику. Дополнительно сохраняем время поступления бара и значение часа для него. Это может пригодиться для фильтрации данных по времени.

Таким образом, мы будем учитывать 37 показателей, чтобы построить модель прогнозирования движения цены.

void OnTick () { static datetime Prev_time; MqlRates mrate[]; MqlTick tickdata; ArraySetAsSeries (mrate, true ); if (! SymbolInfoTick ( _Symbol ,tickdata)) { Alert ( "Ошибка обновления котировок - ошибка: " , GetLastError (), "!!" ); return ; } if ( CopyRates ( _Symbol , _Period , 0 , 4 ,mrate)< 0 ) { Alert ( "Ошибка копирования исторических котировок - ошибка: " , GetLastError (), "!!" ); return ; } if (Prev_time==mrate[ 0 ].time) return ; Prev_time=mrate[ 0 ].time; bool copy_result= true ; copy_result=copy_result && FillArrayFromBuffer1(buf_AC,h_AC, 4 ); copy_result=copy_result && FillArrayFromBuffer1(buf_BearsPower,h_BearsPower, 4 ); copy_result=copy_result && FillArrayFromBuffer1(buf_BullsPower,h_BullsPower, 4 ); copy_result=copy_result && FillArrayFromBuffer1(buf_AO,h_AO, 4 ); copy_result=copy_result && FillArrayFromBuffer1(buf_CCI,h_CCI, 4 ); copy_result=copy_result && FillArrayFromBuffer1(buf_DeMarker,h_DeMarker, 4 ); copy_result=copy_result && FillArrayFromBuffer1(buf_FrAMA,h_FrAMA, 4 ); copy_result=copy_result && FillArraysFromBuffers2(buf_MACD_m,buf_MACD_s,h_MACD, 4 ); copy_result=copy_result && FillArrayFromBuffer1(buf_RSI,h_RSI, 4 ); copy_result=copy_result && FillArraysFromBuffers2(buf_RVI_m,buf_RVI_s,h_RVI, 4 ); copy_result=copy_result && FillArraysFromBuffers2(buf_Stoch_m,buf_Stoch_s,h_Stoch, 4 ); copy_result=copy_result && FillArrayFromBuffer1(buf_WPR,h_WPR, 4 ); if (!copy_result== true ) { Print ( "Ошибка копирования данных" ); return ; } if (FileHandle!= INVALID_HANDLE ) { MqlDateTime tm; TimeCurrent (tm); uint Result= 0 ; Result= FileWrite (FileHandle, TimeToString ( TimeCurrent ()),tm.hour, (mrate[ 1 ].close-mrate[ 2 ].close)/ _Point , buf_AC[ 2 ],buf_AC[ 2 ]-buf_AC[ 3 ], buf_BearsPower[ 2 ],buf_BearsPower[ 2 ]-buf_BearsPower[ 3 ], buf_BullsPower[ 2 ],buf_BullsPower[ 2 ]-buf_BullsPower[ 3 ], buf_AO[ 2 ],buf_AO[ 2 ]-buf_AO[ 3 ], buf_CCI[ 2 ],buf_CCI[ 2 ]-buf_CCI[ 3 ], buf_DeMarker[ 2 ],buf_DeMarker[ 2 ]-buf_DeMarker[ 3 ], buf_FrAMA[ 2 ],buf_FrAMA[ 2 ]-buf_FrAMA[ 3 ], buf_MACD_m[ 2 ],buf_MACD_m[ 2 ]-buf_MACD_m[ 3 ], buf_MACD_s[ 2 ],buf_MACD_s[ 2 ]-buf_MACD_s[ 3 ], buf_MACD_m[ 2 ]-buf_MACD_s[ 2 ],buf_MACD_m[ 2 ]-buf_MACD_s[ 2 ]-buf_MACD_m[ 3 ]+buf_MACD_s[ 3 ], buf_RSI[ 2 ],buf_RSI[ 2 ]-buf_RSI[ 3 ], buf_RVI_m[ 2 ],buf_RVI_m[ 2 ]-buf_RVI_m[ 3 ], buf_RVI_s[ 2 ],buf_RVI_s[ 2 ]-buf_RVI_s[ 3 ], buf_RVI_m[ 2 ]-buf_RVI_s[ 2 ],buf_RVI_m[ 2 ]-buf_RVI_s[ 2 ]-buf_RVI_m[ 3 ]+buf_RVI_s[ 3 ], buf_Stoch_m[ 2 ],buf_Stoch_m[ 2 ]-buf_Stoch_m[ 3 ], buf_Stoch_s[ 2 ],buf_Stoch_s[ 2 ]-buf_Stoch_s[ 3 ], buf_Stoch_m[ 2 ]-buf_Stoch_s[ 2 ],buf_Stoch_m[ 2 ]-buf_Stoch_s[ 2 ]-buf_Stoch_m[ 3 ]+buf_Stoch_s[ 3 ], buf_WPR[ 2 ],buf_WPR[ 2 ]-buf_WPR[ 3 ]); if (Result== 0 ) { Print ( "При выполнении FileWrite возникла ошибка " , GetLastError ()); ExpertRemove (); } } }

После запуска советника в папке: каталог_данных_терминала/MQL5/Files будет создан файл MasterData.CSV. При запуске советника в тестере он будет располагаться в каталоге каталог_данных_терминала/tester/Agent-127.0.0.1-3000/MQL5/Files. Полученный файл уже можно загрузить в Statistica.

Пример такого файла приложен в файле MasterData.CSV. Данные были собраны при помощи тестера стратегий на EURUSD на участке с 1 августа 2011 по 1 октября 2011 на периоде H1.

Для загрузки файла в Statistica делаем следующее.

В Statistica откройте File, потом Open, выберите тип файла: Data files и открывайте наш файл.



В окне Text File Import Type оставьте Delimited и нажмите OK.

В открывшемся окне включите подчеркнутые пункты.



В поле Decimal separator character нужно обязательно поставить точку независимо от того, есть она там уже или нет.





Рис. 1. Импорт файла в Statistica

Нажмите OK, получаем таблицу с нашими данными.





Рис. 2. База данных в Statistica

Теперь создадим группирующую переменную на основе переменной Price.

Определим четыре группы на основании того, куда пошла цена:

Вниз более 200 пунктов; Вниз менее 200 пунктов; Вверх менее 200 пунктов; Вверх более 200 пунктов.

Чтобы добавить новую переменную, щелкните правой кнопкой мыши на заголовке столбика AC и выберите Add Variable.