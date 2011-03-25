Вся теория вероятности зиждется на практике нежелательности.

(Леонид Сухоруков)

Введение

По роду своей деятельности трейдер вынужден очень часто сталкиваться с такими категориями, как вероятность и случайность. На другом полюсе относительно случайности находится такое понятие, как "закономерность". Удивительно, но в силу общефилософских законов, случайность, как правило, перерастает в закономерность. Об обратном пока говорить не будем. В общем, соотношение случайность-закономерность является ключевым, так как оно, в контексте рынка, непосредственно влияет на размер получаемой трейдером прибыли.



В данной статье я попытаюсь рассказать о теоретических базовых инструментах, которые в дальнейшем помогут находить некоторые рыночные закономерности.





1. Распределения, сущность, виды

Итак, для описания некоторой случайной величины нам потребуется одномерное статистическое распределение вероятностей. Оно будет описывать некоторую выборку случайных величин по определенному закону, т.е., чтобы применить какой-либо закон распределения, нам потребуется некоторое множество случайных величин.

Зачем нам анализировать [теоретические] распределения? С их помощью несложно выявлять закономерности изменения частот в зависимости от значений варьирующего признака. Кроме того, можно получить некоторые статистические параметры нужного распределения.

Что касается видов вероятностных распределений, то в специализированной литературе чаще всего принято разделять семейство распределений на непрерывные и дискретные, в зависимости от типа множества случайных величин. Однако, существуют и другие классификации, например, по таким критериям, как: симметричность кривой распределения f(x) относительно прямой x=x0, параметр сдвига, количество мод, интервал случайной величины и пр.

Есть несколько способов, позволяющих задать нам закон распределения. Среди них нужно отметить наиболее популярные:











2. Теоретические распределения вероятностей

Итак, давайте в рамках MQL5 попробуем создать классы, описывающие статистические распределения. Кроме того, я хотел добавить, что в специализированной литературе есть много примеров кода, написанного на С++, который можно успешно применить для MQL5 кодирования. В общем, я не стал изобретать колесо, в некоторых случаях пользовался наработками С++ кода.



Самая большая сложность, с которой столкнулся, заключалась в отсутствии множественного наследования в MQL5. Поэтому сложные классовые иерархии использовать не удалось. Самым оптимальным источником в плане С++ кода стала книга Numerical Recipes: The Art of Scientific Computing [2], откуда было заимствовано мною большинство функций. Чаще всего, их приходилось дорабатывать под нужды MQL5.

2.1.1 Нормальное распределение

Традиционно, начнем с нормального распределения.

Нормальное распределение, также называемое гауссовским распределением или распределением Гаусса — распределение вероятностей, которое задается функцией плотности распределения:

где параметр μ — среднее значение (математическое ожидание) случайной величины и указывает координату максимума кривой плотности распределения, а σ² — дисперсия.







Рисунок 1. Плотность нормального распределения Nor(0,1)



Оно имеет следующую нотацию: X ~ Nor(μ, σ2), где:

X - это случайная величина, выбранная из нормального распределения Nor;

μ - параметр среднего (-∞ ≤ μ ≤ +∞);



σ - параметр дисперсии (0<σ).



Допустимый диапазон случайной величины X: -∞ ≤ X ≤ +∞.

Формулы, использованные в статье, могут отличаться от аналогичных из прочих источников. Иногда такое различие математически непринципиально. В некоторых случаях оно обусловлено различной параметризацией.



Нормальное распределение играет большую роль в статистике, т.к. оно отражает закономерность, возникающую при взаимодействии множества случайных причин, ни одна из которых не имеет превалирующего влияния. И хотя нормальное распределение - это большая редкость на финансовых рынках, тем не менее, важно сравнивать с ним эмпирические распределения для выяснения меры и характера отклонения их от нормального.

Определим класс CNormaldist для нормального распределения следующим образом:

class CNormaldist : CErf { public : double mu, sig; void CNormaldist() { mu= 0.0 ;sig= 1.0 ; if (sig<= 0 .) Alert ( "bad sig in Normal Distribution!" ); } double pdf( double x) { return ( 0.398942280401432678 /sig)* exp (- 0.5 * pow ((x-mu)/sig, 2 )); } double cdf( double x) { return 0.5 *erfc(- 0.707106781186547524 *(x-mu)/sig); } double invcdf( double p) { if (!(p> 0 . && p< 1 .)) Alert ( "bad p in Normal Distribution!" ); return - 1.41421356237309505 *sig*inverfc( 2 .*p)+mu; } double sf( double x) { return 1 -cdf(x); } };

Как можно заметить, класс CNormaldist является производным классом от базового класса СErf, который определяет в свою очередь класс функции ошибок. Он нам понадобится при расчете некоторых методов класса CNormaldist. Сам класс СErf и вспомогательная функция erfcc выглядят примерно так:

class CErf { public : int ncof; double cof[ 28 ]; void CErf() { int Ncof= 28 ; double Cof[ 28 ]= { - 1.3026537197817094 , 6.4196979235649026 e- 1 , 1.9476473204185836 e- 2 ,- 9.561514786808631 e- 3 ,- 9.46595344482036 e- 4 , 3.66839497852761 e- 4 , 4.2523324806907 e- 5 ,- 2.0278578112534 e- 5 , - 1.624290004647 e- 6 , 1.303655835580 e- 6 , 1.5626441722 e- 8 ,- 8.5238095915 e- 8 , 6.529054439 e- 9 , 5.059343495 e- 9 ,- 9.91364156 e- 10 ,- 2.27365122 e- 10 , 9.6467911 e- 11 , 2.394038 e- 12 ,- 6.886027 e- 12 , 8.94487 e- 13 , 3.13092 e- 13 , - 1.12708 e- 13 , 3.81 e- 16 , 7.106 e- 15 ,- 1.523 e- 15 ,- 9.4 e- 17 , 1.21 e- 16 ,- 2.8 e- 17 }; setCErf(Ncof,Cof); }; void setCErf( int Ncof, double &Cof[]) { ncof=Ncof; ArrayCopy (cof,Cof); }; void ~CErf(){}; double erf( double x) { if (x>= 0.0 ) return 1.0 -erfccheb(x); else return erfccheb(-x)- 1.0 ; } double erfc( double x) { if (x>= 0.0 ) return erfccheb(x); else return 2.0 -erfccheb(-x); } double erfccheb( double z) { int j; double t,ty,tmp,d= 0.0 ,dd= 0.0 ; if (z< 0 .) Alert ( "erfccheb requires nonnegative argument!" ); t= 2.0 /( 2.0 +z); ty= 4.0 *t- 2.0 ; for (j=ncof- 1 ;j> 0 ;j--) { tmp=d; d=ty*d-dd+cof[j]; dd=tmp; } return t* exp (-z*z+ 0.5 *(cof[ 0 ]+ty*d)-dd); } double inverfc( double p) { double x,err,t,pp; if (p >= 2.0 ) return - 100.0 ; if (p <= 0.0 ) return 100.0 ; pp=(p< 1.0 )? p : 2.0 -p; t = sqrt (- 2 .* log (pp/ 2.0 )); x = - 0.70711 *(( 2.30753 +t* 0.27061 )/( 1.0 +t*( 0.99229 +t* 0.04481 )) - t); for ( int j= 0 ;j< 2 ;j++) { err=erfc(x)-pp; x+=err/( M_2_SQRTPI * exp (- pow (x, 2 ))-x*err); } return (p< 1.0 ? x : -x); } double inverf( double p) { return inverfc( 1.0 -p);} }; double erfcc( const double x) { double t,z= fabs (x),ans; t= 2 ./( 2.0 +z); ans=t* exp (-z*z- 1.26551223 +t*( 1.00002368 +t*( 0.37409196 +t*( 0.09678418 + t*(- 0.18628806 +t*( 0.27886807 +t*(- 1.13520398 +t*( 1.48851587 + t*(- 0.82215223 +t* 0.17087277 ))))))))); return (x>= 0.0 ? ans : 2.0 -ans); }





2.1.2 Логнормальное распределение

Теперь давайте рассмотрим логнормальное распределение.

Логнормальное распределение в теории вероятностей — это двухпараметрическое семейство абсолютно непрерывных распределений. Если случайная величина имеет логнормальное распределение, то ее логарифм имеет нормальное распределение.

где μ - параметр сдвига (0<μ ), а σ - масштабный параметр (0<σ).





Рисунок 2. Плотность логнормального распределения Logn(0,1)

Оно имеет следующую нотацию: X ~ Logn(μ, σ2), где:

X - это случайная величина, выбранная из логнормального распределения Logn;

μ - параметр сдвига (0<μ );



σ - масштабный параметр (0<σ).



Допустимый диапазон случайной величины X: 0 ≤ X ≤ +∞.

Создадим класс CLognormaldist, описывающий логнормальное распределение. Он будет представлен следующим образом:

class CLognormaldist : CErf { public : double mu, sig; void CLognormaldist() { mu= 0.0 ;sig= 1.0 ; if (sig<= 0 .) Alert ( "bad sig in Lognormal Distribution!" ); } double pdf( double x) { if (x< 0 .) Alert ( "bad x in Lognormal Distribution!" ); if (x== 0 .) return 0 .; return ( 0.398942280401432678 /(sig*x))* exp (- 0.5 * pow (( log (x)-mu)/sig, 2 )); } double cdf( double x) { if (x< 0 .) Alert ( "bad x in Lognormal Distribution!" ); if (x== 0 .) return 0 .; return 0.5 *erfc(- 0.707106781186547524 *( log (x)-mu)/sig); } double invcdf( double p) { if (!(p> 0 . && p< 1 .)) Alert ( "bad p in Lognormal Distribution!" ); return exp (- 1.41421356237309505 *sig*inverfc( 2 .*p)+mu); } double sf( double x) { return 1 -cdf(x); } };

Как можно заметить, логнормальное распределение мало чем отличается от нормального. Разница в том, что параметр x заменен на log(x).





2.1.3 Распределение Коши

Распределе́ние Коши́ в теории вероятностей (также называемое в физике распределе́нием Ло́ренца и распределе́нием Бре́йта — Ви́гнера) — класс абсолютно непрерывных распределений. Случайная величина, имеющая распределение Коши, является стандартным примером величины, не имеющей математического ожидания и дисперсии. Плотность имеет вид:



где μ - параметр сдвига (-∞ ≤ μ ≤ +∞ ), а σ - масштабный параметр (0<σ).

Распределение Коши имеет следующую нотацию: X ~ Cau(μ, σ), где:

X - это случайная величина, выбранная из распределения Коши Cau;

μ - параметр сдвига (-∞ ≤ μ ≤ +∞ );



σ - масштабный параметр (0<σ).



Допустимый диапазон случайной величины X: -∞ ≤ X ≤ +∞.





Рисунок 3. Плотность распределения Коши Cau(0,1)

В MQL5 формате, созданное с помощью класса CCauchydist, оно выглядит таким образом:

class CCauchydist { public : double mu, sig; void CCauchydist() { mu= 0.0 ;sig= 1.0 ; if (sig<= 0 .) Alert ( "bad sig in Cauchy Distribution!" ); } double pdf( double x) { return 0.318309886183790671 /(sig*( 1 .+ pow ((x-mu)/sig, 2 ))); } double cdf( double x) { return 0.5 + 0.318309886183790671 *atan2(x-mu,sig); } double invcdf( double p) { if (!(p> 0 . && p< 1 .)) Alert ( "bad p in Cauchy Distribution!" ); return mu+sig* tan ( M_PI *(p- 0.5 )); } double sf( double x) { return 1 -cdf(x); } };

Здесь нужно отметить, что используется функция atan2(), которая возвращает главное значение арктангенса, выраженное в радианах:

double atan2( double y, double x) { double a; if ( fabs (x)> fabs (y)) a= atan (y/x); else { a= atan (x/y); if (a< 0 .) a=- 1 .* M_PI_2 -a; else a= M_PI_2 -a; } if (x< 0 .) { if (y< 0 .) a=a- M_PI ; else a=a+ M_PI ; } return a; }





2.1.4 Гиперболическое секанс распределение

Гиперболическое секанс распределение заинтересует тех, кто анализирует финансовые ряды.

Гиперболическое секанс распределение в теории вероятностей и статистике является непрерывным вероятностным распределением, чья функция плотности вероятности и характеристическая функция пропорциональны функции гиперболического секанса. Плотность задаётся согласно формуле:

где μ - параметр сдвига (-∞ ≤ μ ≤ +∞ ), а σ - масштабный параметр (0<σ).





Рисунок 4. Плотность гиперболического секанс распределения HS(0,1)

Оно имеет следующую нотацию: X ~ HS(μ, σ), где:

X - это случайная величина;

μ - параметр сдвига (-∞ ≤ μ ≤ +∞ );



σ - масштабный параметр (0<σ).



Допустимый диапазон случайной величины X: -∞ ≤ X ≤ +∞.

Опишем его следующим образом посредством класса CHypersecdist:

class CHypersecdist { public : double mu, sig; void CHypersecdist() { mu= 0.0 ;sig= 1.0 ; if (sig<= 0 .) Alert ( "bad sig in Hyperbolic Secant Distribution!" ); } double pdf( double x) { return sech(( M_PI *(x-mu))/( 2 *sig))/ 2 *sig; } double cdf( double x) { return 2 / M_PI * atan ( exp (( M_PI *(x-mu)/( 2 *sig)))); } double invcdf( double p) { if (!(p> 0 . && p< 1 .)) Alert ( "bad p in Hyperbolic Secant Distribution!" ); return (mu+( 2.0 *sig/ M_PI * log ( tan ( M_PI / 2.0 *p)))); } double sf( double x) { return 1 -cdf(x); } };

Нетрудно заметить, что это распределение получило свое название от функции гиперболического секанса, которого пропорциональна первой.

Функция гиперболического секанса sech выглядит так:

//+------------------------------------------------------------------+ //| Hyperbolic Secant Function | //+------------------------------------------------------------------+ double sech( double x) { return 2 /( pow ( M_E ,x)+ pow ( M_E ,-x)); }





2.1.5 Распределение Стьюдента



Важным распределением в статистике является распределение Стьюдента.

Распределе́ние Стью́дента в теории вероятностей — это чаще всего однопараметрическое семейство абсолютно непрерывных распределений. Однако, можно считать его и трёхпараметрическим распределением, которое задаётся функцией плотности распределения:

где Г - гамма-функция Эйлера, ν - это параметр формы (ν>0), μ - параметр сдвига (-∞ ≤ μ ≤ +∞ ), σ - масштабный параметр (0<σ).





Рисунок 5. Плотность распределения Стьюдента Stt(1,0,1)

Оно имеет следующую нотацию: t ~ Stt(ν,μ,σ), где:

t - это случайная величина, выбранная из распределения Стьюдента Stt ;

ν - это параметр формы (ν>0)



μ - параметр сдвига (-∞ ≤ μ ≤ +∞ );



σ - масштабный параметр (0<σ).



Допустимый диапазон случайной величины X: -∞ ≤ X ≤ +∞.

Часто, особенно при тестировании гипотез, используется стандартизированное распределение Стьюдента, с параметрами μ=0 и σ=1. Таким образом, оно превращается в однопараметрическое распределение с параметром ν.



Это распределение используют при оценивании математического ожидания, прогнозного значения и других характеристик с помощью доверительных интервалов, по проверке гипотез о значениях математических ожиданий, коэффициентов регрессионной зависимости, гипотез однородности выборок и т.д.

Представим его классом CStudenttdist:

class CStudenttdist : CBeta { public : int nu; double mu, sig, np, fac; void CStudenttdist() { int Nu= 1 ; double Mu= 0.0 ,Sig= 1.0 ; setCStudenttdist(Nu,Mu,Sig); } void setCStudenttdist( int Nu, double Mu, double Sig) { nu=Nu; mu=Mu; sig=Sig; if (sig<= 0 . || nu<= 0 .) Alert ( "bad sig,nu in Student-t Distribution!" ); np= 0.5 *(nu+ 1 .); fac=gammln(np)-gammln( 0.5 *nu); } double pdf( double x) { return exp (-np* log ( 1 .+ pow ((x-mu)/sig, 2 .)/nu)+fac)/( sqrt ( M_PI *nu)*sig); } double cdf( double t) { double p= 0.5 *betai( 0.5 *nu, 0.5 ,nu/(nu+ pow ((t-mu)/sig, 2 ))); if (t>=mu) return 1 .-p; else return p; } double invcdf( double p) { if (p<= 0 . || p>= 1 .) Alert ( "bad p in Student-t Distribution!" ); double x=invbetai( 2 .* fmin (p, 1 .-p), 0.5 *nu, 0.5 ); x=sig* sqrt (nu*( 1 .-x)/x); return (p>= 0.5 ? mu+x : mu-x); } double sf( double x) { return 1 -cdf(x); } double aa( double t) { if (t < 0 .) Alert ( "bad t in Student-t Distribution!" ); return 1 .-betai( 0.5 *nu, 0.5 ,nu/(nu+ pow (t, 2 .))); } double invaa( double p) { if (!(p>= 0 . && p< 1 .)) Alert ( "bad p in Student-t Distribution!" ); double x=invbetai( 1 .-p, 0.5 *nu, 0.5 ); return sqrt (nu*( 1 .-x)/x); } };

Из листинга класса CStudenttdist следует, что для него базовым классом является CBeta, который описывает неполную бета-функцию.

Класс CBeta представим следующим образом:

class CBeta : public CGauleg18 { private : int Switch; double Eps,Fpmin; public : void CBeta() { int swi= 3000 ; setCBeta(swi,EPS,FPMIN); }; void setCBeta( int swi, double eps, double fpmin) { Switch=swi; Eps=eps; Fpmin=fpmin; }; double betai( const double a, const double b, const double x); double betacf( const double a, const double b, const double x); double betaiapprox( double a, double b, double x); double invbetai( double p, double a, double b); };

У класса так же есть свой базовый класс CGauleg18, который предоставляет коэффициенты для такого метода численного интегрирования, как квадратура Гаусса - Лежандра.







2.1.6 Логистическое распределение

Следующим для изучения распределением предлагаю считать логистическое.



В теории вероятностей и статистике логистическое распределение является непрерывным вероятностным распределением. Его функция распределения представляет собой логистическую функцию. По форме оно напоминает нормальное распределение, но имеет более тяжёлые хвосты. Плотность распределения: где α - параметр сдвига (-∞ ≤ α ≤ +∞ ), β - масштабный параметр (0<β).





Рисунок 6. Плотность логистического распределения Logi(0,1)

Оно имеет следующую нотацию: X ~ Logi(α,β), где:

X - это случайная величина;

α - параметр сдвига (-∞ ≤ α ≤ +∞ );



α - параметр сдвига (-∞ ≤ α ≤ +∞ ); β - масштабный параметр (0< β ).



Допустимый диапазон случайной величины X: -∞ ≤ X ≤ +∞.

Класс CLogisticdist является реализацией описанного распределения:

class CLogisticdist { public : double alph, bet; void CLogisticdist() { alph= 0.0 ;bet= 1.0 ; if (bet<= 0 .) Alert ( "bad bet in Logistic Distribution!" ); } double pdf( double x) { return exp (-(x-alph)/bet)/(bet* pow ( 1 .+ exp (-(x-alph)/bet), 2 )); } double cdf( double x) { double et= exp (- 1 .* fabs ( 1.81379936423421785 *(x-alph)/bet)); if (x>=alph) return 1 ./( 1 .+et); else return et/( 1 .+et); } double invcdf( double p) { if (p<= 0 . || p>= 1 .) Alert ( "bad p in Logistic Distribution!" ); return alph+ 0.551328895421792049 *bet* log (p/( 1 .-p)); } double sf( double x) { return 1 -cdf(x); } };





2.1.7 Экспоненциальное распределение

Давайте также посмотрим на экспоненциальное распределение случайной величины.

Случайная величина X имеет экспоненциальное распределение с параметром λ > 0, если её плотность имеет вид:

где λ - (λ>0).





Рисунок 7. Плотность экспоненциального распределения Exp(1)

Оно имеет следующую нотацию: X ~ Exp(λ), где:

X - это случайная величина;

λ - ( λ>0 ).



Допустимый диапазон случайной величины X: 0 ≤ X ≤ +∞.

Это распределение интересно тем, что описывает последовательность событий, происходящих одно за другим в какие-то моменты времени. Так, с помощью этого распределения трейдер может анализировать убыточную серию сделок и пр.

В MQL5 коде распределение оформлено классом CExpondist:

class CExpondist { public : double lambda; void CExpondist() { lambda= 1.0 ; if (lambda<= 0 .) Alert ( "bad lambda in Exponential Distribution!" ); } double pdf( double x) { if (x< 0 .) Alert ( "bad x in Exponential Distribution!" ); return lambda* exp (-lambda*x); } double cdf( double x) { if (x < 0 .) Alert ( "bad x in Exponential Distribution!" ); return 1 .- exp (-lambda*x); } double invcdf( double p) { if (p< 0 . || p>= 1 .) Alert ( "bad p in Exponential Distribution!" ); return - log ( 1 .-p)/lambda; } double sf( double x) { return 1 -cdf(x); } };





2.1.8 Гамма-распределение

Следующим видом непрерывного распределения случайной величины я избрал гамма-распределение.

Га́мма распределе́ние в теории вероятностей — это двухпараметрическое семейство абсолютно непрерывных распределений. Если параметр α принимает целое значение, то такое гамма-распределение также называется распределе́нием Эрла́нга. Плотность имеет вид: где Г - гамма-функция Эйлера, α - параметр формы (0<α), β - масштабный параметр (0<β).







Рисунок 8. Плотность гамма-распределения Gam(1,1).

Его нотация выглядит следующим образом: X ~ Gam(α,β), где:

X - это случайная величина;

α - параметр формы (0< α);



α - параметр формы (0< α); β - масштабный параметр (0< β ).



Допустимый диапазон случайной величины X: 0 ≤ X ≤ +∞.

В классовом варианте CGammadist оно представлено так:

class CGammadist : CGamma { public : double alph, bet, fac; void CGammadist() { setCGammadist(); } void setCGammadist( double Alph= 1.0 , double Bet= 1.0 ) { alph=Alph; bet=Bet; if (alph<= 0 . || bet<= 0 .) Alert ( "bad alph,bet in Gamma Distribution!" ); fac=alph* log (bet)-gammln(alph); } double pdf( double x) { if (x<= 0 .) Alert ( "bad x in Gamma Distribution!" ); return exp (-bet*x+(alph- 1 .)* log (x)+fac); } double cdf( double x) { if (x< 0 .) Alert ( "bad x in Gamma Distribution!" ); return gammp(alph,bet*x); } double invcdf( double p) { if (p< 0 . || p>= 1 .) Alert ( "bad p in Gamma Distribution!" ); return invgammp(p,alph)/bet; } double sf( double x) { return 1 -cdf(x); } };

Класс гамма-распределения является производным от класса CGamma, который , который описывает неполную гамма-функцию.



Класс CGamma представим следующим образом:

class CGamma : public CGauleg18 { private : int ASWITCH; double Eps, Fpmin, gln; public : void CGamma() { int aswi= 100 ; setCGamma(aswi,EPS,FPMIN); }; void setCGamma( int aswi, double eps, double fpmin) { ASWITCH=aswi; Eps=eps; Fpmin=fpmin; }; double gammp( const double a, const double x); double gammq( const double a, const double x); void gser( double &gamser, double a, double x, double &gln); double gcf( const double a, const double x); double gammpapprox( double a, double x, int psig); double invgammp( double p, double a); };

Класс CGamma, как и класс CBeta, имеет базовым классом класс CGauleg18.





2.1.9 Бета-распределение

Ну и давайте также представим бета-распределение.



Бе́та распределе́ние в теории вероятностей и статистике — двухпараметрическое семейство абсолютно непрерывных распределений. Используется для описания случайных величин, значения которых ограничены конечным интервалом. Плотность представлена таким образом: где B - бета-функция, α - 1-ый параметр формы (0<α), β - 2-ой параметр формы (0<β).





Рисунок 9. Плотность бета-распределения Beta(0.5,0.5)

Его нотация выглядит следующим образом: X ~ Beta(α,β), где:

X - это случайная величина;

α - 1-ый параметр формы (0< α);



α - 1-ый параметр формы (0< α); β - 2-ой параметр формы (0< β ).



Допустимый диапазон случайной величины X: 0 ≤ X ≤ 1.

Класс CBetadist характеризует это распределение так:

class CBetadist : CBeta { public : double alph, bet, fac; void CBetadist() { setCBetadist(); } void setCBetadist( double Alph= 0.5 , double Bet= 0.5 ) { alph=Alph; bet=Bet; if (alph<= 0 . || bet<= 0 .) Alert ( "bad alph,bet in Beta Distribution!" ); fac=gammln(alph+bet)-gammln(alph)-gammln(bet); } double pdf( double x) { if (x<= 0 . || x>= 1 .) Alert ( "bad x in Beta Distribution!" ); return exp ((alph- 1 .)* log (x)+(bet- 1 .)* log ( 1 .-x)+fac); } double cdf( double x) { if (x< 0 . || x> 1 .) Alert ( "bad x in Beta Distribution" ); return betai(alph,bet,x); } double invcdf( double p) { if (p< 0 . || p> 1 .) Alert ( "bad p in Beta Distribution!" ); return invbetai(p,alph,bet); } double sf( double x) { return 1 -cdf(x); } };





2.1.10 Распределение Лапласа

Еще одним интересным непрерывным распределением является распределение Лапласа (двойное экспоненциальное).

Распределе́ние Лапла́са (двойно́е экспоненциа́льное) — в теории вероятностей это непрерывное распределение случайной величины, при котором плотность вероятности есть: где α - параметр сдвига (-∞ ≤ α ≤ +∞ ), β - параметр масштаба (0<β).





Рисунок 10. Плотность распределения Лапласа Lap(0,1)

Оно имеет такую нотацию: X ~ Lap(α,β), где:

X - это случайная величина;

α - параметр сдвига (-∞ ≤ α ≤ +∞ );

α ≤ +∞ ); β - параметр масштаба (0< β ).

Допустимый диапазон случайной величины X: -∞ ≤ X ≤ +∞.

Класс CLaplacedist для распределения представим так:

class CLaplacedist { public : double alph; double bet; void CLaplacedist() { alph=. 0 ; bet= 1 .; if (bet<= 0 .) Alert ( "bad bet in Laplace Distribution!" ); } double pdf( double x) { return exp (- fabs ((x-alph)/bet))/ 2 *bet; } double cdf( double x) { double temp; if (x< 0 ) temp= 0.5 * exp (- fabs ((x-alph)/bet)); else temp= 1 .- 0.5 * exp (- fabs ((x-alph)/bet)); return temp; } double invcdf( double p) { double temp; if (p< 0 . || p>= 1 .) Alert ( "bad p in Laplace Distribution!" ); if (p< 0.5 ) temp=bet* log ( 2 *p)+alph; else temp=- 1 .*(bet* log ( 2 *( 1 .-p))+alph); return temp; } double sf( double x) { return 1 -cdf(x); } };

Итак, мы создали с помощью MQL5 кода 10 классов для десяти непрерывных распределений. Помимо этого, были созданы еще классы, которые, можно сказать, явились дополнительными, т.к. возникала необходимость в специфических функциях и методах (например, CBeta и CGamma).

Теперь я предлагаю заняться дискретными распределениями и создать несколько классов для этой категории распределений.





2.2.1 Биномиальное распределение

Давайте начнем с биномиального распределения.

Биномиа́льное распределе́ние в теории вероятностей — распределение количества «успехов» в последовательности из независимых случайных экспериментов, таких что вероятность «успеха» в каждом из них равна . Плотность вероятности задаётся формулой: где (n k) - биномиальный коэффициент, n - число испытаний (0 ≤ n), p - вероятность успеха (0 ≤ p ≤1).





Рисунок 11. Плотность биномиального распределения Bin(100,0.5).

Его нотация выглядит следующим образом: k ~ Bin(n,p), где:

k - это случайная величина;

n - число испытаний (0 ≤ n);

n); p - вероятность успеха (0 ≤ p ≤1 ).

Допустимый диапазон случайной величины X: 0 или 1.

Не наводит вас на мысль диапазон возможных значений случайной величины X? Ведь совокупность выигрышных (1) и проигрышных сделок (0) торговой системы тоже можно анализировать с помощью этого распределения.



Создадим класс СBinomialdist следующим образом:

class CBinomialdist : CBeta { public : int n; double pe, fac; void CBinomialdist() { setCBinomialdist(); } void setCBinomialdist( int N= 100 , double Pe= 0.5 ) { n=N; pe=Pe; if (n<= 0 || pe<= 0 . || pe>= 1 .) Alert ( "bad args in Binomial Distribution!" ); fac=gammln(n+ 1 .); } double pdf( int k) { if (k< 0 ) Alert ( "bad k in Binomial Distribution!" ); if (k>n) return 0 .; return exp (k* log (pe)+(n-k)* log ( 1 .-pe)+fac-gammln(k+ 1 .)-gammln(n-k+ 1 .)); } double cdf( int k) { if (k< 0 ) Alert ( "bad k in Binomial Distribution!" ); if (k== 0 ) return 0 .; if (k>n) return 1 .; return 1 .-betai(( double )k,n-k+ 1 .,pe); } int invcdf( double p) { int k,kl,ku,inc= 1 ; if (p<= 0 . || p>= 1 .) Alert ( "bad p in Binomial Distribution!" ); k= fmax ( 0 , fmin (n,( int )(n*pe))); if (p<cdf(k)) { do { k= fmax (k-inc, 0 ); inc*= 2 ; } while (p<cdf(k)); kl=k; ku=k+inc/ 2 ; } else { do { k= fmin (k+inc,n+ 1 ); inc*= 2 ; } while (p>cdf(k)); ku=k; kl=k-inc/ 2 ; } while (ku-kl> 1 ) { k=(kl+ku)/ 2 ; if (p<cdf(k)) ku=k; else kl=k; } return kl; } double sf( int k) { return 1 .-cdf(k); } };





2.2.2 Распределение Пуассона



Следующим станет распределение Пуассона.



Распределение Пуассона моделирует случайную величину, представляющую собой число событий, произошедших за фиксированное время, при условии, что данные события происходят с некоторой фиксированной средней интенсивностью и независимо друг от друга. Плотность имеет вид: где k! - факториал, λ - параметр положения (0 < λ).







Рисунок 12. Плотность распределения Пуассона Pois(10).

Его нотация выглядит следующим образом: k ~ Pois(λ), где:

k - это случайная величина;

λ - параметр положения (0 < λ).

Допустимый диапазон случайной величины X: 0 ≤ X ≤ +∞.

Распределение Пуассона описывает "закон редких событий", что является важным моментом при определении степени риска.



Классом для распределения послужит CPoissondist:

class CPoissondist : CGamma { public : double lambda; void CPoissondist() { lambda= 15 .; if (lambda<= 0 .) Alert ( "bad lambda in Poisson Distribution!" ); } double pdf( int n) { if (n< 0 ) Alert ( "bad n in Poisson Distribution!" ); return exp (-lambda+n* log (lambda)-gammln(n+ 1 .)); } double cdf( int n) { if (n< 0 ) Alert ( "bad n in Poisson Distribution!" ); if (n== 0 ) return 0 .; return gammq(( double )n,lambda); } int invcdf( double p) { int n,nl,nu,inc= 1 ; if (p<= 0 . || p>= 1 .) Alert ( "bad p in Poisson Distribution!" ); if (p< exp (-lambda)) return 0 ; n=( int ) fmax ( sqrt (lambda), 5 .); if (p<cdf(n)) { do { n= fmax (n-inc, 0 ); inc*= 2 ; } while (p<cdf(n)); nl=n; nu=n+inc/ 2 ; } else { do { n+=inc; inc*= 2 ; } while (p>cdf(n)); nu=n; nl=n-inc/ 2 ; } while (nu-nl> 1 ) { n=(nl+nu)/ 2 ; if (p<cdf(n)) nu=n; else nl=n; } return nl; } double sf( int n) { return 1 .-cdf(n); } };

Естественно, в рамках одной статьи невозможно рассмотреть все статистические распределения, да и наверное, в этом нет необходимости. По желанию пользователь может расширить представленную галерею распределений. Созданные распределения находятся в файле Distribution_class.mqh.







3. Создание графиков распределений

Теперь предлагаю посмотреть, как мы можем использовать для дальнейшей работы наши созданные для распределений классы.



Тут я снова обратился к ООП и написал класс CDistributionFigure, который обрабатывает распределения определенных пользователем параметров и выводит его на экран средствами, описанными в статье "Графики и диаграммы в формате HTML".



class CDistributionFigure { private : Dist_type type; Dist_mode mode; double x; double x11; double x12; int d; double st; public : double xAr[]; double p1[]; void CDistributionFigure(); void setDistribution(Dist_type Type,Dist_mode Mode, double X11, double X12, double St); void calculateDistribution( double nn, double mm, double ss); void filesave(); };

Реализацию пропускаю. Отмечу, что в классе есть такие члены-данные, как type и mode, относящиеся к типам Dist_type и Dist_mode соответственно. Эти типы являются перечислениями изучаемых распределений и их видов.

Итак, попробуем наконец-то создать график какого-нибудь распределения.



Для непрерывных распределений я написал скрипт continuousDistribution.mq5, основные строки которого выглядят так:

input Dist_type dist; input Dist_mode distM; input int nn= 1 ; input double mm= 0 ., ss= 1 .; void OnStart () { double Xx1, //левый предел Xx2, //правый предел st= 0.05 ; //шаг if (dist== 0 ) { Xx1=mm- 5.0 *ss/ 1.25 ; Xx2=mm+ 5.0 *ss/ 1.25 ; } if (dist== 2 || dist== 4 || dist== 5 ) { Xx1=mm- 5.0 *ss/ 0.35 ; Xx2=mm+ 5.0 *ss/ 0.35 ; } else if (dist== 1 || dist== 6 || dist== 7 ) { Xx1= 0.001 ; Xx2= 7.75 ; } else if (dist== 8 ) { Xx1= 0.0001 ; Xx2= 0.9999 ; st= 0.001 ; } else { Xx1=mm- 5.0 *ss; Xx2=mm+ 5.0 *ss; } CDistributionFigure F; //создание экземпляра класса CDistributionFigure F.setDistribution(dist,distM,Xx1,Xx2,st); F.calculateDistribution(nn,mm,ss); F.filesave(); string path= TerminalInfoString ( TERMINAL_DATA_PATH )+ "\\MQL5\\Files\\Distribution_function.htm" ; ShellExecuteW( NULL , "open" ,path, NULL , NULL , 1 ); }

Для дискретных распределений написан скрипт discreteDistribution.mq5.

Я запустил скрипт со стандартными параметрами для распределения Cauchy и получил следующий график, представленный на ролике ниже.













Заключение

В статье были представлены и закодированы в формате MQL5 некоторые теоретические распределения случайной величины. Считаю, что сама рыночная торговля, а значит, и работа торговой системы должна быть основана на фундаментальных вероятностных законах.



Надеюсь, что статья принесет практическую пользу для заинтересованных читателей. Я, со своей стороны, собираюсь развить эту тему и на практических примерах продемонстрировать, каким образом можно использовать статистические распределения вероятностей при анализе вероятностных моделей.





Расположение файлов:

#

Файл

Путь

Описание

1

Distribution_class.mqh

%MetaTrader%\MQL5\Include Галлерея классов распределений

2 DistributionFigure_class.mqh

%MetaTrader%\MQL5\Include

Классы графического отображения распределений

3 continuousDistribution.mq5 %MetaTrader%\MQL5\Scripts Скрипт для создания непрерывного распределения

4

discreteDistribution.mq5

%MetaTrader%\MQL5\Scripts Скрипт для создания дискретного распределения

5

dataDist.txt

%MetaTrader%\MQL5\Files Данные для отображения распределения

6

Distribution_function.htm

%MetaTrader%\MQL5\Files HTML-график непрерывного распределения

7 Distribution_function_discr.htm

%MetaTrader%\MQL5\Files HTML-график дискретного распределения

8 exporting.js

%MetaTrader%\MQL5\Files Java-скрипт для экспорта графика

9 highcharts.js

%MetaTrader%\MQL5\Files JavaScript-библиотека 10 jquery.min.js %MetaTrader%\MQL5\Files JavaScript-библиотека





Литература: