Maxim Dmitrievsky :

God, what is real, we are discussing bandits here

So what have you implemented "Bandit algorithm" in RDF?

Or have you coded anything specifically for the "Bandit" algorithm?

Maxim Dmitrievsky:

задача добиться что бы 2 куска были неотличимы (ошибки те же и т.п.), в этом контексте определение что чем виляет вообще теряет всякий смысл

на самом деле может вы и правы, опыт на реале только может дать объективный ответ в нашем ремесле))

no errors

yes

Actually, it would be really great if you can do some changes here...

which changes

Actually, it would be great if you could change here:

I tried this ... but I didn’t know if I did something wrong:

Please see the code and suggest if we can do something similar to improve the pip expectancy per trade

Better if you change here

```//+------------------------------------------------------------------+
//+------------------------------------------------------------------+
{
if(!random_policy) {
double kerfeatures[];
ArrayResize(kerfeatures,ArrayRange(bestFeatures,0));
ArrayInitialize(kerfeatures,0);

for(int i=0;i<ArraySize(kerfeatures);i++) {
kerfeatures[i] = featuresValues[0]/featuresValues[(int)bestFeatures[i][1]];
}

CLogit::MNLProcess(Lmodel,kerfeatures,Lout);
return Lout[1];
}
else if(rand()/32767.0<0.5) return 0; else return 1;
}```

if(fast MA>slow MA) if(rand()/32767.0<0.8) return 0; else return 1;

if(fast MA<slow MA) if(rand()/32767.0<0.8return 1else return 0;

or something like this, any indicator as filter

Maxim Dmitrievsky :

Better if you change here

if (fast MA > slow MA)  if ( rand () / 32767.0 < 0.8 ) return 0 ; else return 1 ;

if (fast MA < slow MA)  if ( rand () / 32767.0 < 0.8 return 1 else return 0 ;

or something like this, any indicator as filter

Well, I tried to change here..but messing up anything with "Signals" messes up the whole results..

Indicator I didn't try yet ..

but I tried " if  rand  () /  32767.0  0.8  "..t hen, it showed random behaviour, because we need to change here also:

if you filter this with MA, it means he will sample buy or sell signals with 0.8 probability when up or dwn trend, so trades will much longer, dont need to change signals filter

I will think how to improve reward func. Tomorrow )
Maxim Dmitrievsky:

Better if you change here

if(fast MA>slow MA) if(rand()/32767.0<0.8) return 0; else return 1;

if(fast MA<slow MA) if(rand()/32767.0<0.8return 1else return 0;

or something like this, any indicator as filter

похоже делаем сходные вещи (или пришли к близким выводам)

примерно "если детерминированные алгоритмы проигрывают в условиях недостатка информации (на совершенствующимся рынке), то можно дать волю вероятностям" :-)

Maxim Kuznetsov:

похоже делаем сходные вещи (или пришли к близким выводам)

примерно "если детерминированные алгоритмы проигрывают в условиях недостатка информации (на совершенствующимся рынке), то можно дать волю вероятностям" :-)

тут маленько другое (подготовка размеченных данных для обучения НС), но похоже да

вопрос в том, как псевдослучайным образом лучше размечать данные

