트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 1068

 
FxTrader562 :
참고로 저는 1000개 기능을 사용하려고 하고 있는데 현재 1시간 교육이 진행 중입니다..

1개의 에이전트 CRLAgents만 설정할 수 있습니다. *ag1=new CRLAgents("RlExp1iter", 1,100,50 , regularize,learn);


그리고 라이브러리 세트에서 #define _models 1

그래서 그것은 빠를 것이다

 
막심 드미트리예프스키 :

각 예측 변수에 대해 다른 값을 사용할 수 있는지 확인합니다. 간단한 예일 뿐이며 모든 닫기 값 = 1개의 다른 예측 변수 값

따라서 숫자 100 또는 1000 또는 500 등은 코드 copyclose 와 Declaration.right 모두에서 동일해야 합니다.

 
FxTrader562 :

따라서 숫자 100 또는 1000 또는 500 등은 코드 copyclose와 Declaration.right 모두에서 동일해야 합니다.

 
막심 드미트리예프스키 :

알겠습니다. 하지만 현재 샘플 코드와 구현에서는 훈련 중에 정확히 어떤 일이 일어나고 있는지, 에이전트와 모델의 차이점은 무엇인지 잘 모르겠습니다. :))

나는 당신이 그것을 출판할 때 당신의 기사에서 이것을 설명하기를 바랍니다. 에이전트가 하는 일과 모델이 커널 을 사용하여 하는 일을 의미합니다 ...

 
FxTrader562 :

알겠습니다. 하지만 현재 샘플 코드와 구현에서는 훈련 중에 정확히 어떤 일이 일어나고 있는지, 에이전트와 모델의 차이점은 무엇인지 잘 모르겠습니다. :))

나는 당신이 그것을 출판할 때 당신의 기사에서 이것을 설명하기를 바랍니다. 에이전트가 하는 일과 모델이 커널 을 사용하여 하는 일을 의미합니다 ...

모든 RL 에이전트는 고유한 예측 변수를 가질 수 있으며 모든 에이전트의 평균 결과

모델 수 - cos를 사용한 oeature 변환의 반복 횟수. 우리가 gdmh를 만들기 때문에 지금은 잊어 버리십시오.

 
막심 드미트리예프스키 :

모든 RL 에이전트는 고유한 예측 변수를 가질 수 있으며 모든 에이전트의 평균 결과

모델 수 - cos를 사용한 oeature 변환의 반복 횟수. 우리가 gdmh를 만들기 때문에 지금 그것에 대해 잊어 버리십시오.

네, 맞습니다.. GDMH를 사용해 보고 진행 상황이나 구현이 막히면 알려주십시오. 어쨌든 마침내 LIVE 결과를 보고 알고리즘에 대한 몇 가지 결론을 내릴 수 있기 때문입니다. 하지만 GDMH의 알고리즘을 살펴보면 매우 유망하다..

그건 그렇고, 최적화 및 훈련 공식의 경우 자연 로그를 사용하십시오. 내 경험상, 지수의 Mathpow() 를 사용하면 솔루션이 다소 빨리 수렴되는 것 같습니다.

 
FxTrader562 :

네, 맞습니다.. GDMH를 사용해 보고 진행 상황이나 구현이 막히면 알려주십시오. 어쨌든 마침내 LIVE 결과를 보고 알고리즘에 대한 몇 가지 결론을 내릴 수 있기 때문입니다. 하지만 GDMH의 알고리즘을 살펴보면 매우 유망하다..

그건 그렇고, 최적화 및 훈련 공식의 경우 자연 로그를 사용하십시오. 내 경험상, 지수의 Mathpow()를 사용하면 솔루션이 다소 빨리 수렴되는 것 같습니다.

삼각 다항식을 사용할 수도 있습니다. 이것은 실제로 gdmh가 아닌 "재귀적 기능 제거"와 같은 것입니다. 중간 정도)

gdmh는 선형 2차 알고리즘이기 때문에 RDF를 사용합니다.
 
막심 드미트리예프스키 :

삼각 다항식을 사용할 수도 있습니다. 이것은 실제로 gdmh가 아닌 "재귀적 기능 제거"와 같은 것입니다. 중간 정도)

나는 그것에 대해 모른다..나는 이해하기 위해 읽어야한다 :)) ...사실, 나는 GDMH에 대해 아무것도 몰랐고 당신은 어제 나에게 말했고 나는 방금 배우고 코드를 작성했습니다.. 제 생각에는 빠르게 배우고 있습니다 :)))))

내가 말하는 것은 해를 얻기 위해 난수 함수 를 근사할 때 자연 로그 또는 지수를 사용하여 일반적으로 빠르게 수렴할 때입니다. 왜? 그것이 자연 로그 또는 ln 또는 exponential() 또는 e의 정의와 목적이기 때문입니다.

다음은 내가 참조하는 예제 코드입니다.

더블 x=MathRandomUniform(0,1,unierr);

이중 가능성 = 1/(1+exp(MathPow(x,3)));

GDMH를 어느 정도 이해하지만... RDF는 여전히 100% 명확하지 않습니다. RDF 대신 몬테카를로를 구현하려고 했지만 RDF로 할 수 있다면 몬테카를로의 사용을 볼 수 없습니다. 몬테카를로와 RDF 중 어느 것이 더 낫다고 생각하십니까?

그러나 나는 이 알고리즘에서 내가 기대하는 것을 요약할 것입니다.

1. 지표 또는 종가를 가져와 m개의 작은 조각으로 나누고 교육 중에 다항식 또는 근사 함수를 생성합니다.

2. 거래에서 실행할 때 모든 촛불에 대해 과거 교육 데이터를 확인하고 현재 가격과 일치하는 다항식 조각을 찾고 다음에 일어날 일을 예측하고 반복해야 합니다.

 
FxTrader562 :

나는 그것에 대해 잘 모릅니다.. 이해하려면 읽어야합니다 :))

내가 말하는 것은 해를 얻기 위해 난수 함수 를 근사할 때 자연 로그 또는 지수를 사용하여 일반적으로 빠르게 수렴할 때입니다. 왜? 그것이 자연 로그 또는 ln 또는 exponential() 또는 e의 정의와 목적이기 때문입니다.

다음은 내가 참조하는 예제 코드입니다.

더블 x=MathRandomUniform(0,1,unierr);

이중 가능성 = 1/(1+exp(MathPow(x,3)));

GDMH를 어느 정도 이해하지만... RDF는 여전히 100% 명확하지 않습니다. RDF 대신 몬테카를로를 구현하려고 했지만 RDF로 할 수 있다면 몬테카를로의 사용을 볼 수 없습니다. 몬테카를로와 RDF 중 어느 것이 더 낫다고 생각하십니까?

그러나 나는 이 알고리즘에서 내가 기대하는 것을 요약할 것입니다.

1. 지표 또는 종가를 가져와 m개의 작은 조각으로 나누고 교육 중에 다항식 또는 근사 함수를 생성합니다.

2. 거래에서 실행할 때 모든 촛불에 대해 과거 교육 데이터를 확인하고 현재 가격과 일치하는 다항식 조각을 찾고 다음에 일어날 일을 예측하고 반복해야 합니다.

RDF는 에이전트의 폴리시를 직접 근사하는 반면 몬테 카를로 또는 TD 및 Markov 체인을 사용한 q 학습은 너무 많은 반복으로 수행하므로 훨씬 더 오래 걸릴 수 있습니다.

1.2 예, 절대적으로 맞습니다.

 
막심 드미트리예프스키 :

RDF는 에이전트의 폴리시를 직접 근사하는 반면 몬테 카를로 또는 TD를 사용한 q-러닝은 너무 많은 반복으로 수행하므로 훨씬 더 오래 걸릴 수 있습니다.

1.2 예, 절대적으로 맞습니다.

그래서 당신은 RDF가 Monte carlo보다 더 좋고 빠르다는 것을 의미합니다. 이는 캔들 마감 시 즉각적인 거래 결정에 확실히 필요합니다....따라서 우리는 forex 버전을 만드는 올바른 길에 있습니다.

"ALPHA ZERO"의...보자:))))))))))

사유: