트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 738

 

마이클의 베이스는 평범합니다. 어디서부터 시작해야 하는지를 찾고 있는 사람들에게 좋은 예입니다.

그는 증권 거래소와 같은 몇 가지 좋은 지표를 가지고 있습니다. 이것은 이미 표준 Mashka 및 Rsishka보다 낫습니다. 또한 단순히 뉴런에 모든 것을 밀어 넣는 것이 아니라 다양한 수단을 통해 지표의 중요성을 평가하고 예측에 가장 적합한 지표를 선택합니다. 그런 다음 뉴런이 훈련되지만 단순한 것이 아니라 내장된 과적합 제어가 있습니다. 그리고 이 전체 전략은 워크포워드로 테스터에서 테스트되고 있습니다.

SanSanych는 이 주제의 시작 부분에서 유사한 계획을 설명했으며 마침내 다른 사람이 이에 대해 작업하기로 결정했습니다. 그리고 많은 사람들은 생각하지 않고 뉴런에 더 많은 지표를 집어넣고 싶어합니다.

또한 vtreat 또는 caret를 통해 표시기의 사전 처리를 수행합니다. 그리고 kfold가 있는 더 적절한 뉴런. 그리고 나는 훈련을 위해 더 많은 예를 들 것이고, 나머지 비평가들에 동의합니다.

 

우리는 그것을 알고 있습니다, 형제들!!! 나는 한 번에 모든 사람에게 대답 할 것입니다 ... 모두는 최선을 다해 춤을 추지만 최종 결과는 우리의 분쟁을 해결할 것입니다. 말하자면 결론. 보증금이 증가하기 때문에 나는 여전히 이기고 있습니다. 우리는 내 접근 방식이 올바른 접근 방식 중 하나라는 것을 알고 있습니다.

그건 그렇고, 나는 vtreat이고 순열을 사용하여 중요한 예측 변수 + 트릭을 선택합니다.

BO에 대한 기사에서 이에 대해 자세히 설명합니다.

 
마이클 마르쿠카이테스 :

우리는 그것을 알고 있습니다, 형제들!!! 나는 한 번에 모든 사람에게 대답 할 것입니다 ... 모두는 최선을 다해 춤을 추지만 최종 결과는 우리의 분쟁을 해결할 것입니다. 말하자면 결론. 보증금이 증가하기 때문에 나는 여전히 이기고 있습니다. 우리는 내 접근 방식이 올바른 접근 방식 중 하나라는 것을 알고 있습니다.

그건 그렇고, 나는 vtreat이고 순열을 사용하여 중요한 예측 변수 + 트릭을 선택합니다.

BO에 대한 기사에서 이에 대해 자세히 설명합니다.

위에 당신은 상호 정보에 대해 썼습니다. 그녀는 무엇을 하고 있나요?

 
산산이치 포멘코 :

위에 당신은 상호 정보에 대해 썼습니다. 그녀는 무엇을 하고 있나요?

사용할 모델을 선택할 때 결정적인 기준입니다. 디세트를 준비합니다. 우리는 10번 훈련합니다. 학습 결과가 동일한 10개의 모델을 얻습니다(예: 모든 모델에 대한 교육 오류 수가 동일한 경우). 다음으로 모델의 결과를 이진 형식이 아닌 이중 형식으로 훈련 영역에 저장합니다. 다항식 계산 결과, 우리의 두 배에서는 처음에 고려되기 때문에 ......

다음으로 출력에 대한 다항식의 VI를 고려합니다. 작업 모델은 정확히 VI 인덱스가 출력 엔트로피보다 높거나 대략 0.7보다 큰 모델로 간주됩니다.

VI가 높지만 0.95보다 높지 않은 모델을 선택합니다. 아직 확인은 안해봤지만.... IMHO

 

훈련 샘플의 증가에 대해. 예, 늘릴 수 있지만 네트워크 품질이 저하되어 트랜잭션이 감소합니다. 네트워크는 시간이 지남에 따라 더 오래 작동하기 시작하지만 "모름" 상태의 수가 증가하고 네트워크가 덜 자주 실행되는 것으로 나타났습니다. 이 접근 방식을 사용하면 여러 모델을 훈련하고 병렬로 실행해야 합니다.


게다가, 훈련 기간은 이제 vtreat.R에 의해 지시됩니다. 내 입력으로 다양한 샘플 길이에 대한 입력 세트를 제공합니다. 나는 그가 선택한 최대 입력 변수 수에 대해 최대 훈련 기간을 선택합니다.... 그리고 이상하게도 20개에서 50개 샘플로 회전합니다. 내가 가지고 있는 입력 데이터를 볼 수 있습니다. 당신은 무엇을 할 수 있나요...

 

마이클 마르쿠카이테스 :

...

사용할 모델을 선택할 때 결정적인 기준

...

MO 언어로 번역하려고 합니다.

Mikhail은 분류 모델을 가지고 있지만 이진수 0과 1뿐만 아니라 클래스에 속할 확률(0에서 1까지의 소수)도 결과를 반환할 수 있습니다. 따라서 모델은 분류뿐만 아니라 회귀 메트릭으로도 평가할 수 있습니다. 왜 상호 정보에 선택이 떨어졌는지 모르겠지만 최소 제곱과 상관 관계가 있으므로 정상입니다.

예를 들어 R에서는 다음과 같이 계산할 수 있습니다.
라이브러리(엔트로피)
mi.plugin(rbind(대상, 예측))
여기서 결과는 작을수록 좋습니다.

 
독성 :

물론 통계에서 오차(변동)는 1/sqrt(N)에 비례합니다. 여기서 N은 관측값의 수입니다. 모두 초기 변동에 따라 다릅니다. 많을수록 적합하기 위해 더 많은 관측치가 필요합니다. 5% 분위수에 오류

"이로부터 이익을 얻을 사람을 찾으십시오"((c) V.I. Lenin)

그들은 공개적으로 게시하고 판매하며 쓸모없거나 심지어 유해한 도구만 판매합니다. 명백한 이유로 이 사소한 진실은 항상 기억되어야 합니다. 알고리즘 거래는 웹 디자인이 아니며 일종의 프랜차이즈가 아니며 시장에서 반죽을 직접 기능적으로 철수하는 것입니다. , 개방적이고 쉽게 접근할 수 있는 모든 것, 그러나 광고가 많을수록 선험적으로 우리가 가진 공격적이고 경쟁적인 환경과 같은 정크 또는 사기와 같은 맥락에서 유용하지 않습니다.

음, 네, 상금의 5번째 백분위수와 끝없이 풍부한 공개 도구인 클론다이크.

그리고 최근에 주문에 따라 작성자의 신경망 구성 요소를 만들어야 했습니다. 이 구성 요소는 확인 시 TensorFlow의 힙 DNN을 100배 정도 우회했습니다.

그리고 가장 중요한 것은 복잡한 수학이나 과장된 기술이 없었고 다소 단순했지만 독창적인 솔루션이었습니다.

이러한 배경에서 저자의 Reshetov 개발에 대한 Mikhail의 헌신은 개인적으로 전혀 놀랍지 않습니다.

 
독성 :

그래서 나는 이것에 대해서만 같은 것에 대해 이야기하고 있습니다. 인프라를 통해 40개의 샘플을 가져오면 결과도 보장할 수 없고 4000점도 매우 적습니다. 물론 기사가 아닌 전투 전략에 대해 이야기하지 않는 한.

나는 그러한 경험 법칙을 따릅니다. 새로운 데이터에 대한 고문은 훈련 막대의 10%를 넘지 않을 것입니다. 4000개의 막대에 대해 훈련했다면 400개 이상은 작동하지 않을 것입니다.예를 들어, m15에서 일주일을 거래하려면 훈련을 위해 최소 4800(4*24*5*10, 10주)의 이력 막대가 필요합니다. .

언젠가 MT5에서 Expert Advisors에 병렬 스트림을 도입하여 백그라운드에서 Expert Advisor를 지속적으로 최적화할 수 있습니다. 그러면 매우 적은 수의 막대로 흥미로운 실험을 할 수 있습니다. 아마도 40개 막대에서 할 수 있을 것입니다. 비록 나는 할 수 없습니다. 훈련 예제가 1000개 미만이더라도 뉴런의 결과는 추세에 치우쳐지고 바뀌는 즉시 모든 것이 나쁩니다.

 
마이클 마르쿠카이테스 :

훈련 샘플의 증가에 대해. 예, 늘릴 수 있지만 네트워크 품질이 저하되어 트랜잭션이 감소합니다. 네트워크는 시간이 지남에 따라 더 오래 작동하기 시작하지만 "모름" 상태의 수가 증가하고 네트워크가 덜 자주 실행되는 것으로 나타났습니다. 이 접근 방식을 사용하면 여러 모델을 훈련하고 병렬로 실행해야 합니다.


특히 훈련 기간이 이제 vtreat.R에 의해 지시되기 때문에. 내 입력으로 다양한 샘플 길이에 대한 입력 세트를 제공합니다. 나는 그가 선택한 최대 입력 변수 수에 대해 최대 훈련 기간을 선택합니다.... 그리고 이상하게도 20개에서 50개 샘플로 회전합니다. 내가 가지고 있는 입력 데이터를 볼 수 있습니다. 당신은 무엇을 할 수 있나요...

네트워크의 품질이 떨어지지는 않지만 과적합은 줄어들고 모델은 모든 화려함과 빈곤함 속에서 나타날 것입니다.

나는 Reshetov 뉴런을 3개월 동안 1000개 이상의 유능한 기능에 대해 최적화하고 있으며 실제 생활에서는 0으로 작동합니다. 그리고 다른 뉴런은 훨씬 더 잘 최적화됩니다. 그리고 당신은 100개의 거래로 어떤 종류의 게임을 계속 수행합니다. 왜 당신은 바보입니까, 안일함이나 누군가에게 무언가를 증명하기 위해, 당신은 뚫을 수없는 곡선
 

흠.. 좋은 오후에요!)

그리고 "curvafitter"라는 단어는 신경이 쓰이는 것입니까?

사유: