트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 186

 
유리 레셰토프 :

아이스크림 때문이다.

죄송하지만 질문이 무엇입니까, 그러한 답변입니다.

저것들. 나는 유머를 이해하지 못했습니다. 결정을 내리기 위해서는 분류기의 출력 값을 임계값과 같은 것과 비교해야 하기 때문입니다. 그리고 문제의 공식화에서 어떤 이유로 비교 가능한 값이 알려지지 않고 분류에 필요하지 않은 값만 알려지기 때문에 설명을하는 것이 좋을 것입니다.

우리는 운전했다.
 

나는 여러 날 계산을 완료했습니다(Forex에 대해 6개의 선택된 예측 변수(114개 중) 에 대한 모델).

다음은 제목 사진입니다. 테스트 블록에서 (동일한 측정에 의해) 최고로 선택된 모델에 대한 검증에 대한 회귀 정확도 분포(L1 표준에 따라 계산: 절대 오차 값의 합).

각 상자에는 99개의 값이 포함되어 있으며 각 값은 고유한 유효한 집합에 대한 1 - sum(abs(XY))/sum(abs(X-mean(X))의 메트릭입니다. 물론 R^2의 유사 네..

총 8908개의 모델이 있었습니다... 연구된 모든 기기 및 타겟에 대해.

평균적으로 오류가 0.2% 감소합니다(단독). 하지만 중요한 것은... 각 모델에 대해 고유한 검증 세트가 생성되었습니다.

내가 출판하고 싶은 모든 연구. 다음은 MO 모델 등의 평가입니다. 논리적인 끝까지. 내가 게시하면(MQL이 아님) 여기에서 소통하거나 내 프로필에 게시할 일부 사람들에게 링크를 제공할 것입니다.

그리고 거기도. 실용적인 관점에서 훨씬 더 흥미로운 그림. 테스트 블록(교차 검증 내)과 검증에 대한 모델의 기대 사이의 관계.

여기서 긍정적인 종속성이 중요한지(음의 종속성은 상식에 전혀 맞지 않기 때문에) 유효성 검사에 긍정적인 MO 값이 있는지 여부를 즉시 확인해야 합니다. 글쎄, 당신은 스스로 볼 수 있습니다.

99점은 모델입니다.

 
트레이더 박사 :


글쎄, 이것은 칠면조를 거래하는 순진한 상인의 99 %가 누출되는 이유에 대한 좋은 명확한 예입니다. 창을 이동하면이 점의 혼란도 임의의 방식으로 변형됩니다. 즉, 이것은 단지 소음이고 MO는 그렇지 않습니다. 여기 도와주세요
 
붓는 것도 훌륭하고 시세도 울리면 ... 뇌의 폭발)))
 
독성 :
글쎄, 이것은 순진한 거래자의 99%가 누출되고 있는 이유를 보여주는 좋은 예입니다...
그리고 이 스레드는 거래의 기계 학습이 단지 이론일 뿐이라는 사실을 보여주는 훌륭하고 명확한 예입니다...
 
리버스45 :
그리고 이 스레드는 거래의 기계 학습이 단지 이론일 뿐이라는 사실을 보여주는 훌륭하고 명확한 예입니다...
지점을주의 깊게 살펴보면 지역 주민들이 세 진영으로 나뉩니다.
  1. R 사용자(여기서는 "기생충"이라고 함). 파괴적인 종파 같은 것. 그들은 항상 어떤 패키지를 샅샅이 뒤지며, 오늘은 분류, 내일 회귀, 모레는 일종의 클러스터링 등을 하고 있습니다. 그 활동은 폭풍우가 치는 것처럼 보이지만 어리석은 것은 그들이 무엇을 취하든 모든 것이 삐뚤어지고 비스듬하게 이루어지기 때문에 실패합니다. 이것은 예를 들어 운명, 과적합의 "문제", 시끄러운 예측자 및 Reshetov와 같이 R을 인식하지 못하는 모든 종류의 "무와 나쁜 사람들"에 대한 불만으로 표현됩니다.
  2. R을 사용하지 않는 사람들은 원칙적으로 그들이 성공하는 특정 방향을 선택했습니다. 그들은 운명에 대해 불평하지 않으며 다양한 방법을 사용하지 않습니다. 흩어져 있지 않습니다. 그리고 그들은 결과를 제공하는 일을 하고 선택한 방향으로 천천히 개선합니다.
  3. 불을 바라보고 있다. 때때로 그들은 3센트를 넣지만 종종 부적절합니다.
 
알렉세이 버나코프 :

여러 날 계산을 완료했습니다.

나는 당신의 연구를 따르고 매우 유익합니다. 게시해 주셔서 감사합니다. 그러나 그러한 복잡한 문제를 성공적으로 해결했지만 준비 작업을 건너 뛰고 결과가 망칠 것 같습니다. 즉, 예측 변수 선택을 무시합니다.

114개의 예측 변수를 선택한 다음 어떻게든 6개를 선택하고 모델을 교육한 후 어떤 목표가 더 나은지 결론을 내릴 수 있습니다. 그러나 이 결과는 로컬 최대값일 뿐입니다. 우리는 "eurusd가 앞으로 16개의 막대를 예측하는 것이 더 낫다"라고 전 세계적으로 말할 수 없지만 "114개의 예측 변수 집합: (prev1, pre2, pre3,..) gbm을 사용하여 16개의 막대를 통해 가격 방향을 가장 잘 예측합니다"라고 말할 수 있습니다.

gbm 대신 뉴런을 사용하면 최상의 타겟이 달라집니다. 다른 114개의 예측 변수를 취하면 최상의 목표는 다시 다른 것으로 판명될 것입니다. 114개의 예측 변수는 실험의 전체 후속 과정이 의존하는 매우 중요한 기반이며, 아무런 준비 없이 갑자기 꺼낸 것입니다.

약 6개월 전에 SanSanych는 예측 변수가 포함된 파일을 업로드했습니다. 그들의 특징은 대부분의 덜렁거리는 모델에 작은 오류가 있고 동시에 새 데이터에서 오류가 증가하지 않는다는 것입니다. 모든 세그먼트에서 모델을 훈련하고 나머지 데이터에 대해 oos 테스트를 실행하여 저하된 것이 없음을 확인할 수 있습니다. 이러한 예측 변수와 대상은 매우 연결되어 있어 모델이 막대에서 둘 사이에 가능한 유일한 연결을 찾습니다.
나는 이것을 복제하려고합니다. 저는 10,000개 이상의 소스 예측자(mt5의 다른 매개변수와 지연이 있는 표시자)를 사용하고 대상 열과 가능한 유일한 연결을 갖도록 선택하는 방법을 배웁니다. 내 생각에는 그러한 상호 관련된 예측 변수를 결정하거나 찾는 능력과 목표는 성배에 대한 확실한 총알입니다.

MQL5에는 최근에 필요한 지표 목록을 선택하고 코드가 있는 기성품 전문가가 즉시 생성되면 전문가 생성기가 있어 유전학으로 최적화하기가 매우 쉽습니다. 이러한 Expert Advisor에는 20개의 지표가 있으며 기계 학습 모델은 전혀 없습니다(각 지표에 할당된 중요도 계수만 있음).
목표와 지표가 내 의견으로는 밀접하게 관련되어 있다고 간주되도록 몇 가지 기준을 포함하여 유전적 피트니스 기능에 대한 사용자 정의 코드만 추가했습니다. 다음과 같이 밝혀졌습니다.
(유로 달러 h1)

처음 2/3는 백테스트(샘플)이고 마지막 세 번째는 프론트 테스트(oos)입니다. 거기에서 시간의 2/3가 지나면 배수가 없지만 저울은 oos 테스트를 위해 초기 값으로 재설정됩니다. 그런 빈약한 기능 세트를 갖고 단순히 "예측자와 목표의 의존성에 대한 미완성 기준"을 추가하는 것 - 비록 나쁘기는 하지만 더 이상 소모되지는 않습니다. oo에서 성공적인 거래의 51%. 멋지지 않아? 그러나 20개의 지표가 아닌 20,000개의 지표를 취하고 일종의 기계 학습 모델을 추가하고 mt5 유전학에서 10,000번의 반복 제한을 제거하면 수익성 있는 조언자도 나올 수 있습니다.

 
리버스45 :
그리고 이 스레드는 거래의 기계 학습이 단지 이론일 뿐이라는 사실을 보여주는 훌륭하고 명확한 예입니다...

예, 거래에는 이론이 전혀있을 수 없습니다. 원칙적으로 더 정확하게는 돈을 벌 수 없다는 이론, 효율적인 시장 등 모든 것이 가격, 교환 메커니즘... 최근 다양한 매트 패키지 및 라이브러리 덕분에 사용할 수 있으므로 과학자가 아닌 일반 거래자가 일주일 동안 R-studio 또는 Matlab을 만지작거리며 표준 TA가 그렇게 슬픈지 실제로 수 있습니다.

거래에서 MO가 일반적으로 부분적으로 사실인 "이론일 뿐"이라면 TA는 이론도 아니지만 일반적으로 점성술이나 부두교와 같은 헛소리입니다.

그러나 여기 있는 많은 사람들은 여전히 돈을 버는 것이 가능하다는 것을 알고 있습니다. 효과적인 시장은 단지 신의 뜻에 의한 것이 아니라 일부 사람들이 대부분의 사람들보다 정보를 더 잘 얻고 처리하는 데 능숙하기 때문입니다. 제 생각에 상인에게 가장 중요한 장애물은 이러한 유형의 비즈니스가 단순하다는 환상입니다. 마치 공식 서명을 위해 할머니를 들고 다니는 것처럼 여기 이 포럼에서 "필요하지 않은 강입자 충돌기를 만들려면"이 두 번 이상 들렸습니다...

그리고 여기에 있어야 할 것이 있습니다 ...

 
Dr.Trader :

나는 당신의 연구를 따르고 매우 유익합니다. 게시해 주셔서 감사합니다. 그러나 그러한 복잡한 문제를 성공적으로 해결했지만 준비 작업을 건너 뛰고 결과가 망칠 것 같습니다. 즉, 예측 변수 선택을 무시합니다.

114개의 예측 변수를 선택한 다음 어떻게든 6개를 선택하고 모델을 교육한 후 어떤 목표가 더 나은지 결론을 내릴 수 있습니다. 그러나 이 결과는 로컬 최대값일 뿐입니다. 우리는 "eurusd가 앞으로 16개의 막대를 예측하는 것이 더 낫다"라고 전 세계적으로 말할 수 없지만 "114개의 예측 변수 집합: (prev1, pre2, pre3,..) gbm을 사용하여 16개의 막대를 통해 가격 방향을 가장 잘 예측합니다"라고 말할 수 있습니다.

gbm 대신 뉴런을 사용하면 최상의 타겟이 달라집니다. 다른 114개의 예측 변수를 취하면 최상의 목표는 다시 다른 것으로 판명될 것입니다. 114개의 예측 변수는 실험의 전체 후속 과정이 의존하는 매우 중요한 기반이며, 아무런 준비 없이 갑자기 꺼냈습니다.

약 6개월 전에 SanSanych는 예측 변수가 포함된 파일을 업로드했습니다. 그들의 특징은 대부분의 덜렁거리는 모델에 작은 오류가 있고 동시에 새 데이터에서 오류가 증가하지 않는다는 것입니다. 모든 세그먼트에서 모델을 훈련하고 나머지 데이터에 대해 oos 테스트를 실행하여 저하된 것이 없음을 확인할 수 있습니다. 이러한 예측 변수와 대상은 매우 연결되어 있어 모델이 막대에서 둘 사이에 가능한 유일한 연결을 찾습니다.
나는 이것을 복제하려고합니다. 저는 10,000개 이상의 소스 예측자(mt5의 다른 매개변수와 지연이 있는 표시자)를 사용하고 대상 열과 가능한 유일한 연결을 갖도록 선택하는 방법을 배웁니다. 내 생각에는 그러한 상호 관련된 예측 변수를 결정하거나 찾는 능력과 목표는 성배에 대한 확실한 총알입니다.

MQL5에는 최근에 필요한 지표 목록을 선택하고 코드가 있는 기성품 전문가가 즉시 생성되면 전문가 생성기가 있어 유전학으로 최적화하기가 매우 쉽습니다. 이러한 Expert Advisor에는 20개의 지표가 있으며 기계 학습 모델은 전혀 없습니다(각 지표에 할당된 중요도 계수만 있음).
목표와 지표가 내 의견으로는 밀접하게 관련되어 있다고 간주되도록 몇 가지 기준을 포함하여 유전적 피트니스 기능에 대한 사용자 정의 코드만 추가했습니다. 다음과 같이 밝혀졌습니다.
(유로 달러 h1)

처음 2/3는 백테스트(샘플)이고 마지막 세 번째는 프론트 테스트(oos)입니다. 거기에서 시간의 2/3가 지나면 배수가 없지만 저울은 oos 테스트를 위해 초기 값으로 재설정됩니다. 그런 빈약한 기능 세트를 갖고 단순히 "예측자와 목표의 의존성에 대한 미완성 기준"을 추가하는 것 - 비록 나쁘기는 하지만 더 이상 소모되지는 않습니다. oo에서 성공적인 거래의 51%. 멋지지 않아? 그러나 20개의 지표가 아닌 20,000개의 지표를 취하고 일종의 기계 학습 모델을 추가하고 mt5 유전학에서 10,000번의 반복 제한을 제거하면 수익성 있는 조언자도 나올 수 있습니다.

물론 로컬 결과입니다. 다각화 가능성은 없습니다. 시간 없다. 리소스가 없습니다... 이것이 바로 GBM이 내 예측기에 제공하는 것입니다.

문제는 경험의 재교육된 부분을 결론에 사용하지 않는 것입니다. 그리고 이 지역 결과가 성공적으로 검증된다면 저는 만족할 것입니다.

여기에서 회귀의 품질이 성공적으로 검증되었습니다. 훈련된 모델은 상당히 0이 아닌 예측 품질을 제공합니다. 모델을 선택하는 데 문제가 없습니다.

그리고 MO를 사용하면 거래가 더 어렵습니다. 모든 것을 보여주지는 않았습니다... 검증에 대한 중앙값 MR을 0보다 큰 하위 샘플(기호 대상)이 있습니다... 하지만 작업은 검증과 상관관계가 있는 모델의 꼬리를 가져와 MR을 높이는 것입니다. 하지만 이런 경우도 있을 수 있습니다...

결국 위원회는 미래의 다른 샘플로 구성되고 검증될 것입니다. 물론 몬테카를로를 통해서요.

하지만 예측 변수도 어렵습니다... 설명하는 데 오랜 시간이 걸립니다... 하지만 결론은 99개 모델 각각이 고유한 6개 예측 변수 집합을 사용하여 기호 대상을 서브샘플링한다는 것입니다. 구획에서 매우 다양한 모델을 얻을 수 있습니다(또한 다른 데이터에서 학습함). 그러나 일반적으로 114개 각각은 어딘가에 관련되어 있습니다.

그리고 잊지 마세요. 모델의 낙관적인 선택에 대해. 모든 선택은 추가로 검증되어야 합니다. 즉, 이 그림을 어떻게 선택했는지 이해가 되지 않습니까? IS 또는 OS에서 최상의 결과를 얻으려면? 그냥 질문입니다. 그러나 "연구"의 많은 결과는 이 질문에 대한 답이 없다는 점에서 죄를 짓습니다.
 

주어진 시간에 거래를 개시하고 주어진 시간에 이 거래를 마감할 어드바이저(로봇)를 어디에서 얻을 수 있는지 조언합니다.


예를 들어, 나는 12:59에 거래를 시작했고 결과에 관계없이 손익-어쨌든 13:59에 거래를 마감했을 것입니다.

사유: