트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 952

 
박사 상인 :

마지막 파일의 경우 나무와 함께 나에게 일어났습니다.

2016년, 훈련


y_pred

y_true -하나 0 하나
-하나 13392 38844 4472
0 10803 76714 6029
하나 7413 37678 7415


2015년, 테스트:


y_pred

y_true -하나 0 하나
-하나 9552 39262 5429
0 11495 72131 7509
하나 8581 40377 6835

"-1"을 예측할 때: -1은 실제로 1보다 약간 더 자주 발생합니다. 그러나 0이 가장 일반적이고 아마도 모두 손실로 끝날 것입니다. 클래스 "1"도 마찬가지입니다.


나무에 문제가 있었습니다. 유전학은 트리 매개변수 cp = 0을 선택했으며 이는 트리에 많은 가지를 가질 수 있는 권한을 부여합니다. 성공적이지 못한 것으로 나타났습니다. 이 매개변수를 0이 아닌 작은 값으로 제한해야 했습니다.

그림을 이전과 같이 확률로 나타낼 수 있습니까? 테스트 데이터에 더 중요한 분기가 있을 수 있습니까?

박사 상인 :

데이터에 "0"을 분류하기에 충분한 예측 변수가 없다고 생각합니다. 예를 들어 몇 가지 평면 지표가 필요합니다.

일반적으로 나무에는 좋지 않습니다. 숲이 있는 SanSanych에서는 훨씬 더 시원했습니다.


잘못된 모델 설정, 결과적으로 재교육.

그는 2016년에 단 하나의 파일만 가져갔습니다(그런데 2015년에는 예측자가 1개 적은 것으로 판명되었습니다. 수정했습니다. 다시 업로드할 수 있습니다). 2016년에는 상승 추세가 있었습니다!

트리는 상위 타임프레임의 데이터에 집착하고, 기본적으로 그에 대한 통계가 거의 없기 때문에 글로벌 이동 벡터가 변경(2015년 상승 및 2016년 하락)하거나 전체 플랫이 발생할 때 히스토리에 인과관계가 발생할 수 있습니다. (2017).

플랫의 경우 플랫 에서 시장 진입 을 해결하는 타겟과 반전을 위해 타겟을 얻습니다. 어떤 식으로든 이들을 분리할 수 있습니까?

플랫은 일반적으로 Levl 유형의 예측자에 의해 잘 식별되지만, 유일한 문제는 트리가 적어도 동일한 TF에서도 이들을 함께 연결할 수 없다는 것입니다.

 

당신은 그곳에서 수익성 있는 로봇을 만들었습니다 :)

매수에 대한 진입은 예측 "1"(파란색)로만 이루어지며, 그 중 > 90%는 이익(녹색)이 됩니다.
반바지 진입 - 예측 "-1"(빨간색)에만 해당하며, 다시 90% 이상은 이익(녹색)이 됩니다.
예측 "0"은 새 위치를 열지 않고 더 나은 시간을 기다리는 것을 의미하므로 이 클래스 예측의 실제 정확도는 실제로 중요하지 않습니다.

그러나 예를 들어 2015년 파일에서 숲을 훈련하고 2016년 파일에서 확인하는 것이 좋습니다. 거기에서 2015년에는 단 하나의 열만 누락되었으며 딸랑이가 혼동되지 않도록 2016년부터 제거해야 합니다.

 
알렉세이 비아즈미킨 :

그림을 이전과 같이 확률로 나타낼 수 있습니까?

아니오, 이것은 2개의 클래스에만 적합한 다른 트리 학습 모드입니다. 또는 회귀를 위해.

 
산산이치 포멘코 :

과적합과 그 외 어떤 것도 가파르지만, 그는 목표 변수인 솔리드 노이즈와 관련된 단일 예측 변수를 갖고 있지 않습니다. 더군다나 그는 덜덜 떨면서 앉아서 소음을 확인하지 않고 여기에 쓰레기가 있는 파일을 업로드합니다.

네, 타겟 타겟은 예측 변수와 명확한 관련이 없으며 특정 시점에 시장에 진입하여 재무 결과만 보여줍니다.

입력의 논리가 예측자의 일부, 즉 지표와 연결되면 결과가 더 좋을 것이라고 생각합니까? 프리미티브이면 MA 교차점에 입력하고 결과(1 또는 -1)를 결정하고 MA 가격 교차 사실에 대한 정보를 예측자에게 제공합니까?

 
알렉세이 비아즈미킨 :

트리는 상위 타임프레임의 데이터에 집착하고, 기본적으로 그에 대한 통계가 거의 없기 때문에 글로벌 이동 벡터가 변경(2015년 상승 및 2016년 하락)하거나 전체 플랫이 발생할 때 히스토리에 인과관계가 발생할 수 있습니다. (2017).

플랫의 경우 플랫 에서 시장 진입 을 해결하는 타겟을 얻거나 반전을 위해 타겟을 얻습니다. 어떤 식으로든 이들을 분리할 수 있습니까?

플랫은 일반적으로 Levl 유형의 예측자에 의해 잘 식별되지만, 유일한 문제는 트리가 적어도 동일한 TF에서도 이들을 함께 연결할 수 없다는 것입니다.

물론 이미 다양한 평면 표시기가 있지만 트리는 연결 방법을 모릅니다. 그렇다면 아마도 모든 것, 이것이 트리의 가능성에 대한 한계입니다.

어제 나는 정확도 면에서 거의 동일한 결과를 얻었지만 거래 항목이 더 적었습니다. 오늘 내가 얻은 것 - 실제로는 아니지만 더 좋아졌습니다. 문제가 발생했습니다. 수정할 수 있는 설정에 대해 생각하겠습니다.

 
알렉세이 비아즈미킨 :

네, 타겟 타겟은 예측 변수와 명확한 관련이 없으며 특정 시점에 시장에 진입하여 재무 결과만 보여줍니다.

입력의 논리가 예측자의 일부, 즉 지표와 연결되면 결과가 더 좋을 것이라고 생각합니까? 기본적으로 MA 교차점에 입력하고 결과(1 또는 -1)를 결정하고 MA 가격 교차 사실에 대한 정보를 예측자에게 제공합니까?

그리고 여기 내 의견이 있습니다. 쓰레기는 쓰레기입니다! 이것은 통계 교과서의 첫 번째 줄입니다.

 
박사 상인 :

당신은 그곳에서 수익성 있는 로봇을 만들었습니다 :)

매수에 대한 진입은 예측 "1"(파란색)로만 이루어지며, 그 중 >90%가 이익(녹색)이 됩니다.
반바지 진입 - 예측 "-1"(빨간색)에만 해당하며, 다시 90% 이상은 이익(녹색)이 됩니다.
예측 "0"은 새 위치를 열지 않고 더 나은 시간을 기다리는 것을 의미하므로 이 클래스 예측의 실제 정확도는 실제로 중요하지 않습니다.

그러나 예를 들어 2015년 파일에서 숲을 훈련하고 2016년 파일에서 확인하는 것이 좋습니다. 거기에서 2015년에는 단 하나의 열만 누락되었으며 딸랑이가 혼동되지 않도록 2016년부터 제거해야 합니다.

아무 것도 빌드하지 않았습니다. 파일을 준비하고 randomForest를 빌드했는데 분할을 두 개의 파일로 나누기에는 너무 게으릅니다. Alexey는 나를 위해 이것을 했고 나의 "업적"을 완전히 마감하는 킬러 결과를 보여주었습니다.

 
박사 상인 :

물론 이미 다양한 평면 표시기가 있지만 트리는 연결 방법을 모릅니다. 그렇다면 아마도 모든 것, 이것이 트리의 가능성에 대한 한계입니다.

어제 나는 정확도 면에서 거의 동일한 결과를 얻었지만 거래 항목이 더 적었습니다. 오늘 내가 얻은 것 - 실제로는 아니지만 더 좋아졌습니다. 문제가 발생했습니다. 수정할 수 있는 설정에 대해 생각하겠습니다.

네, 제 생각에는 예측자 간의 가능한 연결을 보여주고 결정을 내리기 위한 가능한 비교 조건을 설정하는 데 도움이 될 수 있는 트리가 필요하다고 생각합니다.

글로벌 추세가 오르락 내리락하는 것을 트리에게 설명하는 방법은 다음과 같습니다. 물론 나는 같은 손을 놓고 채널을 만들고 백분율을 만들 수 있습니다. 추세 벡터가 어디로 향하는지 명시적으로 나타내지만 트리는 이 예측 변수를 무시할 수 있으며 제 생각에는 전체 추세 벡터에 따라 전체 그룹을 둘 이상으로 나누어야 합니다.

모르겠습니다. 그러면 샘플을 상황에 맞게 조정(부분으로 나눕니다)하고, 이를 통해 학습한 다음, EA에서 강제로 동일한 글로벌 추세를 식별하고 벡터에 따라 하나의 트리에 귀를 기울여야 합니다. 또는 다른.

 
산산이치 포멘코 :

그리고 여기 내 의견이 있습니다. 쓰레기는 쓰레기입니다! 이것은 통계 교과서의 첫 번째 줄입니다.

쓰레기에 관한 것이 아닙니다. 입력에는 실제로 이벤트 결과의 확률 집합이 있습니다. 이러한 확률은 예측자의 영향을 받으며, 출력에서 우리는 다양하고 독립적인 이벤트가 많이 있다는 사실에서 그러한 결과를 얻습니다. , 동일한 결과를 얻을 수 있지만. 나는 명확한 입장에 대해 생각하고 입장 신호없이 모든 옵션을 제거 할 것입니다. 결과를 보는 것이 흥미로울 것입니다. 사실, 여기에서 참가자들의 피드백을 아직 들을 수 없습니다. 다른 진입 전략이 사용되는 경우 예측 변수에 항목을 명시적으로 표시해야 합니까?

 

여기에서 우리는 모두 진입점을 찾고 있습니까, 아니면 아파트를 찾고 있습니까?

누군가가 역사에서 아파트를 결정하기 위한 지표/스크립트를 가지고 있습니까?

범위가 100인 회귀 채널을 가져와 각 막대로 이동하고 기울기가 X보다 크거나 작으면 채널이 설명하는 영역을 평면으로 간주하는 것이 가능하다고 생각합니다. 어떻게 생각하나요?

사유: