트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 124

 
알렉세이 버나코프 :
이것은 거래에서 다변수 출구에 대한 설명입니다. 직접 구현했습니다. 맞을 확률이 높아집니다.
증가합니까? 이상하네요 ... 그리고 그것은 저를 감소시킵니다.
늘 그렇듯이 악마는 디테일에 있는 것 같습니다.
 
산산이치 포멘코 :

주요 문제는 과적합에 있습니다. 향후 샘플에서 기존 트리가 클래스를 부정확하게 예측하고 더 정확하게는 클래스를 점점 더 나쁘게 예측합니다. 이 스레드에서 고려되는 것은 이 문제입니다. 즉, 결과 트리가 미래에 발생하고 미래 샘플의 분류 오류가 훈련 샘플과 거의 동일하다는 것을 증명하려고 합니다.

함축적이긴 하지만 모든 사람이 이해할 수 있도록 추가하는 것이 좋습니다.

일반적으로 모델을 과적합하면 모델이 훈련 예제를 매우 정확하게 기억하게 됩니다. 훈련은 몇 가지 일반적인 규칙을 유도하는 모델, 예측 변수에 대한 목표 값의 의존성으로 시작하지만 훈련이 진행될수록 모델의 이러한 규칙이 더 엄격해지고 결국 완전히 학습된 예제로 이어지며 모델은 완전히 불가능합니다. 새로운 데이터를 예측합니다. 이것은 교차 검증으로 해결되며 모델이 이미 일부 일반화 규칙을 도출했지만 아직 특정 예를 기억하기 시작하지 않은 단계에서 훈련을 중단하면 새로운 데이터에 대한 더 나은 예측 지표를 제공할 것입니다.

이는 예를 들어 이미지 인식 또는 사운드와 같이 시간이 지남에 따라 종속성이 변경되지 않은 상태로 유지되는 데이터에서 잘 작동합니다. 그러나 forex는 발견된 많은 종속성이 시간이 지남에 따라 지속되지 않는다는 점에서 다릅니다. 문제는 훈련 예를 기억하지 않고 학습을 달성하는 것뿐만 아니라, 발견된 패턴이 미래에 존재할 것이라는 것을 어떻게든 확인하는 것입니다.

작업은 다음과 같이 더 완벽하게 들립니다. 예측 변수와 대상 변수 간의 관계가 일정하고 새 데이터에도 존재할 것임을 보장할 수 있는 대상 변수와 관련하여 예측 변수를 평가하는 방법을 개발하는 것입니다.

사용할 목표 값( 막대 색상 또는 반전 또는 추세) 또는 예측 변수(가격, 지표, 지수)가 이미 뉘앙스입니다. 예측 변수 집합과 목표 값에 대한 예측 능력, 시간 경과에 따른 이 예측 능력의 변화를 평가할 수 있다면 간단한 열거로도 더 나은 추정치를 가진 예측 변수와 목표 값의 조합을 찾을 수 있습니다 .
그런 다음 모든 모델을 선택하여 훈련할 수 있습니다(예를 들어 뉴런에 중요한 재훈련 제어를 사용하는 경우에도 가능). 그러면 성배가 준비됩니다.

 
Dr.Trader :


일반적으로 모델을 과적합하면 모델이 훈련 예제를 매우 정확하게 기억하게 됩니다. 훈련은 몇 가지 일반적인 규칙을 유도하는 모델, 예측 변수에 대한 목표 값의 의존성으로 시작하지만 훈련이 진행될수록 모델의 이러한 규칙은 더 엄격해지고 결국 완전히 학습된 예제로 이어지며 모델은 완전히 불가능합니다. 새로운 데이터를 예측합니다.

Alexei의 입장이 나에게 완전히 명확하지 않기 때문에 당신과 내가 함께 있는 것 같습니다.

나머지는 아주 오랫동안 시장에 나와 있는 사람들의 경험입니다. 나는 기꺼이 거래에 성공한 사람들을 믿습니다. 문헌에는 수년 동안 휴리스틱에 성공했지만 둔한 단조로움으로 결과는 동일했습니다. 즉, 저장소를 고갈시킵니다. 모든 휴리스틱은 재교육에 대한 질문에 답하지 않으므로 피펫은 항상 옵니다. 하루, 한 달, 일 년 ... 그러나 항상 예기치 않게 극단적으로 잘못된 시간에 발생합니다.

추신.

재훈련은 과학의 주제가 많은 세부 사항을 설명할 수 있는 특정 기본 법칙의 격리라는 의미에서 과학의 기본 문제입니다.

예를 들어, 뉴턴의 법칙.

우리는 종이 한 장을 가져갑니다. 그것은 반드시 바닥에 떨어질 것입니다. 우리는이 종이 조각을 구겨줍니다. 확실히 떨어질 것이지만 더 빠릅니다. 뉴턴은 모든 것이 같은 가속도로 떨어진다고 주장합니다. 이와 같이?. 그래서 사람은 현실을 거칠게하고 보편적 인 법칙을 얻기 위해 많은 것이있는 세부 사항을 버리고 작동하지 않으면 항상 이러한 편차를 설명 할 수 있습니다.

이것이 모든 과학이 작동하는 방식입니다.

우리가 하는 것은 인용문을 "거칠게" 하려는 시도이며, 이 인용문을 우리가 미래의 모든 인용문에 대한 아이디어를 가질 수 있는 방식으로 모델로 제시하는 것입니다.

과적합과 싸우는 것은 기본적인 거래 문제입니다.

 
트레이더 박사 :

이는 예를 들어 이미지 인식 또는 사운드와 같이 시간이 지남에 따라 종속성이 변경되지 않은 상태로 유지되는 데이터에서 잘 작동합니다. 그러나 forex는 발견된 많은 종속성이 시간이 지남에 따라 지속되지 않는다는 점에서 다릅니다. 문제는 훈련 예를 기억하지 않고 학습을 달성하는 것뿐만 아니라, 발견된 패턴이 미래에 존재할 것이라는 것을 어떻게든 확인하는 것입니다.

주제에서 약간 벗어나지만 정보의 일부일뿐입니다 ...

음성인식, 특히 스피치에서는 한 사람이 단어를 말할 때 이런 문제가 있습니다. 이 단어의 스펙트럼 패턴은 "HMM" 또는 "RNN" 알고리즘에 공급되지만 문제는 다른 사람이 다음과 같이 말하면 같은 단어, 그러면 그는 최소처럼 다른 속도로 말할 것입니다. 패턴은 동일하지만 시간이 늘어남에 따라 이제 유추는 패턴의 너비가 33개의 양초와 동일한 헤드와 어깨 너비는 88 양초, 너비는 다르지만 패턴은 동일합니다 .... .

음성 인식으로 이 문제를 해결하기 위해 알고리즘이 개발되었습니다. 동적 시간 왜곡 "DTW", 알고리즘의 임무는 길이가 다른 두 개의 유사한 벡터를 찾을 수 있다는 것입니다. 따라서 다른 사람들이 같은 단어를 말할 때 단어의 이 스펙트럼 패턴은 먼저 "DTW"를 통과한 다음 "MO" 알고리즘을 거쳐 단어가 성공적으로 인식됩니다. 아무말도 하지않지만 할만한 가치가 있다고 생각합니다만, 만약 시장에 패턴이 없다고 한다면 당연히 그런 알고리즘은 통하지 않을 것이고, 아직 제 세계관은 정하지 않았습니다.. .

R의 패키지: "DTW" , "dtwclust"

 
알렉세이 버나코프 :
이것은 거래에서 다변수 출구에 대한 설명입니다. 직접 구현했습니다. 맞을 확률이 높아집니다.
안드레이 딕 :

방법은 다음과 같습니다(다음 모두는 ML 및 클래식 TS 모두에 동일하게 적용됨).

요점은 불확실성을 제거하는 것입니다. 이는 한편으로는 훈련 및 최적화에서 적합성을 제거하고 다른 한편으로는 시스템에 대한 "소프트" 요구 사항을 명확하게 공식화하는 것을 의미합니다. 입구의 TP 및 SL도 불확실성이므로 비상구에만 사용합니다(상품의 변동성에 따라 다르며 우리는 경험적으로 선택하여 거래의 100%가 가능한 한 드물게 중지를 트리거하도록 하고 이상적으로는 절대 사용하지 않습니다. . 입구에서 출구까지 전체 거래를 예측합니다 스프레드와 수수료를 고려하지 않고 결과적으로 이익이 나는 성공적인 거래를 고려합니다 (시스템의 성능은 월 이후에 결정됩니다. 스프레드를 커버할지 여부 및 커미션.) 우리는 진입 신호를 수신했습니다. 입력한 다음 특정 수의 막대(경험적으로 결정되고 예측 변수 및 거래 수단에 따라 다름)를 기다린 후 다음을 찾습니다. - 다른 막대를 기다립니다. 때로는 두 개의 매개변수를 사용합니다. 최소 막대 수와 최대값(최대 막대 수 이후에 거래가 닫히지 않으면 어쨌든 닫힙니다), 때로는 하나만 - 최소 막대 수입니다.

많은 사람들이 놀랄 것이지만 ML을 사용하는 모든 종류의 시스템은 말할 것도 없고 자동차의 TS를 포함하여 많은 시스템이 작동하기 시작합니다. 트릭은 자신과 자동차에게 CU의 강화된 구체적인 규칙을 요구하지 않고 시장 움직임을 완전히 설명하고 ML에 대해 동일한 "소프트" 규칙을 제공하려고 하지 않는 것입니다. 또한, 우리는 시장 수치가 수직 및 수평으로 확장될 수 있다는 것을 알고 있기 때문에 무거운 꼬리(또는 오히려 꼬리가 중요하지 않음)의 형태로 시장의 나쁜 유산을 제거하고 VR의 고정성 부족이 더 이상 문제가 되지 않습니다. 내부 속성을 변경하지 않고(이는 Emlöningists의 삶을 엄청나게 어렵게 만듭니다).

나는 Svinosaurus 스레드와 같은 4 번째 포럼에서 모든 차량의 두 가지 유형(특정 경계 및 무기한 포함)에 대해 썼지만 거기에서 생각이 어떻게든 끝나지 않았습니다. 이제야 명확해 지는군요...

일반적으로 나는 거래 시스템을 개발할 때 내 자신의 규칙을 사용합니다. 논리의 변경으로 인해 가능한 모든 옵션 중에서 성공적인 매개변수 옵션의 비율이 증가하면 이는 좋은 변경입니다(거래에 나쁜 옵션을 선택할 확률 매개 변수를 변경하는 방법에 관계없이 감소합니다. 이 접근 방식은 내 차량에서 이 비율을 크게 증가시켰습니다.

귀하가 설명한 모든 것이 ARIMA 모델의 최적화에 맞는 것 같습니다. 최적화할 때 모델이 구축되는 막대의 수를 선택합니다.
 
알렉세이 버나코프 : 산 사니치 포멘코 :

두 단어로 대답하고 대화 상대의 100줄을 인용하는 것이 얼마나 거친 습관입니까???? 포럼에는 120페이지가 있습니다. 이러한 불필요한 인용문을 제거하면 60페이지의 유용한 텍스트가 남게 되는 것을 신이 금지합니다... 이 글을 읽거나 앞으로 읽을 사람들을 존중하십시오

 
안드레이 딕 :

방법은 다음과 같습니다(다음 모두는 ML 및 클래식 TS 모두에 동일하게 적용됨)....

나는 당신이 제안한 방법을 정말로 이해하지 못했기 때문에 알고리즘으로 무엇을 어떻게 해야 하는지를 포인트로 설명할 수 있습니다.

 
산산이치 포멘코 :
귀하가 설명한 모든 것이 ARIMA 모델의 최적화에 맞는 것 같습니다. 최적화할 때 모델이 구축되는 막대의 수를 선택합니다.
막대의 고정 값이 아니라 "지금부터 지금까지" 가능한 값
 
mytarmailS :

나는 당신이 제안한 방법을 정말로 이해하지 못했기 때문에 알고리즘으로 무엇을 어떻게 해야 하는지를 포인트로 설명할 수 있습니다.

당신은 가격 패턴의 시간 확장에 대해 옳습니다. 이것이 내가 수직 및 수평으로 늘리거나 크기를 조정하는 것에 대해 이야기한 것입니다. 그러나 인물 자체가 다른 방식으로 뻗어있을뿐만 아니라 내부의 개별 양초도 늘어납니다. 이것은 추가적인 문제이며 DTW와 같은 전/후 처리 방법이 적절하게 적용될 수 있는지 의심됩니다. 알 수 없는 방식으로 왜곡된 시장 수치입니다.

자세한 내용: 현재 막대에서 구매와 같은 구매 신호, 앞으로 가장 작은 막대 수를 계산하고 거래가 수익성 있는 것으로 판명되는지 확인하고, 수익성이 있으면 닫고, 그렇지 않으면 막대를 하나 더 계산합니다. 미리 확인하고 다시 확인하십시오. 그리고 바의 최대 수까지 계속해서 마지막으로 닫습니다. 그러한 학습 메커니즘.

일반적으로 시장 데이터를 사용한 기계 학습은 다음과 유사합니다. 우리는 기계에 그래픽 모양, 원, 정사각형, 삼각형, 사다리꼴, 다양한 크기 및 모양의 조합을 보여줍니다. 이에 대한 응답으로 기계는 일종의 도형, 삼각형, 정사각형 또는 원(과장)으로 응답해야 합니다. 템플릿에 답을 첨부하고 젠장! - 니크롬은 답안의 그림과 템플릿이 일치하지 않습니다! 그리고 배우는 과정에서 어쩐지 기가 막히게 일치했다....여기서 풀고 있는 문제들이다. 문제 없습니다. 훈련 데이터 외부에서도 답이 사실이 되도록 템플릿을 약간 늘릴 수 있습니다.

이것은 이미 자체적으로 작동하는 시스템의 기본 "물고기"입니다. 그러나 아무도 우리가 TS에 연결하여 SL을 손익분기점으로 전환하는 것과 같은 은밀한 거래에 직접 사용하는 것을 금지하지 않습니다. 시스템은 그대로 유지되지만 시장이 계속 우리 방향으로 움직이면 "계획"을 초과하는 추가 이익을 얻은 다음 SL을 추적하거나 이전 거리에 따라 부분 청산을 시작합니다. 일정 기간 동안의 통계적 가격 변동 등

 
안드레이 딕 :
증가합니까? 이상하네요 ... 그리고 그것은 저를 감소시킵니다.
늘 그렇듯이 악마는 디테일에 있는 것 같습니다.

당신은 역사에 대한 전략의 작업을 평가합니까, 아니면 앞으로 나아갈 길이 있습니까? 악마는 역사에 대한 평가에 있을지도 모릅니다.

이봐, 내 손으로 MT4에서 100줄로 된 전략을 썼어. 2014년 12월 내 프로필에 이에 대해 썼습니다. https://www.mql5.com/ru/users/alexeymosc/page3?#userActions

2015년 1월에 조립된 마지막 버전은 다음과 같습니다.

그런 다음 다른 전략과 함께 실생활에서 시도했습니다. 그는 또한 모든 곳에서 그들에 대해 썼습니다.

이것, 저것이 그의 손과 합쳐졌다.

오늘 최적화 종료부터 7월 말까지 같은 설정으로 순방향 테스트를 진행했습니다. 바라보다:

거기에 모든 것이 나열되어 있습니다. 스프레드 30, 로트 0.1.

테이크가 더 잘 작동하도록 모든 틱을 시도합니다.

충동에 따라 입장하고 여러 조건에서 OR 을 통해 종료합니다. 기본적으로 작동합니다. 하지만 고점에 진입하면 적자에서 벗어나기 위해 1년을 기다려야 합니다.

Alexey Burnakov
Alexey Burnakov
  • www.mql5.com
Профиль трейдера
사유: