트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 2587

 
도서관 # :

오늘 나는 현재 막대로부터의 거리 예측기를 추가했습니다. 숫자일 수도 있고 시간일 수도 있습니다. 나는 시간을 했다.

순환 시간을 사용하면 모든 것이 다소 명확해집니다. 선형의 경우 명확하지 않습니다. 기차와 앞으로의 간격이 다를까요? 아니면 각 샘플에 대해 "현재 막대"를 사용합니까?

나는 일반적인 선형 로지스틱 회귀를 취하고 시간에 따른 계수의 0과의 차이(또는 시간의 일부 함수)의 차이의 중요성을 보거나 이 중요성을 다른 예측 변수에 대한 유의성과 비교하는 아이디어를 가졌습니다.

 
Alexey Nikolaev # :

순환 시간을 사용하면 모든 것이 다소 명확해집니다. 선형의 경우 명확하지 않습니다. 기차와 앞으로의 간격이 다를까요? 아니면 각 샘플에 대해 "현재 막대"를 사용합니까?

나는 일반적인 선형 로지스틱 회귀를 취하고 시간에 따른 계수의 0과의 차이(또는 시간의 일부 함수)의 차이의 중요성을 보거나 이 중요성을 다른 예측 변수에 대한 유의성과 비교하는 아이디어를 가졌습니다.

일반적으로 선형 시간을 제출한다는 아이디어는 좋지 않습니다. 그건 그렇고, 그렇습니다. 기차에서는 각 라인마다 다르며 앞으로는 한 번에 한 라인만 분석합니다. 시간은 항상 현재(기차에 없었음)이고 숫자는 항상 0(기차에서 0에서 5000까지)입니다. 저것들. 시간도 줄 번호도 지정할 수 없습니다. 테스트가 보여준 것.
[삭제]  
음, 입력에 대한 정현파
 

정현파 - 시간 또는 요일과 같은 주기적인 시간에 대한 것입니다. 그리고 처음에는 (Aleksey Vyazmikin에 의해) 규칙성의 붕괴 형태로 비정상성의 영향을 포착하기 위해 보통의 선형 시간에 관한 것이었습니다. 제 생각에는 이러한 문제를 해결하려면 간단하고 쉽게 해석할 수 있는 모델을 사용해야 합니다. 복잡한 모델 - 실용적인 목적, 단순 - 예비 분석.

사실, 이 특별한 경우에 그러한 소란의 실질적인 이점에 대해 의구심이 있습니다. 대부분의 경우 패턴은 시간이 지남에 따라 균일하게 변경되지 않고 주기적으로(그러나 주기성은 없음) 변경됩니다.

[삭제]  
Alexey Nikolaev # :

정현파 - 시간 또는 요일과 같은 주기적인 시간에 대한 것입니다. 그리고 처음에는 (Aleksey Vyazmikin에 의해) 규칙성의 붕괴 형태로 비정상성의 영향을 포착하기 위해 보통의 선형 시간에 관한 것이었습니다. 제 생각에는 이러한 문제를 해결하기 위해 간단하고 쉽게 해석할 수 있는 모델을 사용해야 합니다. 복잡한 모델 - 실용적인 목적, 단순 - 예비 분석.

사실, 이 특별한 경우에 그러한 소란의 실질적인 이점에 대해 의구심이 있습니다. 대부분의 경우 패턴은 시간이 지남에 따라 균일하게 변경되지 않고 주기적으로(그러나 주기성은 없음) 변경됩니다.

그것은 프랙탈과 같습니다. 그들은 주기적이지만 주기적이지는 않습니다. 괜찮은.
 
도서관 # :
일반적으로 선형 시간을 제출한다는 아이디어는 좋지 않습니다. 그건 그렇고, 그렇습니다. 기차에서는 각 라인마다 다르며 앞으로는 한 번에 한 라인만 분석합니다. 시간은 항상 현재(기차에 없었음)이고 숫자는 항상 0(기차에서 0에서 5000까지)입니다. 저것들. 시간도 줄 번호도 지정할 수 없습니다. 테스트가 보여준 것.

숫자로 시도하겠지만... 결국 0 숫자는 <일부 분할(예: <5000)인 트리 부분에 포함됩니다. 포워드를 위한 트리의 일부가 사용됩니다. 하지만 전부는 아닙니다. 실수로 시험에 시간을 내기로 결정한 것.

그러나 포워드를 위한 최적의 거리에서 숫자로 분할하는 방법은 무엇입니까?

 

시험을 마친. 훈련을 위한 5000개의 히스토리 바가 있는 모델은 라인 번호를 기능으로 추가한 후 매수에 대해 개선되었으며 매도에 대해 어떤 면에서는 더 나쁘고 어떤 면에서는 더 좋습니다.
그러나 10,000개의 막대에서 훈련하면 두 모델 모두 소모됩니다. 저것들. 원하는 이야기 길이를 자동으로 결정하기 위해 줄 번호를 추가하는 주요 작업이 완료되지 않았습니다.

지금까지는 훈련 기록의 길이를 수동으로 최적화/선택하는 것만 남아 있습니다.

 

분명히 사용자 정의 거래 메트릭을 사용하는 주요 아이디어는 모델 선택 단계에서 사용된다는 것입니다. 훈련 단계에서는 표준 메트릭이 사용됩니다. 아마도 이것은 Maxim Dmitrievsky가 이에 대해 이전에 쓴 것과 같습니다.

접근 방식을 보여주는 작은 기사 .

The training dilemma: loss vs profit function?
The training dilemma: loss vs profit function?
  • Haris (Chariton) Chalvatzis
  • medium.com
In the world of machine learning, models are trained by minimizing some variation of a loss function. For example, when we try to predict the median house value of a specific zip code, we are dealing with a regression type problem and prime suspects for the loss function, to be used to train our model, are the Mean Squared Error (MSE), Mean...
 
Alexey Nikolaev # :

분명히 사용자 정의 거래 메트릭을 사용하는 주요 아이디어는 모델 선택 단계에서 사용된다는 것입니다.

그러나 이미 교육 단계에서 사용자 지정 메트릭을 사용하는 아이디어가 있습니다. 동시에 그들은 상인의 것과 매우 유사하지 않지만 MO에 대한 표준 버전의 조정 버전입니다.

거래 지표가 나쁜 조건으로 이어질 수 있습니다. 이것은 예를 들어 처음에 흥미로운 오류율 대신 교차 엔트로피를 사용하는 것을 연상시킵니다(후자의 낮은 감도에 대해 이야기합니다).

ML 학습과 최적화 사이의 이론적이고 실제적인 격차를 어떻게든 줄여야 합니다.   테스터에서.

 
Alexey Nikolaev # :

그러나 이미 교육 단계에서 사용자 지정 메트릭을 사용하는 아이디어가 있습니다. 동시에 그들은 상인의 것과 매우 유사하지 않지만 MO에 대한 표준 버전의 조정 버전입니다.

거래 지표가 나쁜 조건으로 이어질 수 있습니다. 이것은 예를 들어 처음에 흥미로운 오류율 대신 교차 엔트로피를 사용하는 것을 연상시킵니다(후자의 열악한 감도에 대해 말합니다 ).

신뢰하되 확인하십시오.
Alexey Nikolaev # :
ML 학습과 최적화 사이의 이론적이고 실제적인 격차를 어떻게든 줄여야 합니다.   테스터에서.

TP/SL로 모델을 만들 때 정확도는 절대적이었습니다. 모델과 테스터 모두에서 거래는 동일한 막대에서 열리고 동일한 TP/SL로 마감되었습니다. 하지만 수익률은 0에 불과했다.
시가로 테스트했습니다. 그러나 그들에게 문제가 있습니다. 최소 스프레드는 바에서 사용됩니다.

저것들. 테스터의 일부 주문 및 TP/SL은 가격으로 작동합니다.

ASK HIGH = BID HIGH + 최소 스프레드.

그리고 실제 거래에서 작동하는 것들은 작동하지 않을 것입니다.

ASK HIGH(실제) = BID HIGH + 최대 ASK에서 계산된 스프레드

개발자들에게 최소 스프레드가 아닌 막대로 저장하라고 이미 몇 번 제안했지만

스프레드 = ASK HIGH - BID HIGH.

이러한 스프레드를 사용하면 공개 가격으로 테스트하는 것이 실제 틱으로 테스트하는 것에 더 가깝습니다.

예를 들어 막대당 최소 스프레드 = 0.00002이고 스프레드 = ASK HIGH - BID HIGH = 0.00020입니다. 저것들. 실제로 ASK 가격은 테스트 가격보다 0.00018 높게 책정되었습니다. 거래를 열거나 닫을 수 있는 곳.

그러나 MetaQuotes에서 응답이 없습니다((

추신: 정확도를 높이려면 낮은 질문가를 계산하기 위한 스프레드도 필요합니다.