트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 2727

 
Aleksey Nikolayev #:

귀하의 가정은 너무 강한 것 같습니다. 구현할 수 있다면 사실상 성배가 될 것이라는 의미에서 말이죠. 저는 좀 더 겸손하고 구체적인 문제를 해결하고 싶습니다. 트레이의 충분한 길이와 그 안에 쓸모없는 예제가없는 것 사이에서 타협점을 찾을 수있는 일반적인 방법을 찾고 싶습니다.

제 생각에는 이 문제는 우리 분야에서 MO와 matstat을 적용하는 데 있어 근본적인 문제라고 생각합니다.

실험적으로 시도해 보지 않으셨나요? 결국, 이 질문에 대한 이론적 접근 방식에 따르면 샘플 크기가 임계적으로 증가하면 샘플의 패턴이 오래되어 더 이상 작동하지 않으므로 질적 인 의미에서 학습이 저하되고 샘플이 증가하면 새로운 데이터에 대한 결과가 더 나빠질 것입니다.

 
Aleksey Nikolayev #:

이미 학습된 모델에 대한 사후 분석 결과를 얻었습니다. 훈련 샘플 선택 단계에 대한 선험적 분석으로 이를 보완하고 싶습니다.

저도 그렇게 생각합니다. 단순성을 위해 마지막으로 형성된 지그재그의 상단을 사용하기로 결정했지만 더 정교한 것을 원합니다.

새 데이터에서 작동하는 부분만 추출하고 두 번째 모델 형태의 필터를 적용하여 이전 데이터와 새 데이터 모두에서 작업 한 다음 기사에서와 같이 다른 새 데이터에서 확인합니다.

또한 일종의 피팅이지만 모델 오류를 기반으로합니다. 적어도 잘 분류 할 수있는 변형을 선택하는 것처럼 무작위성 이외의 무언가가있는 것처럼 (적어도 훈련 및 검증 및 기타 검증에 대해).

선험적으로 무언가를 내려 놓으면 장기적인 모니터링을 수행하는 것이 합리적 일 수 있으며 적어도 적절한 마크 업을 제공 할 것입니다. 징후를 포착하세요.


저는 기능과 대상의 새로운 스팸 발송자를 생각해 냈습니다(일반적인 무작위 샘플링에 비해 유익한 것 같고 실제로도 그렇습니다). 하지만 아직 테스트하지 않은 몇 가지 변형이 있습니다.

 
Aleksey Vyazmikin #:

실험적으로 시도해 보지 않았나요? 결국, 이 질문에 대한 이론적 접근 방식에 따르면 샘플 크기가 크게 증가하면 샘플의 패턴이 오래되어 더 이상 작동하지 않으므로 학습은 질적 인 의미에서 악화되어야하며 새로운 데이터에서는 샘플이 증가하면 결과가 더 나빠질 것입니다.

많은 시점의 기록 기간 동안 많은 수의 변형을 학습하는 것은 완전히 엄청난 계산 작업이라는 것을 알고 계실 것입니다. 기적적으로 이러한 통계를 모두 수집할 수 있다고 하더라도 이 정보 더미를 의미 있게 체계화해야 하는 문제가 있습니다. 분명히 각 순간마다 다른 길이의 역사가 최적의 것으로 판명 될 것입니다. 그리고 이것을 어떻게 해석하고 가장 중요한 것은 미래로 어떻게 추론할 것인가?

저는 반대로 훈련 기록의 길이에 대한 변형의 수를 대폭 줄이기 위한 몇 가지 휴리스틱(말 그대로 몇 가지 변형으로 줄이는 것)을 생각해 보고 싶습니다.

 
Maxim Dmitrievsky #:

새 데이터에서 작동하는 청크만 가져와서 두 번째 모델로 필터를 적용하여 이전 데이터와 새 데이터 모두에서 작업한 다음 기사에서와 같이 다른 새 데이터에서 확인합니다.

또한 일종의 피팅이지만 모델 오류를 기반으로 합니다. 적어도 잘 분류 할 수있는 변형을 선택하는 것처럼 무작위성 외에 무언가가 있습니다 (적어도 훈련 및 검증 및 기타 검증에서).

선험적으로 무언가를 내려 놓으면 장기적인 모니터링을 수행하는 것이 합리적 일 수 있으며 적어도 적절한 마크 업을 제공 할 것입니다. 징후를 포착하세요.


저는 기능과 대상의 새로운 스팸 발송자를 생각해 냈습니다(유익한 것 같아서 일반적인 무작위 샘플링과 비교했습니다). 그러나 아직 테스트하지 않은 몇 가지 변형이 있습니다.

좀 더 생각해 봐야겠습니다. 제 아이디어와 개념으로 어떻게 해석해야 할지 잘 모르겠습니다.

 
Aleksey Nikolayev #:

생각해 봐야겠어요. 제 인식과 개념의 언어로 어떻게 번역해야 할지 잘 모르겠어요.

또한 틱에서 막대로 전환하면 예측력이 많이 떨어집니다.

하지만 DTS와의 잠재적 충돌을 제거합니다.)

 
Maxim Dmitrievsky #:

또한 틱에서 막대로 전환하면 예측 능력이 크게 저하됩니다.

하지만 DTS와의 잠재적 충돌을 제거합니다.)

그건 그렇고, 이것은 또한 중요한 실용적이고 흥미로운 이론적 질문입니다. 거래량(유동성, 변동성)에 대한 실제 매도-매도 스프레드의 의존성으로 공식화하고, 해당 회귀를 계산하고, 외환과 증권 거래소 상품을 비교하는 등의 작업을 할 수 있습니다. 또 다른 한 가지는 TS가 대량으로 거래하는 사람들에게만 흥미 롭다는 것입니다.)

 
Aleksey Nikolayev #:

역사의 긴 시간 동안 많은 수의 변형을 훈련하는 것은 절대적으로 엄청난 계산 작업이라는 것을 알고 계실 것입니다. 기적적으로 이러한 통계를 모두 수집할 수 있다고 하더라도 이 정보 더미를 의미 있게 체계화할 수 있을지는 의문입니다. 분명 각 순간마다 최적의 길이의 역사가 밝혀질 것입니다. 그리고 그것을 해석하는 방법, 그리고 가장 중요한 것은 그것을 미래로 추정하는 방법일 것입니다.

저는 반대로 훈련 기록의 길이에 대한 변형의 수를 대폭 줄이기 위한 몇 가지 휴리스틱을 생각해 내고 싶습니다(말 그대로 몇 가지 변형으로).

이 실험의 문제는 해결할 수 있는 것이었고, 저도 비슷한 실험을 해본 적이 있습니다.

그때 샘플의 비교 가능성을 추정하는 방법을 찾아야겠다는 생각이 들었습니다. 하지만 공식을 이해하지 못해서 구현할 수 없었습니다.

 
Aleksey Vyazmikin #:

실험의 문제는 해결할 수 있습니다. 저도 비슷한 일을 해봤습니다.

기술적으로는 충분히 해결할 수 있는 문제입니다. 문제는 그러한 실험의 결과를 해석하는 방법입니다.

알렉세이 뱌즈미킨 #:

그때 저는 샘플의 비교 가능성을 평가하는 방법을 찾아야 한다는 생각을 하게 되었습니다. 하지만 공식을 이해할 수 없었기 때문에 실현할 수 없었습니다.

예를 들어 Matstat에는 샘플의 동질성을 확인하기 위한 많은 테스트가 있습니다. 물론 제가 용어를 제대로 이해했다면요.

 
Aleksey Nikolayev #:

그건 그렇고, 이것은 또한 중요한 실용적이고 흥미로운 이론적 질문입니다. 거래량(유동성, 변동성)에 대한 실제 매도-매도 스프레드의 의존성, 해당 회귀 계산, 외환과 증권 거래소 상품 비교 등으로 공식화할 수 있습니다. 또 다른 한 가지는 TS를 대량으로 거래하는 사람들에게만 흥미롭다는 것입니다.)

아, 너무 혼란스러워서 아무것도 명확하지 않습니다. 거래량이 많은 호가를 어디서 구하는지, 어떤 공급업체가 있는지, 존재 여부 등 모든 것이 혼란스럽습니다. 결국, 그들이 성공하더라도 비슷한 원칙에 따라 다른 모든 것과 마찬가지로 그러한 독성 ts를 금지 할 것입니다. 또는 모자를 들고 다른 장소로 달려가 마법의 진자 앞에 떨어질 것을 모으십시오.

한 시간 거래 길이에서 TS를 환영하며 여러 악기에서 가능하며 독성 측면에서 특히 아무도 변형되지 않는 것처럼 보이지만 아마도 변형되지 않기 때문에 그렇게 어렵게 만드는 것은 어렵습니다.
 
Maxim Dmitrievsky #:
이해할 수 없을 정도로 엉망진창입니다. 어디서 물량과 함께 견적을 받는지, 어떤 공급업체를 이용하는지, 존재 여부 등 모든 것이 엉망입니다. 결국, 그것이 잘 되더라도 그들은 비슷한 원칙에 따라 다른 모든 것과 마찬가지로 그러한 독성 TS를 금지 할 것입니다.

fxsaber는 문제가 큰 매출에서 시작된다고 썼던 것 같아요. 아마도 카피라이터들 사이에서 너무 높은 인기로 인해 TS가 희생되었을 수 있습니다.)

사유: