트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 1488

 
알렉세이 비아즈미킨 :

우리가 할 수 있는 일은 데이터를 가장 성공적으로 피팅하기 위한 알고리즘을 개발하는 것뿐이라는 사실에서 출발해야 합니다. 왜냐하면 우리는 미래를 알지 못하고 사용 가능한 예측 변수 값을 기반으로 하여도 많은 변형이 있기 때문입니다. 그리고 운이 좋다면 얼마 동안 계속 존재할 패턴을 식별할 수 있을 것입니다. 그렇기 때문에 특정 기준으로 그러한 패턴을 찾는 것이 중요하며 논리는 적어도 그것이 있어야 한다고 제안합니다. 전체 샘플에서 발생하는 패턴입니다.

시장에는 하나의 패턴이 있으며 항상 시간 주기, 기간: 거래 세션 , 일, 주, ... 및 반기입니다. 이러한 주기는 원칙적으로 파괴할 수 없으며 복잡한 시간 구조를 형성하며 작업할 샘플 크기를 결정합니다. 이 계층 구조 내에서 가격 행동을 드러내면 거래 시스템이 항상 작동합니다.

 
시장은 그 자체로 프랙탈이 아닙니다. 그것은 시간 안에만 자기 유사성의 속성을 가지고 있으며, 그 안에 특정 구조를 형성합니다. 볼당 틱 또는 다른 샘플의 볼륨을 선택할 수 없습니다. 중첩된 시간 주기를 충족하는 특정 값이어야 합니다.
 
알렉세이 비아즈미킨 :

표준 알고리즘은 고정 현상, 폐쇄 시스템과 함께 작동하도록 설계되었으므로 모든 정보는 선험적으로 유용한 것으로 간주되며 무작위성의 관점에서 평가되지 않고 작업에 사용할 가능성만 평가됩니다(목표별 분류) , 우리는 많은 노이즈를 가지고 있으며 그것을 처리하는 논리적 인 방법을 제안했습니다.

저것들. 훈련 영역에서 성공적인 거래의 균일성 ?
적합은 훈련을 위한 것이기 때문에 모든 것이 정상이며 최대 0%의 오차가 있습니다.

이것은 깊이나 다른 방법을 줄여 모델을 정규화/거칠 때 해야 한다고 생각합니다. 그리고 예를 들어 훈련 영역에서 20% 오류에서 멈춥니다.

제 생각에는 한 가지 방법밖에 없다고 생각합니다. 노드의 각 버전이 추가된 후 트리의 결과 부분을 통해 모든 데이터를 실행하고 균형 선을 분석합니다.

노드 버전 수 = (기능 수 * 트리의 노드 수 * 3(사분위수로 나눈 경우)) * 트리 수

이것은 매우 오랜 시간 동안 고려될 것입니다. 저는 그것이 국회보다 더 길다는 것이 두렵습니다.

 
Alexander_K :

시장에는 하나의 패턴이 있으며 항상 시간 주기, 기간: 거래 세션 , 일, 주, ... 및 반기입니다. 이러한 주기는 원칙적으로 파괴할 수 없으며 복잡한 시간 구조를 형성하며 작업할 샘플 크기를 결정합니다. 이 계층 구조 내에서 가격 행동을 드러내면 거래 시스템이 항상 작동합니다.

나는 시간의 중요성을 부정하지 않지만, 이것만으로는 충분하지 않습니다. 모델을 만들기 위해서는 가격에 영향을 미치는 다른 수량도 필요합니다.

 
알렉세이 비아즈미킨 :

나는 시간의 중요성을 부정하지 않지만, 이것만으로는 충분하지 않습니다. 모델을 만들기 위해서는 가격에 영향을 미치는 다른 수량도 필요합니다.

충분한.

Grail 이 앉는 것은 시간 주기 내에 있습니다. 한 시간 주기의 구조는 다른 시간 주기의 구조의 일부입니다.

엄격하게 정의된 다른 기간에 해당하는 동일한 샘플 크기로 작업하는 경우 이러한 중첩 구조가 전체 보기로 표시됩니다.

NA는 이것을 처리할 수 없습니까? 신경망이 없는 내 차량에서 이 작업을 수행했습니다.

 
도서관 :

저것들. 훈련 영역에서 성공적인 거래의 균일성?

개인적으로 매년(현재~5년) 재무성과를 평가하는데, 그 외의 평가기준은 하락과 회복요인을 고려하여 평가하고 있습니다. 지금은 트랜드 전략이 있어서 분류도 안보고, 35%의 정확한 분류를 해도 연말(다른 기간)에 수익이 날 수 있습니다.

도서관 :


적합은 훈련용이므로 최대 0% 오류가 발생하므로 모든 것이 정상입니다.

문제는 이를 위해 얼마나 많은 트리가 사용되는지, 그리고 실제로 모델에 어떤 종류의 메모리가 있는지입니다. 6 분할의 깊이를 가진 하나의 나무로 그러한 조정을 할 수 없습니다 ...


도서관 :

이것은 깊이나 다른 방법을 줄여 모델을 정규화/거칠 때 해야 한다고 생각합니다. 그리고 예를 들어 훈련 영역에서 20% 오류에서 멈춥니다.

나는 이미 분할 및 충만 제한을 사용하고 있으며 예, 교육에 사용해야 합니다.


도서관 :

제 생각에는 한 가지 방법밖에 없다고 생각합니다. 노드의 각 버전이 추가된 후 트리의 결과 부분을 통해 모든 데이터를 실행하고 균형 선을 분석합니다.

노드 버전 수 = (기능 수 * 트리의 노드 수 * 3(사분위수로 나눈 경우)) * 트리 수

이것은 매우 오랜 시간 동안 고려될 것입니다. 저는 그것이 국회보다 더 길다는 것이 두렵습니다.

더 중요하고 더 효율적이며 결국 시장에 더 적합한 모델이 있을 것입니다.

현재 계산에 약 15일을 소비합니다. 평균적으로 약 800개의 고유한 잎과 그 중 8개를 얻습니다. 그 중 절반은 유사하며 시간 간격에 따라 안정적인 결과를 보여줍니다(수표에는 여전히 많은 기계가 필요합니다. 시각). 저것들. 800/8 계산 속도를 100배 늦추어도 그에 상응하는 결과가 나옵니다.

 
Alexander_K :

충분한.

Grail이 앉는 것은 시간 주기 내에 있습니다. 한 시간 주기의 구조는 다른 시간 주기의 구조의 일부입니다.

엄격하게 정의된 다른 기간에 해당하는 동일한 샘플 크기로 작업하는 경우 이러한 중첩 구조가 전체 보기로 표시됩니다.

NA는 이것을 처리할 수 없습니까? 신경망이 없는 내 차량에서 이 작업을 수행했습니다.

나는 구조와 프랙탈의 유사성과 함께 일하지만 성배 는 나를 위해 나오지 않습니다. 다른 TF에 시간 투자. 이것은 충분하지 않습니다. 아마도 저는 여전히 깨닫지 못합니다.

NN은 도구입니다. 인간의 두뇌는 솔루션을 더 빠르고 정확하게 찾을 수 있습니다. 그렇지 않을 수도 있습니다.

 
알렉세이 비아즈미킨 :

개인적으로는 연도별(현재~5년) 재무성과를 적자 및 회복요인 등을 고려하여 평가하고 있습니다. 지금은 트랜드 전략이 있어서 분류도 안보고, 35%의 정확한 분류를 해도 연말(다른 기간)에 수익이 날 수 있습니다.

문제는 이를 위해 얼마나 많은 트리가 사용되는지, 그리고 실제로 모델에 어떤 종류의 메모리가 있는지입니다. 6 분할의 깊이를 가진 하나의 나무로 그러한 조정을 할 수 없습니다 ...


나는 이미 분할 및 충만 제한을 사용하고 있으며 예, 교육에 사용해야 합니다.


더 중요하고 더 효율적이며 결국 시장에 더 적합한 모델이 있을 것입니다.

현재 계산에 약 15일을 소비합니다. 평균적으로 약 800개의 고유한 잎과 그 중 8개를 얻습니다. 그 중 절반은 유사하며 시간 간격에 따라 안정적인 결과를 보여줍니다(수표에는 여전히 많은 기계가 필요합니다. 시각). 저것들. 800/8 계산 속도를 100배 늦추어도 그에 상응하는 결과가 나옵니다.

앞으로 테스트를 하고 있는 것 같습니다.
나도 그렇지만 손으로. 이것이 모델을 평가하는 가장 좋은 방법이라고 생각합니다.

지금까지 제 시간에 안정적인 모델을 찾지 못했습니다. 반년 / 1 년 앞으로 / 뒤로 이동 한 모델은 이미 제대로 작동하지 않거나 병합되기 시작했습니다. 동일한 기능과 동일한 모델 매개변수로 새로 훈련된 경우에도 마찬가지입니다. 저것들. 기능의 중요성이 변하고 있습니다.

 
도서관 :

앞으로 테스트를 하고 있는 것 같습니다.
나도 그렇지만 손으로. 이것이 모델을 평가하는 가장 좋은 방법이라고 생각합니다.

지금까지 제 시간에 안정적인 모델을 찾지 못했습니다. 반년 / 1 년 앞으로 / 뒤로 이동 한 모델은 이미 제대로 작동하지 않거나 병합되기 시작했습니다. 동일한 기능과 동일한 모델 매개변수로 새로 훈련된 경우에도 마찬가지입니다. 저것들. 기능의 중요성이 변하고 있습니다.

따라서 훈련 중에 이 모든 것을 고려하고, 균형이 맞지 않는 경우 분류 정확도의 확률 평가와 함께 고려하여 분할해야 합니다. 의심스러운 부분은 단순히 거래 금지 또는 유도 확률(99%)로 이동해야 하며 모델을 적용할 때 필터링할 수 있습니다.

 
알렉세이 비아즈미킨 :

따라서 훈련 중에 이 모든 것을 고려하고, 균형이 맞지 않는 경우 분류 정확도의 확률 평가와 함께 고려하여 분할해야 합니다. 의심스러운 부분은 단순히 거래 금지 또는 유도 확률(99%)로 이동해야 하며 모델을 적용할 때 필터링할 수 있습니다.

분류 확률에 따라 분할됩니다. 더 정확하게는 확률이 아니라 분류 오류입니다. 왜냐하면 모든 것이 훈련 계정에 알려져 있으며 우리는 확률이 아니라 정확한 추정치를 가지고 있습니다.
다른 분할 기능이 있지만, 즉. 불순물 측정(왼쪽 또는 오른쪽에 있는 샘플).
사유: