트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 1034

 
막심 드미트리예프스키 :

상상할 수 없는 것을 밀어내고 아무 의미 없이 예측 변수를 곱하기로 결정

어디서 그렇게 많은 예측 변수를 얻었습니까? 그들의 수입은 무엇입니까? 그곳에서 숲의 1/3은 훈련 세트에 포함되지 않았고 95%는 수입이 적습니다. 그리고 예측 1개당 3시간의 예측 변수가 있는 시스템은 이제 어떤 반응을 보일까요? )

만들어보기 전에는 알 수 없습니다...

결과 자체: 이것은 Apache Spark에서 가능합니다.

이제 나는 1000개 이상의 예측자를 하지 않습니다. 하지만 100개 미만의 예측 변수는 충분하지 않다고 생각합니다.

 
로프필드 :

만들어보기 전에는 알 수 없습니다...

결과 자체: 이것은 Apache Spark에서 가능합니다.

이제 나는 1000개 이상의 예측자를 하지 않습니다. 하지만 100개 미만의 예측 변수는 충분하지 않다고 생각합니다.

일부러 질문을 무시하는 건가요?

반복: 왜 그렇게 많은 예측 변수가 있습니까?

 
막심 드미트리예프스키 :

일부러 질문을 무시하는 건가요?

반복: 왜 그렇게 많은 예측 변수가 있습니까?

최소 10억 개 이상의 예측변수를 만들 수 있고, 1단계로 모멘텀을 만들 수 있습니다.

그들은 당신에게 추가로 아무것도주지 않습니다.

 
막심 드미트리예프스키 :

일부러 질문을 무시하는 건가요?

반복: 왜 그렇게 많은 예측 변수가 있습니까?

이러한 예측 변수의 대부분은 bool(high[0] > high[1])로 나타나며 각각 상태가 0 또는 1입니다.

물론 스크립트로 예측자 목록을 생성합니다.

중요한 예측 변수를 제외하기 쉽기 때문에 의도적으로 예측 변수를 선택하는 것은 의미가 없습니다.

 
로프필드 :

이러한 예측 변수의 대부분은 bool(high[0] > high[1])로 나타나며 각각 상태가 0 또는 1입니다.

물론 스크립트로 예측 변수 목록을 생성합니다.

중요한 예측 변수를 제외하기 쉽기 때문에 의도적으로 예측 변수를 선택하는 것은 의미가 없습니다.

OOS에서 오류 제어와 함께 클래스가 잘 분리될 수 있을 때까지 상태가 될 때까지 수량을 선택하지 않고 원본 여러 개를 변형해야 합니다.

 
forexman77 :

최소 10억 개 이상의 예측변수를 만들 수 있고, 1단계로 모멘텀을 만들 수 있습니다.

그들은 당신에게 추가로 아무것도주지 않습니다.

예측자가 숲의 일부가 아닌 경우 나쁜 일은 없을 것입니다. 아마도 이 예측자는 다른 버전의 랜덤 포레스트 에서 나타날 것입니다.

우리는 RAM을 거의 차지하지 않고 나노초 만에 실행되는 7000개의 이중 배열에 대해 논의하고 있습니다. 7000개의 예측 변수가 있는 500개의 트리를 해석하는 데 눈에 띄는 끌림이 없습니다. 내 말을 믿지 못한다면 Spark를 설치하고 직접 확인하십시오.

 
막심 드미트리예프스키 :

OOS에서 오류 제어와 함께 클래스가 잘 분리될 수 있을 때까지 상태가 될 때까지 수량을 선택하지 않고 원본 여러 개를 변형해야 합니다.

숲의 질을 평가하는 것은 완전히 다른 주제입니다.
 
로프필드 :
숲의 질을 평가하는 것은 완전히 다른 주제입니다.

주제는 귀하가 제안한 접근 방식의 효율성입니다. 간단히 말해서 효과가 없습니다.

 
막심 드미트리예프스키 :

주제는 귀하가 제안한 접근 방식의 효율성입니다. 간단히 말해서 효과가 없습니다.

효율성은 여전히 실용적인 결과로 입증되어야 합니다. 아마도 가격 차트에 대한 나의 평가 방법은 고전적인 품질 지표와 일치하지 않지만 결국 모든 것은 이익에 의해 결정됩니다.

"왜 Spark가 필요한가요?"라는 질문에 답했습니다. 나는 대답했다. 아니면 내가 질문을 무시했다고 다시 비난하시겠습니까?

 
로프필드 :

효율성은 여전히 실용적인 결과로 입증되어야 합니다. 아마도 가격 차트에 대한 나의 평가 방법은 고전적인 품질 지표와 일치하지 않지만 결국 모든 것은 이익에 의해 결정됩니다.

나는 "왜 Spark가 필요합니까?"라는 질문에 대답했습니다. 나는 대답했다. 아니면 내가 질문을 무시했다고 다시 비난하시겠습니까?

스파크에 대해 오랫동안 그것은 분명하고 묻지 않았습니다. 아이디어를 요청했습니다. 이 스파크 접근 방식은 비효율적인 훈련 방식과 필요한 능력으로 인해 허무하게 날아갔습니다.

포리스트가 없는 MT5 클라우드에서 최적화를 통해 동일한 작업을 수행할 수 있습니다. 출력에서 얻는 것과 이익이 있는지 여부는 알 수 없지만 이론상으로는 존재하지 않으며 이러한 알고리즘은 과적합으로 인해 지속적으로 떨어질 것입니다.

임하