트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩

mytarmailS 2020.05.10 14:57 #17771

드미트리 :

예측 능력은 어떻게 결정됩니까?

음, 상관 관계가 아닙니다.

시차 추정을 통한 교차 상관 가능성..

드미트리 :

바보같이 세상의 모든 것을 모델에 담는다?

왜 안 돼? 훈련할 때 교차 검증은 불필요하거나 일부 스레드 통계를 제거합니다.

확인할 때까지 "무엇이 무엇인지"를 어떻게 압니까?

mytarmailS 2020.05.10 14:59 #17772

알렉세이 비아즈미킨 :

당신은 이것을 거래하는 방법에 대해 말한 적이 없습니다. 그래서 어떤 종류의 TS를 작성해야 하는지 모르겠습니다.

글쎄, 어떻게? 당연합니다)) ZZ up은 매수, 다운 매도를 의미합니다.

ZZ의 방향을 예측합니까?

Дмитрий 2020.05.10 15:00 #17773

mytarmailS :

음, 상관 관계가 아닙니다.

시차 추정을 통한 교차 상관 가능성..

왜 안 돼? 훈련할 때 교차 검증은 불필요하거나 일부 스레드 통계를 제거합니다.

확인할 때까지 "무엇이 무엇인지"를 어떻게 압니까?

글쎄, 나는 특히 NN과 관련된 중복성 문제에 대해 오랫동안 이야기했지만 너무 게으르다.

그건 그렇고, 종종 모델의 약한 예측 능력을 유발하는 것은 이 문제입니다.

Aleksey Vyazmikin 2020.05.10 15:03 #17774

mytarmailS :

글쎄, 어떻게? 당연합니다)) ZZ up은 매수, 다운 매도를 의미합니다.

ZZ의 방향을 예측합니까?

그것은 아마도 경련을 일으킬 것입니다.

이상치를 제거하기 위해 창으로 분류 점수를 평균화/평활화해 보셨습니까?

mytarmailS 2020.05.10 15:17 #17775

알렉세이 비아즈미킨 :

그것은 아마도 경련을 일으킬 것입니다.

이상치를 제거하기 위해 창으로 분류 점수를 평균화/평활화해 보셨습니까?

이 경우 평균화는 지연과 같습니다. 분류의 품질을 향상시키는 것이 필요하며 평활화는 옵션이 아닙니다.

그대로 사용해 보세요!

드미트리 :

글쎄, 나는 특히 NN과 관련된 중복성 문제에 대해 오랫동안 이야기했지만 너무 게으르다.

그건 그렇고, 종종 모델의 약한 예측 능력을 유발하는 것은 이 문제입니다.

그렇기 때문에 이 방향에서 표지판은 이미 훈련된 AMO 또는 작업 규칙일 수 있다고 생각하는 이유입니다. 이러한 표지판은 이미 고품질의 간결한 정보여야 하며 마지막 페이지에 있는 저의 미니 실험이 이를 증명했습니다.

상관관계를 예측하는 방법을 이해하지 못함

Дмитрий 2020.05.10 15:47 #17776

mytarmailS :

상관관계를 예측하는 방법을 이해하지 못함

역시나 일종의 예측....

상관 계수는 가장 중요한 예측 변수를 미리 결정하는 데 도움이 됩니다. 종속 변수와 예측 변수의 상관 관계가 높을수록 해당 변수가 모델에 더 중요합니다.

즉, 귀하의 예에는 두 가지 방법이 있습니다. 먼저 하나의 예측 변수를 모델로 대체하고 예측 정확도가 얼마나 향상되는지 확인합니다. 오랫동안.

둘째, 상관 계수를 사용하여 모델을 노이즈로 만드는 중요하지 않은 예측 변수를 미리 제거합니다.

중복 문제는 100+1 모델에 새 예측자를 추가할 수 있지만 100개 예측자는 예측 품질에 0.01%를 추가하고 1은 10%를 추가한다는 것입니다. 그리고 이러한 100개의 새로운 예측 변수로 모델을 과부하시키는 것은 의미가 없습니다.

Дмитрий 2020.05.10 15:48 #17777

mytarmailS :

그건 그렇고, 많은 예측 변수에서 트리 - ha.no, 임의의 숲 규칙

mytarmailS 2020.05.10 16:07 #17778

드미트리 :

역시나 일종의 예측....

상관 계수는 가장 중요한 예측 변수를 미리 결정하는 데 도움이 됩니다. 종속 변수와 예측 변수의 상관 관계가 높을수록 해당 변수가 모델에 더 중요합니다.

즉, 귀하의 예에는 두 가지 방법이 있습니다. 먼저 하나의 예측 변수를 모델로 대체하고 예측 정확도가 얼마나 향상되는지 확인합니다. 오랫동안.

둘째, 상관 계수를 사용하여 모델을 노이즈로 만드는 중요하지 않은 예측 변수를 미리 제거합니다.

음, 상관관계는 선별을 위한 옵션 중 하나일 뿐이며 확실히 최고는 아닙니다. 특징의 예측 오류 로서의 기준

드미트리 :

그건 그렇고, 많은 예측 변수에서 트리 - ha.no, 임의의 숲 규칙

부분적으로는 동의하지만 더 넓게 생각하면 포리스트는 동일한 규칙이고 차이점은 복잡성에만 있습니다.

R에 200그루의 숲을 1~3개의 규칙으로 압축할 수 있는 패키지가 있는데, 분류 품질의 손실은 0.5~2%인데, 이것이야말로 노력해야 할 정보 압축 + 해석 가능성

Aleksey Vyazmikin 2020.05.10 17:41 #17779

mytarmails :

이 경우 평균화는 지연과 같습니다. 분류의 품질을 향상시키는 것이 필요하며 평활화는 옵션이 아닙니다.

그대로 사용해 보세요!

따라서 옵션이 아닙니다. 나는 아파트에서 너무 많이 마셨다.

물론 활성화 임계값을 0.65 - 매수 및 0.35 - 매도로 이동할 수 있습니다.

mytarmailS 2020.05.10 18:12 #17780

알렉세이 비아즈미킨 :

따라서 옵션이 아닙니다. 나는 아파트에서 너무 많이 마셨다.

물론 활성화 임계값을 0.65 - 매수 및 0.35 - 매도로 이동할 수 있습니다.

무역 차트를 보여

트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 1778