트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 100

 
마이클 마르쿠카이테스 :
처음에는 당신이 절대적으로 옳습니다. 마침내 지점에 제정신이 있는 사람들이 있었습니다. 예, 분류는 참 또는 거짓에 대해 패턴을 평가하거나 Reshetov가 제안한 대로 알려지지 않은 것을 알려줍니다. 그리고 패턴 자체는 예측 구성 요소를 포함하며 중요한 것은 패턴 자체가 아니라 이에 대한 시장 반응입니다 . 그리고 이 반응이 훈련에서와 동일하다면 네트워크는 올바른 결론을 내릴 것입니다. 그래서 이런게....
그럼 어떻게 해야 할까요? 가져오거나 jPredictors를 연구하기 위한 순진한 베이지안 분류기입니까?
 
유리 에브센코프 :
그럼 어떻게 해야 할까요? 순진한 Besovsky 분류기를 가져오거나 예측자를 연구하시겠습니까?
x 어떤 종류의 분류기 Besovsky???? 나는 이해하지 못했다. 이제 Reshetov는 켜기, 끄기, 전리품의 원칙에 따라 끔찍하게 멋진 것을 만들었습니다. 그리고 당신은 모두 R과 함께 증기 목욕을 하고 있습니다. 불필요한 데이터 조작을 잔뜩 만들고 있습니다. 그리고 홍채는 무엇입니까???? Predictor가 그를 어떻게 물을지 보는 것이 흥미 롭습니다. . . .
 
마이클 마르쿠카이테스 :
x 어떤 종류의 분류기 Besovsky???? 나는 이해하지 못했다. 이제 Reshetov는 켜기, 끄기, 전리품의 원칙에 따라 끔찍하게 멋진 것을 만들었습니다. 그리고 당신은 모두 R과 함께 증기 목욕을 하고 있습니다. 불필요한 데이터 조작을 잔뜩 만들고 있습니다. 그리고 홍채는 무엇입니까???? Predictor가 그를 어떻게 물을지 보는 것이 흥미 롭습니다. . . .
예, 여기에서 R에 대해 배웠습니다. 그리고 한마디로 베이지안 분류기는 실수로 문자를 놓쳤습니다(아마도 프로이트에 따르면). 그리고 나는 Reshetov의 프로그램이 멋지다고 주장하지 않습니다. 나는 아이리스에 대해 모른다.
 
유리 에브센코프 :
예, 여기에서 R에 대해 배웠습니다. 그리고 한마디로 베이지안 분류기는 실수로 문자를 놓쳤습니다(아마도 프로이트에 따르면). 그리고 나는 Reshetov의 프로그램이 멋지다고 주장하지 않습니다. 나는 아이리스에 대해 모른다.
Shaitan Reshetov의 기계 :-)
 
마이클 마르쿠카이테스 :
x 어떤 종류의 분류기 Besovsky???? 나는 이해하지 못했다. 이제 Reshetov는 켜기, 끄기, 전리품의 원칙에 따라 끔찍하게 멋진 것을 만들었습니다. 그리고 당신은 모두 R로 한증탕을 합니다. 불필요한 데이터 조작을 많이 합니다. 그리고 홍채는 무엇입니까???? Predictor가 그를 어떻게 물을지 보는 것이 흥미 롭습니다. . . .

어제 거래의 결과를 볼 수 있습니까?

 
마이클 마르쿠카이테스 :
Shaitan Reshetov의 기계 :-)
오타로 시작하는 게시물을 삭제할 수 있나요?
 
mytarmailS :

지표가 작동하지 않았으며 작동하지 않는 이유는 무엇입니까? 내 의견...

누가 뭔가를 시도? 어떤 생각이 들었습니까? 아니면 그것이 무엇에 관한 것인지조차 명확하지 않았습니까?
 
2 닥터 트레이더.

안녕하세요.

예, 위원회를 구성하려고 했습니다.

1000개의 훈련된 모델이 있습니다. 5년의 지연된 샘플이 있습니다. 동료에게 위원회가 어떻게 구성되는지 조언을 구했습니다. 그는 지연된 표본의 한 부분에서 위원회를 소집하고 다른 부분에서 테스트할 것을 제안했습니다. 여기서 나는 걸려 넘어졌다. 위원회는 첫 번째 부분에 대해 재교육을 받았고 두 번째 부분에서 배수를 보여주었습니다.

개별 모델과 동일한 이야기. 지연 샘플링으로 모델을 샘플링하여 실수를 범하고 있습니다. 그 후에 모델을 쉽게 병합할 수 있습니다.
 

당신 자신도 이것을 많이 알고 행했지만, 나는 우리가 같은 방식으로 말하지만 다르게 하는 몇 가지 가정을 배제하기 위해 더 완전히 쓸 것입니다.

모델의 매개변수를 추정하려면 주의 깊게 연마된 적합성 함수가 필요합니다. 함수가 특정 모델 매개변수와 선택된 예측변수를 높은 점수로 평가하는 경우 새 데이터에 대한 테스트에서 좋은 결과가 있어야 합니다.
(더 높을수록 더 좋다는 평가를 염두에 둘 것입니다.)

예를 들어 5년 된 훈련 데이터가 있습니다. 그리고 gbm에 대한 매개변수는 n.trees, interaction.depth, shrinkage, n.minobsinnode, distribution, bag.fraction입니다.

루프의 피트니스 함수는 최소 50회 반복해야 합니다.
1) 데이터를 50%/50%의 두 부분으로 나눕니다. 샘플을 사용하는 무작위 선택과 순차 선택이 모두 있어야 합니다(훈련용 조각은 중간 어딘가에 있고 검증을 위해 - 소스 데이터의 시작과 끝에서 둘러싸는 부분). 교육이 테이블의 전반부에 있고 검증이 마지막에 있고 그 반대의 경우도 마찬가지인 극단적인 옵션을 포함합니다. 순차적으로 선택된 예시와 무작위 예시를 모두 갖도록 훈련하는 것이 중요하다고 생각합니다. 그림은 무작위로 순차적으로 분할하는 몇 가지 예를 더 명확하게 보여줍니다. 녹색 선은 훈련용, 노란색 선은 검증용입니다.


2) 훈련 샘플에서 모델을 훈련합니다(주기 전체에 걸쳐 사용되는 모델 매개변수와 예측자는 동일하며 평가하려는 매개변수임). 그런 다음 이 모델로 바로 이 데이터를 예측하고 예측을 평가합니다. 정확도, r ^ 2 또는 다른 것. 예를 들어 회귀 결과를 클래스로 반올림하고 추정을 위해 Cohen의 Kappa 함수를 사용합니다. 캐럿에서 가져온 것이므로 분류 정확도나 회귀 정확도보다 더 좋았습니다. 그러나 두 클래스에서만 작동합니다. 3개의 클래스에 대해 아무것도 제공하기 어렵다고 생각합니다. 평가는 각 클래스의 정확도를 개별적으로 고려하고 이를 기반으로 일종의 전체 평가를 제공하는 것이 중요합니다.
3) 훈련된 모델을 적용하여 검증 세트의 데이터를 예측하고 동일한 기능으로 예측을 평가합니다.
4) 두 평가(교육 및 검증)는 서로 가깝고 동시에 가능한 한 높아야 합니다. 최종 점수에 이 코드를 사용합니다. - (min(score1,score2) - (max(score1,score2)-min(score1,score2))) - 최소값에서 델타를 뺍니다.

각 반복이 끝나면 일부 점수가 얻어지며 데이터의 무작위 분할로 인해 -1에서 1까지(또는 사용된 함수에 따라 다른 간격으로) 달라질 수 있습니다. 평균값을 고려하고 그 결과로 피트니스 함수를 반환합니다. 또한 필요한 데이터 집합이 너무 큰 모델에 불이익을 주는 데 사용되는 각 예측자의 적합성 값에서 작은 수(0.0001)를 뺍니다.

나는 이것을 예측 변수와 모델 매개변수를 선택하는 유전학과 함께 사용하여 적합도 값을 최대화합니다.

마지막으로 사용 가능한 훈련 데이터에 대해 평균적으로 좋은 예측 결과를 보이는 예측자 세트와 모델 매개변수를 얻게 됩니다. 모델은 데이터에서 일부 패턴을 찾고 학습하며 동시에 훈련에 사용되는 데이터 샘플에 관계없이 새 검증 데이터에서 동일한 패턴을 성공적으로 찾을 수 있습니다.
매번 사용 가능한 데이터의 50%만 사용하여 모델을 학습하고 이를 기반으로 매개변수와 예측 변수를 선택하므로 이는 모델의 중요한 조건입니다.
샘플로 동일한 조건에서 위원회를 위한 모델을 훈련하거나 훈련을 위해 데이터의 50%를 순차적으로 선택해야 합니다. 각각의 새 모델에 대해 샘플(또는 순차 세트)에도 새 모델이 필요합니다.

그러한 위원회가 얼마나 오래 좋은 예측을 할 것인지는 알 수 없지만 훈련 데이터가 5년 동안이었다는 점을 감안할 때 위원회는 분명히 향후 5년보다 짧을 것입니다.
그리고 한 가지 더 중요한 점 - 위원회를 만드는 데 모든 시간을 들인 후에 수익성이 없게 거래되면 예측에 사용된 패키지가 Forex에 적합하지 않습니다. 자유도가 너무 높거나 적합하지 않을 수 있습니다. 다른 패키지를 가져가는 것이 좋습니다. 또는 훈련 데이터의 비율을 50%에서 훨씬 더 적게 줄일 수 있습니다.

이 포럼의 모든 조언과 경험.

 
트레이더 박사 :

당신 자신이 이것을 많이 알고 있고 해냈지만, 나는 우리가 같은 방식으로 말하지만 다르게 하는 몇 가지 가정을 배제하기 위해 더 완전히 쓸 것입니다.

모델의 매개변수를 추정하려면 주의 깊게 연마된 적합성 함수가 필요합니다. 함수가 높은 점수로 특정 모델 매개변수 및 선택된 예측자를 평가하는 경우 새 데이터에 대한 테스트에서 좋은 결과가 있어야 합니다.
(더 높을수록 더 좋다는 평가를 염두에 둘 것입니다.)

예를 들어 5년 된 훈련 데이터가 있습니다. 그리고 gbm에 대한 매개변수는 n.trees, interaction.depth, shrinkage, n.minobsinnode, distribution, bag.fraction입니다.

루프의 피트니스 함수는 최소 50회 반복해야 합니다.
1) 데이터를 50%/50%의 두 부분으로 나눕니다. 샘플을 사용하는 무작위 선택과 순차 선택이 모두 있어야 합니다(훈련용 조각은 중간 어딘가에 있고 검증을 위해 - 소스 데이터의 시작과 끝에서 둘러싸는 부분). 교육이 테이블의 전반부에 있고 검증이 마지막에 있고 그 반대의 경우도 마찬가지인 극단적인 옵션을 포함합니다. 순차적으로 선택된 예시와 무작위 예시를 모두 갖도록 훈련하는 것이 중요하다고 생각합니다. 그림은 무작위로 순차적으로 분할하는 몇 가지 예를 더 명확하게 보여줍니다. 녹색 선은 훈련용, 노란색 선은 검증용입니다.


2) 훈련 샘플에서 모델을 훈련합니다(주기 전체에 걸쳐 사용되는 모델 매개변수와 예측자는 동일하며 평가하려는 매개변수임). 그런 다음 이 모델로 바로 이 데이터를 예측하고 예측을 평가합니다. 정확도, r ^ 2 또는 다른 것. 예를 들어 회귀 결과를 클래스로 반올림하고 추정을 위해 Cohen의 Kappa 함수를 사용합니다. 캐럿에서 가져온 것이므로 분류 정확도나 회귀 정확도보다 더 좋았습니다. 그러나 두 클래스에서만 작동합니다. 3개의 클래스에 대해 아무것도 제공하기 어렵다고 생각합니다. 평가는 각 클래스의 정확도를 개별적으로 고려하고 이를 기반으로 일종의 전체 평가를 제공하는 것이 중요합니다.
3) 훈련된 모델을 적용하여 검증 세트의 데이터를 예측하고 동일한 기능으로 예측을 평가합니다.
4) 두 평가(교육 및 검증)는 서로 가깝고 동시에 가능한 한 높아야 합니다. 최종 점수에 이 코드를 사용합니다. - (min(score1,score2) - (max(score1,score2)-min(score1,score2))) - 최소값에서 델타를 뺍니다.

각 반복이 끝나면 일부 점수가 얻어지며 데이터의 무작위 분할로 인해 -1에서 1까지(또는 사용된 함수에 따라 다른 간격으로) 달라질 수 있습니다. 평균값을 고려하고 그 결과로 피트니스 함수를 반환합니다. 또한 필요한 데이터 집합이 너무 큰 모델에 불이익을 주는 데 사용되는 각 예측 변수의 적합도 값에서 작은 수(0.0001)를 뺍니다.

나는 이것을 예측 변수와 모델 매개변수를 선택하는 유전학과 함께 사용하여 적합도 값을 최대화합니다.

마지막으로, 평균적으로 사용 가능한 훈련 데이터에 대해 좋은 예측 결과를 갖는 예측자 및 모델 매개변수 세트를 얻게 됩니다. 모델은 데이터에서 일부 패턴을 찾고 학습하며 동시에 훈련에 사용되는 데이터 샘플에 관계없이 새 검증 데이터에서 동일한 패턴을 성공적으로 찾을 수 있습니다.
매번 사용 가능한 데이터의 50%만 사용하여 모델을 학습하고 이를 기반으로 매개변수와 예측 변수를 선택하므로 이는 모델의 중요한 조건입니다.
샘플로 동일한 조건에서 위원회를 위한 모델을 훈련하거나 훈련을 위해 데이터의 50%를 순차적으로 선택해야 합니다. 각각의 새 모델에 대해 샘플(또는 순차 세트)에도 새 모델이 필요합니다.

그러한 위원회가 얼마나 오래 좋은 예측을 할 것인지는 알 수 없지만 훈련 데이터가 5년 동안이었다는 점을 감안할 때 위원회는 분명히 향후 5년보다 짧을 것입니다.
그리고 한 가지 더 중요한 점 - 위원회를 만드는 데 모든 시간을 들인 후에 수익성이 없게 거래되면 예측에 사용된 패키지가 Forex에 적합하지 않습니다. 자유도가 너무 높거나 적합하지 않을 수 있습니다. 다른 패키지를 가져가는 것이 좋습니다. 또는 훈련 데이터의 비율을 50%에서 훨씬 더 적게 줄일 수 있습니다.

이 포럼의 모든 조언과 경험.

훌륭한 요약.

축하합니다!

사유: