트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 2380

 
알렉세이 비아즈미킨 :

컬럼인줄 착각했네요.

그런데 샘플이 있는 파일에 대해 전체 교육을 수행하고 다른 파일을 확인할 수 있습니까?

알렉스, 무엇이든 가능합니다!

근데 관심없어..

R을 배우십시오! 특히 훈련용으로 사용하기 좋은 언어입니다.
 
mytarmailS :

알렉스, 무엇이든 가능합니다!

근데 관심없어..

R을 배우십시오! 특히 훈련용으로 사용하기 좋은 언어입니다.

도와 주셔서 감사합니다.

정확도(Precision)와 재현율(Recall)은 CatBoost 보다 훨씬 뛰어납니다.

모든 샘플을 하나의 파일로 병합했습니다.

그렇다면 우리는 이런 방향으로 생각해야 하지 않을까요?

 
알렉세이 비아즈미킨 :

도와 주셔서 감사합니다.

정확도(Precision)와 재현율(Recall)은 CatBoost 보다 훨씬 뛰어납니다.

모든 샘플을 하나의 파일로 병합했습니다.

그렇다면 우리는 이런 방향으로 생각해야 하지 않을까요?

새로운 데이터나 훈련 데이터 중 어느 것이 더 낫습니까?

여기 저기 숫자가 어떻게 되나요?

 
도서관 :

새로운 데이터나 훈련 데이터 중 어느 것이 더 낫습니까?

여기 저기 숫자가 어떻게 되나요?

아아, 내가 틀렸습니다. 정확도는 더 좋지 않고 더 좋지 않습니다.



그러나 이것은 어려운 샘플입니다. 실제로 배울 수는 없습니다. 내일 저는 CatBoost에 좋은 모델이 있는 다른 샘플을 시도할 것입니다. 글쎄, 나는 모델의 매개 변수를 이해하지 못하므로 비교가 매우 공정하지 않을 수 있습니다.

Recall이 크기 때문에 이 모델은 일반적으로 별도의 예측 변수로 사용할 수 있습니다. 그런데 이 케이스를 어떻게 파일에 올려야 할지 모르겠습니다 :)

 
막심 드미트리예프스키 :

여기에는 실수로 정확하게 말해도 아무도 고마워하지 않을 정도로 역설적인 상황이 있습니다.

평가기준이 없기 때문)

아니요, 평가와 인정은 전혀 필요하지 않습니다. 그러면 확실히 떨어지지 않기 때문입니다)

오히려 포럼 아이디어에서 상식을 찾으려고 할 때 일종의 연습이나 퍼즐로 간주합니다)

이 특별한 경우에 로지스틱 회귀가 분류에 사용된다면 올가미가 상당히 적용될 수 있을 것 같습니다.

 

다른 샘플을 시도했습니다 - 신청합니다


X <- read.csv2( "F:\\FX\\Открытие Брокер_Demo\\MQL5\\Files\\ZZ_Po_Vektoru_TP4_SL4_Si_QMini_02_Bi\\Si_cQq\\Setup\\xxx.csv" )
Y <- X$Target_100
X <- as .matrix(within(X, rm( "Time" , "Target_P" , "Target_100" ,
                             "Target_100_Buy" , "Target_100_Sell" )))
library (glmnet)
tr <- 1 : 14112 # train idx
best_lam <- cv.glmnet(x = X[tr,], 
                      y = Y[tr],alpha = 1 , 
                      lambda = 10 ^seq( 2 , - 2 , by = -. 1 ), 
                      nfolds = 5 )$lambda.min

lasso_best <- glmnet(x = X[tr,], y = Y[tr], alpha = 1 , lambda = best_lam)
pred <- predict(lasso_best, s = best_lam, newx = X[-tr,])

sma <- TTR::SMA(pred, 20 )
pred2 <- c(pred-sma) ; pred2[pred2> 0 ] <- 1 ; pred2[pred2<= 0 ] <- 0

yy <- tail(Y[-tr] , 3528 )
pp <- tail(pred2 , 3528 )
caret::confusionMatrix( as .factor(yy), as .factor(pp))
    Reference
Prediction     0      1
         0 1063    860
         1    567 1019
문제는 모델을 가져오는 방법과 우선 분류를 파일에 저장하는 방법입니다.
파일:
xxx.zip  482 kb
 
알렉세이 비아즈미킨 :

다른 샘플을 시도했습니다 - 신청합니다


문제는 모델을 가져오는 방법과 우선 분류를 파일에 저장하는 방법입니다.

katbust는 상당히 강력한 정규화를 가지고 있습니다. 특히 기호가 범주형인 경우 부스트에서 그렇게 선언해야 합니다.

 
막심 드미트리예프스키 :

katbust는 상당히 강력한 정규화를 가지고 있습니다. 특히 기호가 범주형인 경우 부스트에서 그렇게 선언해야 합니다.

바이너리의 경우 범주형인지 아닌지는 중요하지 않습니다.

정규화를 줄일 수 있습니다. 좋은 생각입니다. 감사합니다.

한편, 표본의 검사 부분에서는 올가미가 더 나은 결과를 보였다.

 
막심 드미트리예프스키 :

저것들. 기간 5 또는 가격 차이가 있는 어떤 종류의 기계 에 대한 거래를 표시하고 어떤 일이 발생하는지 확인합니다.

동시에 훈련 중에 징후도 부드럽게 나타납니다.


같은 방법으로 시도하십시오. 커스텀 테스터에서 잘 나왔는데, 모델을 내보낼 때 문제가 있는데 나중에 오류를 찾아봐야겠습니다.

 
알렉세이 비아즈미킨 :

바이너리의 경우 범주형인지 아닌지는 중요하지 않습니다.

정규화를 줄일 수 있습니다. 좋은 생각입니다. 감사합니다.

한편, 표본의 검사 부분에서는 올가미가 더 나은 결과를 보였다.

아마도 이것은 시험 샘플의 좋은 부분일 것입니다. 그리고 그것에 가장 적합한 매개변수가 있는 모델을 선택하여 조정합니다.

이제 저는 항상 교차 검증(또는 진행)으로 확인합니다. 작은 영역에는 적합하지 않지만 모든 데이터에 대해서는 즉시 이것이 최고의 훈련 옵션이라고 생각합니다.
Doc은 또한 그녀에게 포럼에서 사라지기 전에 확인하라고 조언했습니다.