트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 948 1...941942943944945946947948949950951952953954955...3399 새 코멘트 Dr. Trader 2018.05.23 19:59 #9471 산산이치 포멘코 : 일반적으로 3등급의 목표는 그다지 좋지 않습니다. (-1.0)과 (0.1)의 두 가지 목표로 분할하고 위치를 결정할 때 결합하는 것이 좋습니다. 제가 3급을 요구한 내용입니다. 몇 페이지 전에는 대상이 두 개뿐인 동일한 파일이 있었습니다. 나는 두 가지 목표를 마스터하지 못했습니다. (한 수업은 양적으로 매우 편향되어 있고 또한 어렵습니다), 지금 세 가지를 시도하고 있습니다. СанСаныч Фоменко 2018.05.23 20:04 #9472 나는 randomForest를 기다렸지만 훈련 파일의 경우 원본 파일의 10%를 가져갔습니다. 결과는 다음과 같습니다. Number of observations used to build the model: 20276 Missing value imputation is active. Call: randomForest(formula = as .factor(arr_Buy) ~ ., data = crs$dataset[crs$sample, c(crs$ input , crs$target)], ntree = 500 , mtry = 7 , importance = TRUE , replace = FALSE , na.action = randomForest::na.roughfix) Type of random forest: classification Number of trees: 500 No. of variables tried at each split: 7 OOB estimate of error rate: 11.22 % Confusion matrix: - 1 0 1 class .error - 1 5335 314 21 0.05908289 0 95 8712 480 0.06191450 1 2 1363 3954 0.25662719 Variable Importance =================== - 1 0 1 MeanDecreaseAccuracy MeanDecreaseGini arr_Sell 223.88 208.20 164.24 216.84 3073.97 arr_DonProcVisota 25.86 57.39 53.05 57.46 203.17 Levl_Close_MN1 21.45 51.65 52.89 58.17 140.68 Levl_High_H4 22.35 51.81 50.33 58.17 118.24 Levl_Close_W1 20.11 48.85 49.94 52.90 145.82 arr_LastBarPeresekD_Down_M15 22.38 49.70 49.39 57.02 129.74 arr_Den_Nedeli 21.46 44.74 49.06 49.48 129.12 Levl_Low_H4 20.55 47.30 47.49 50.63 126.02 arr_Regresor 23.40 46.78 46.25 50.94 126.67 Levl_Close_D1 21.03 42.44 44.51 47.91 164.55 Levl_Support_D1 22.47 47.09 44.35 51.17 153.52 Levl_Low_H1 20.62 47.36 43.94 50.02 132.55 Levl_Support_W1 18.05 47.42 43.40 47.19 134.89 arr_DonProc_M15 23.81 50.52 42.83 52.10 184.02 arr_TimeH 20.55 41.15 42.07 42.59 109.51 arr_LastBarPeresekD_Up_M15 22.46 43.85 41.64 47.63 134.78 arr_DonProc 21.88 56.26 41.49 50.51 228.07 Levl_High_W1 20.78 40.34 41.27 45.67 91.07 Levl_Low_D1 18.87 39.05 40.81 42.30 116.54 Levl_Support_MN1 18.99 39.66 40.36 41.64 122.87 Levl_High_MN1 17.25 36.97 39.62 40.44 88.72 Levl_first_H4 18.77 38.39 38.71 42.28 70.63 arr_LastBarPeresekD_Down 19.31 42.64 37.27 44.06 150.78 Levl_Low_MN1 17.96 37.24 36.40 37.83 92.71 Levl_first_H1 14.43 35.64 34.62 37.45 78.99 Levl_High_D1 19.35 34.28 34.48 36.43 106.69 Levl_Close_H4 19.72 39.58 33.59 39.85 170.80 X_USE_Filter_MA_02 15.76 33.70 33.01 38.00 50.89 Levl_Support_H4 16.71 39.24 32.66 36.73 152.03 Levl_Low_W1 16.72 34.05 32.47 33.22 111.06 Levl_High_H1 17.58 33.14 31.93 33.90 117.74 Levl_Close_H1 19.09 35.94 30.80 35.35 160.90 Levl_first_W1 12.82 30.50 30.57 31.63 51.57 X_Use_Donchianf 13.69 28.78 30.46 31.47 59.44 Levl_first_MN1 13.94 27.58 30.02 29.14 59.58 arr_LastBarPeresekD_Up 15.96 31.32 28.67 30.59 142.72 Use_Filter_MA_Prirost 11.99 27.62 26.88 33.29 38.78 arr_Vektor_Don_M15 13.70 26.01 25.25 29.80 32.87 X_Use_BarPeresek_iMA_TF 11.40 18.48 25.17 25.30 20.57 Levl_first_D1 14.97 28.47 24.99 29.17 46.49 X_Use_Filter_Fibo_in_Day 12.43 24.34 24.84 29.00 45.29 Levl_Support_H1 17.57 29.98 24.77 28.92 141.18 arr_Vektor_Week 7.99 19.81 24.10 21.56 27.30 arr_RSI_Open_H1 10.31 25.18 23.80 29.74 27.62 X_USE_Filter_MA 12.64 22.15 22.22 25.99 41.49 arr_Vektor_Don 10.20 19.81 15.88 17.82 41.06 arr_Vektor_Day 11.65 15.07 15.62 16.44 25.24 arr_BB_Center 10.41 15.87 14.93 15.48 38.40 arr_BB_Up 7.78 10.50 14.74 13.99 17.23 X_Use_ChanelEvaProc 4.30 13.36 12.15 17.63 67.45 arr_RSI_Open_M1 7.45 12.63 10.49 13.56 25.92 arr_BB_Down 5.47 14.77 7.02 14.50 16.72 USE_Filter_MA_Donchian 0.72 0.10 4.71 3.29 1.78 Time taken: 2.29 mins СанСаныч Фоменко 2018.05.23 20:06 #9473 흥미로운 차트가 있습니다. 그에 따르면 트리의 수를 약 50개로 늘리면 오차가 줄어들지만 트리의 수를 100개 이상으로 늘린 후에는 완전히 비어있는 연습임을 알 수 있습니다. СанСаныч Фоменко 2018.05.23 20:10 #9474 다음은 검증 및 테스트의 결과입니다. 나는 그것들을 크게 가지고 있다. 원본의 45% Error matrix for the Random Forest model on Pred_027_2016_H2_T.csv [validate] (counts): Predicted Actual - 1 0 1 Error - 1 24023 1523 70 6.2 0 473 39706 1964 5.8 1 10 5858 17615 25.0 Error matrix for the Random Forest model on Pred_027_2016_H2_T.csv [validate] (proportions): Predicted Actual - 1 0 1 Error - 1 26.3 1.7 0.1 6.2 0 0.5 43.5 2.2 5.8 1 0.0 6.4 19.3 25.0 Overall error: 10.9 %, Averaged class error: 12.33333 %Error matrix for the Random Forest model on Pred_027_2016_H2_T.csv [test] (counts): Predicted Actual - 1 0 1 Error - 1 23847 1502 73 6.2 0 455 39677 1984 5.8 1 7 6024 17673 25.4 Error matrix for the Random Forest model on Pred_027_2016_H2_T.csv [test] (proportions): Predicted Actual - 1 0 1 Error - 1 26.1 1.6 0.1 6.2 0 0.5 43.5 2.2 5.8 1 0.0 6.6 19.4 25.4 Overall error: 11 %, Averaged class error: 12.46667 % СанСаныч Фоменко 2018.05.23 20:13 #9475 앞이 보이지 않는다면 꽤 괜찮은 편입니다. M1의 TS는 명확하지 않습니다. 스프레드 내에서 예측할 것입니다. Aleksey Vyazmikin 2018.05.23 20:13 #9476 산산이치 포멘코 : 나는 randomForest를 기다렸지만 훈련 파일의 경우 원본 파일의 10%를 가져갔습니다. 결과는 다음과 같습니다. 덕분에 결과를 보니 나쁘지 않은 것 같은데요? 그런데 예측변수 중요도 테이블로 볼 때 예측변수로 arr_Sell을 사용한 것 같나요? 그렇다면 이것은 사실이 아닙니다. 산산이치 포멘코 : 흥미로운 차트가 있습니다. 그에 따르면 트리 수를 약 50개로 늘리면 오류가 줄어들지만 트리 수를 100개 이상으로 늘리면 완전히 공허한 연습임을 알 수 있습니다. 그래서 그것은 아마도 논리적일 것입니다. 예측자가 많을수록 더 많은 결정을 내릴 수 있습니까, 아니면 문제의 본질을 올바르게 이해하지 못하는 것입니까? Aleksey Vyazmikin 2018.05.23 20:15 #9477 산산이치 포멘코 : 앞이 보이지 않는다면 꽤 괜찮은 편입니다. M1의 TS는 명확하지 않습니다. 스프레드 내에서 예측할 것입니다. 추세 전략이 있으며 Si의 MOEX 거래소에서 작동합니다. 확산은 중요하지 않습니다. СанСаныч Фоменко 2018.05.23 20:18 #9478 최종 결정을 내리려면: 매우 특정한 입력 파일의 조건에서 예측자의 예측 능력 테스트 물리적으로 입력 파일을 두 부분으로 나눕니다. 하나는 내가 한 작업을 수행하고 두 번째는 완성된 포리스트를 실행합니다. 오류가 일치하면 백만장자 또는 억만장자입니다! СанСаныч Фоменко 2018.05.23 20:20 #9479 알렉세이 비아즈미킨 : 추세 전략이 있으며 Si의 MOEX 거래소에서 작동합니다. 확산은 중요하지 않습니다. 분류의 추세는 무엇입니까? 클래스 예측 오류는 추세를 깨고 추세에 아무것도 남지 않습니다. СанСаныч Фоменко 2018.05.23 20:22 #9480 알렉세이 비아즈미킨 : 그런데 예측변수 중요도 테이블로 볼 때 예측변수로 arr_Sell을 사용한 것 같나요? 그렇다면 이것은 사실이 아닙니다. 물론, 전나무! 다른 무엇? 이제 계산하겠습니다. 1...941942943944945946947948949950951952953954955...3399 새 코멘트 트레이딩 기회를 놓치고 있어요: 무료 트레이딩 앱 복사용 8,000 이상의 시그널 금융 시장 개척을 위한 경제 뉴스 등록 로그인 공백없는 라틴 문자 비밀번호가 이 이메일로 전송될 것입니다 오류 발생됨 Google으로 로그인 웹사이트 정책 및 이용약관에 동의합니다. 계정이 없으시면, 가입하십시오 MQL5.com 웹사이트에 로그인을 하기 위해 쿠키를 허용하십시오. 브라우저에서 필요한 설정을 활성화하시지 않으면, 로그인할 수 없습니다. 사용자명/비밀번호를 잊으셨습니까? Google으로 로그인
일반적으로 3등급의 목표는 그다지 좋지 않습니다. (-1.0)과 (0.1)의 두 가지 목표로 분할하고 위치를 결정할 때 결합하는 것이 좋습니다.
제가 3급을 요구한 내용입니다. 몇 페이지 전에는 대상이 두 개뿐인 동일한 파일이 있었습니다. 나는 두 가지 목표를 마스터하지 못했습니다. (한 수업은 양적으로 매우 편향되어 있고 또한 어렵습니다), 지금 세 가지를 시도하고 있습니다.
나는 randomForest를 기다렸지만 훈련 파일의 경우 원본 파일의 10%를 가져갔습니다.
결과는 다음과 같습니다.
흥미로운 차트가 있습니다.
그에 따르면 트리의 수를 약 50개로 늘리면 오차가 줄어들지만 트리의 수를 100개 이상으로 늘린 후에는 완전히 비어있는 연습임을 알 수 있습니다.
다음은 검증 및 테스트의 결과입니다. 나는 그것들을 크게 가지고 있다. 원본의 45%
앞이 보이지 않는다면 꽤 괜찮은 편입니다.
M1의 TS는 명확하지 않습니다. 스프레드 내에서 예측할 것입니다.
나는 randomForest를 기다렸지만 훈련 파일의 경우 원본 파일의 10%를 가져갔습니다.
결과는 다음과 같습니다.
덕분에 결과를 보니 나쁘지 않은 것 같은데요?
그런데 예측변수 중요도 테이블로 볼 때 예측변수로 arr_Sell을 사용한 것 같나요? 그렇다면 이것은 사실이 아닙니다.
흥미로운 차트가 있습니다.
그에 따르면 트리 수를 약 50개로 늘리면 오류가 줄어들지만 트리 수를 100개 이상으로 늘리면 완전히 공허한 연습임을 알 수 있습니다.
그래서 그것은 아마도 논리적일 것입니다. 예측자가 많을수록 더 많은 결정을 내릴 수 있습니까, 아니면 문제의 본질을 올바르게 이해하지 못하는 것입니까?
앞이 보이지 않는다면 꽤 괜찮은 편입니다.
M1의 TS는 명확하지 않습니다. 스프레드 내에서 예측할 것입니다.
추세 전략이 있으며 Si의 MOEX 거래소에서 작동합니다. 확산은 중요하지 않습니다.
최종 결정을 내리려면:
추세 전략이 있으며 Si의 MOEX 거래소에서 작동합니다. 확산은 중요하지 않습니다.
분류의 추세는 무엇입니까? 클래스 예측 오류는 추세를 깨고 추세에 아무것도 남지 않습니다.
그런데 예측변수 중요도 테이블로 볼 때 예측변수로 arr_Sell을 사용한 것 같나요? 그렇다면 이것은 사실이 아닙니다.
물론, 전나무!
다른 무엇?
이제 계산하겠습니다.