트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 19

 
알렉세이 버나코프 :
아무 것도 낭비되지 않았습니다. 첫 번째 측정에서 클러스터를 인식합니다. 그런 다음 일련의 클러스터 변경이 있을 것입니다. 클러스터에서 클러스터로의 전환 지점에서 정방형 행렬을 만들고 거래의 MO를 변경할 수 있습니다. 클러스터 n에서 구매를 입력하고 클러스터 m에서 거래를 종료합니다. 그런 다음 셀에 대해 동일한 매트릭스입니다. 모든 옵션이 정렬됩니다. 그리고 클러스터링 매개변수를 변경하고 루프에서 결과를 볼 수 있습니다.
그리고 이것은 흥미롭다
 
트레이더 박사 :

r과 rattle에서 숲을 생성하기 위한 다른 매개변수가 있을 수 있으므로 결과가 다릅니다. 딸랑이 자체에서 나무와 변수의 수를 변경할 수도 있습니다.

그리고 훈련 데이터의 딸랑이에 34% 오류가 있고 테스트 데이터에 3% 오류가 있습니까? 테스트 데이터에 문제가 있습니다. 어떻게든 이미 훈련 데이터에 존재하거나 매우 작은 데이터 세트가 있고 그런 식으로 발생했습니다.

아니요, 모든 단계에서 덜거덕거림에 작은 실수가 있습니다.

모든 단계에서 R이 큽니다)

매개 변수는 동일하며 모든 매개 변수의 경우 이러한 간격이 불가능합니다.

 
젠장, 어떻게 여기에 파일을 첨부할 수 있습니까 ??? 또는 nafig를 첨부하지 않거나 멈춥니다..
 
mytarmails :

그리고 R 전문가를 위한 또 다른 질문

도서관(kza)

DAT <- rnorm(1000)

KZP <- kzp(DAT,m=100,k=3)

요약(KZP, 숫자=2, 상단=3)


이 수치로 작업할 수 있도록 "요약" http://prntscr.com/bhtlo9에서 이것을 어떻게 추출할 수 있습니까?

나에게도 그런 문제가 있다. 일반적으로 속성(KZP)을 실행하여 사용 가능한 변수 목록을 찾은 다음, 예를 들어 KZP$window 등을 살펴보고 필요한 숫자를 찾는 것으로 충분합니다. 그러나 여기에서 이러한 숫자는 요약 기능 자체에서 생성되며 어디에도 저장되지 않습니다.

소스는 다음과 같습니다. https://cran.r-project.org/web/packages/kza/index.html, 다음과 같이 해야 합니다.

summary.kzp <- function( object , digits = getOption( "digits" ), top= 1 , ...)
{
        cat( " Call:\n " )
        dput( object $call, control=NULL)

        M= object $window
         if ( is . null ( object $smooth_periodogram)) {       d<- object $periodogram } else { d<- object $smooth_periodogram }
        
        mlist<-rep( 0 ,top)
         for (i in 1 :top) {
                mlist[i]<-which.max(d)
                d[which.max(d)]=NA                      
        }

   cat( "\n Frequencies of interest:\n" )
   print((mlist- 1 )/M, digits=digits, ...)

    cat( "\n Periods of interest:\n" )
    print(M/(mlist- 1 ), digits=digits, ...)
    invisible( object )
}
 

Dr.Trader 에게 감사드립니다. 누군가 이 곱슬거리는 R에 대해 물어볼 수 있는 것이 얼마나 좋은지 모릅니다.

딸랑이와 관련하여 문제가 무엇인지 이해합니다. 딸랑이는 여전히 "샘플()" 데이터를 샘플링합니다. 이 작업이 필요한가요? 샘플링과 R에서 동일한 결과를 얻었지만 트릭은 새 데이터가 한 번에 하나의 양초에 들어 와서 샘플링할 수 없다는 것입니다.

전체 샘플을 샘플링하면 샘플 외를 포함하여 모든 기간에서 결과가 놀랍고 실제 데이터를 제출하면 모든 것이 항상 그렇듯이

따라서 문제는 이 샘플링이 전혀 필요한지 여부입니다.

 

네 필요합니다. sample - rattle의 도움으로 훈련 데이터를 여러 행 그룹으로 나눕니다(행은 75% / 15% / 15%의 비율로 3개의 테이블에 무작위로 분포됨). 하나의 입력 파일에서 3개의 테이블을 얻습니다. 이것은 열에 영향을 미치지 않으며 모든 테이블에서 동일합니다.

train table - 모델이 그것에 대해 훈련될 것입니다.

테이블 검증 및 테스트 - 학습 제어에 필요

작년에 대한 데이터를 가져오고 다음 달에 거래하기 위해 해당 데이터에 대한 모델을 훈련하려고 한다고 가정해 보겠습니다. 훈련 자체는 기차 테이블에서만 이루어집니다. 그런 다음 두 번째 또는 세 번째 테이블에서 모델을 확인하여 오류를 계산할 수 있습니다. 모델이 올바르게 훈련된 경우 훈련이 첫 번째 테이블만 사용하여 수행되었음에도 불구하고 세 테이블 모두의 오류는 거의 동일합니다.

이것은 랜덤 포레스트에서 확인하기 쉽습니다. 거의 모든 데이터 세트는 기차 테이블에서 0%의 오류를 줄 수 있습니다. 그러나 동일한 모델을 확인했지만 테스트 및 유효성 검사 테이블에서 50% 오류가 표시될 가능성이 큽니다. 그리고 이것은 모델이 다시 훈련되었음을 의미하며, mt5로 전송하면 보증금이 점차적으로 소진됩니다.
그러나 SanSanych의 예와 함께 이전에 게시된 RData 파일을 가져오면 기차 테이블의 숲에서 약 30%의 오류가 발생합니다. 모델이 훈련 중에 이러한 테이블의 데이터를 보지 못했다는 사실에도 불구하고 오류는 유효성 검사 및 테스트 테이블에서 거의 동일하게 유지됩니다. 이러한 모델은 mt5로 안전하게 이전되어 거래될 수 있습니다.

샘플링 없이 사용 가능한 모든 데이터를 가져오고 모델을 훈련하고 0% 오류를 보고 만족한다면 실제 거래에서 모든 것이 매우 나쁠 것입니다.

 
Dr.Trader :

네 필요합니다. sample - rattle의 도움으로 훈련 데이터를 여러 행 그룹으로 나눕니다(행은 75% / 15% / 15%의 비율로 3개의 테이블에 무작위로 분포됨). 하나의 입력 파일에서 3개의 테이블을 얻습니다. 이것은 열에 영향을 미치지 않으며 모든 테이블에서 동일합니다.

train table - 모델이 그것에 대해 훈련될 것입니다.

테이블 검증 및 테스트 - 학습 제어에 필요

작년에 대한 데이터를 가져오고 다음 달에 거래하기 위해 해당 데이터에 대한 모델을 훈련하려고 한다고 가정해 보겠습니다. 훈련 자체는 기차 테이블에서만 이루어집니다. 그런 다음 두 번째 또는 세 번째 테이블에서 모델을 확인하여 오류를 계산할 수 있습니다. 모델이 올바르게 훈련된 경우 훈련이 첫 번째 테이블만 사용하여 수행되었음에도 불구하고 세 테이블 모두의 오류는 거의 동일합니다.

이것은 랜덤 포레스트에서 확인하기 쉽습니다. 거의 모든 데이터 세트는 기차 테이블에서 0%의 오류를 줄 수 있습니다. 그러나 동일한 모델을 확인했지만 테스트 및 유효성 검사 테이블에서 50% 오류가 표시될 가능성이 큽니다. 그리고 이것은 모델이 다시 훈련되었음을 의미하며, mt5로 전송하면 보증금이 점차적으로 소진됩니다.
그러나 SanSanych의 예와 함께 이전에 게시된 RData 파일을 가져오면 기차 테이블의 숲에서 약 30%의 오류가 발생합니다. 모델이 훈련 중에 이러한 테이블의 데이터를 보지 못했다는 사실에도 불구하고 오류는 유효성 검사 및 테스트 테이블에서 거의 동일하게 유지됩니다. 이러한 모델은 mt5로 안전하게 이전되어 거래될 수 있습니다.

샘플링 없이 사용 가능한 모든 데이터를 가져오고 모델을 훈련하고 0% 오류를 보고 만족한다면 실제 거래에서 모든 것이 매우 나쁠 것입니다.

이해는 하지만 샘플링된 데이터만 봐도 3개 샘플 모두 오차가 작고 샘플링을 하지 않고는 크다는 풍자

오후에 메일을 보내주세요. 데이터를 보내 드리겠습니다. 직접 확인하거나 파일을 첨부하는 방법을 가르쳐 드리겠습니다. 파일이 첨부되지 않거나 포럼이 첨부하려고 하지 않기 때문입니다.

 

karoch, 내 모델(랜덤 포레스트)을 훈련했는데 결과가 만족스럽지 않지만 다음과 같이 재훈련되지 않습니다.

1) 무릎 0.5%로 목표 지그재그

2) 예측 변수 - 총 100개의 레벨 및 캔들(지표, 오실레이터 등 제외)

3) 모델 자체가 어떤 식으로든 최적화되지 않았으며 어리석게 분할 3을 설정했습니다. 나무 200개

4) 그런데 PrunePredictors(기능선택)를 거치면 100개의 예측변수 중 3개만 제거되고 총 97개의 예측변수가 남게 됩니다.

샘플은 훈련과 테스트, 훈련의 다섯 번째 부분의 두 부분으로 나뉩니다.

훈련에서 모델 오류 33%


테스트 시: 모델 오류 32%


이 짐승을 아직 이해하지 못했기 때문에 데이터는 샘플링되지 않았습니다.

이제 클러스터에 대해 생각할 수 있습니다.

 

포럼: 그림을 삽입하는 방법

이렇게 해야만 사진이 포럼에 영원히 남고 1년이 지난 후에도 모든 사용자가 사진을 보고 논의된 내용을 이해할 수 있습니다.

그러나 광고를 나르는 타사 서비스는 안전하지 않을 뿐만 아니라 잠시 후 사진을 삭제합니다.

 
mytarmailS :

문제는 동일한 데이터와 동일한 모델에 대해 R에서 다른 결과와 덜거덕거리는 이유가 아닙니다.

질문 2: "샘플이 아닌" 모델에서 딸랑이를 확인하는 요점이 무엇입니까?

당신은 내 게시물을 이해하지 못했습니다
사유: