트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 33

 
mytarmailS :

이 "멋진" 포럼에서 사진을 삽입하거나 파일을 첨부할 수 없습니다. 문제가 무엇인지 알 수 있습니까?

오늘 사진첨부합니다. 이전 페이지의 게시물을 참조하세요. 이렇게하려면 메시지를 만드는 동안 Ctrl + Alt + I 키 조합을 눌러야합니다
 
유리 레셰토프 :

불행히도 내 RAR 아카이브의 압축을 풀 수 없습니다. IMHO 모든 것을 ZIP으로 포장하는 것이 좋습니다. 왜냐하면 모든 플랫폼에 ZIP 형식용 언패커가 있습니다. 또한 많은 사용자가 RAR을 사용하지 않습니다.



나는 확실히 볼 것이다. 비록 나는 R을 잘 모르지만.

포트가 수동으로 수행되었습니까? 아니면 어떤 종류의 기계를 통해 수행되었습니까?

다섯 번째 버전의 파일 형식이 변경되었으므로 새 버전의 winrar가 필요합니다. Zip이 바로 작동하지 않습니다. 크기가 너무 큽니다. 여기에 동일한 파일이 다시 있지만 이전 버전의 winrar를 통해 압축되었습니다.

수동으로 포트를 만들고 https://sourceforge.net/projects/libvmr/에서 파일을 가져와 수정 사항으로 복사하여 붙여넣었습니다. 구문은 대부분 비슷합니다. 주요 문제는 R 배열 인덱스가 0이 아니라 1부터 시작한다는 것입니다. 특히 Separator 클래스를 놓쳤습니다. R에는 이미 파일을 학습 및 테스트 샘플로 분리하기 위한 내장 함수(샘플)가 있습니다.

파일:
 

고마워 유리!

그래서 조사 과정에서 가장 부적합한 타겟은 고전적 응용에서 다음 캔들이나 지그재그를 예측하는 것과 같이 가격의 방향을 예측하는 것으로 나타났습니다. 그러한 타겟은 모호하지 않고 종종 혼동을 줍니다 네트워크나 다른 알고리즘을 사용하는 경우 지그재그의 성장에 따라 가격이 항상 증가하는 것은 아니며 네트워크가 이러한 데이터에서 학습하면 새로운 데이터에서 무언가를 인식하는 것이 극히 어려울 것이기 때문입니다. 즉, 결론은 다음과 같습니다. 목표는 가능한 한 명확하고 일관되게 설명되어야 합니다...

기호 정확히 같은 이야기 , 원칙적으로 동일한 "PCA"( 주요 구성 요소 방법)이 귀속될 수 있으며 모든 것이 매우 정확하고 명확하며 모호하지 않고 유익해야 하며 부드럽고 매끄럽고 모호하지 않아야 합니다.

모델에 대해 간단히

target - 지그재그 반전의 바로 그 사실(방향이 아님)

예측 변수 - 양초, 레벨 약 110개(충돌하는 데이터 없음)

데이터 5분

RF에 대해 훈련된 두 모델

새로운 데이터 작업

새로운 데이터에 대한 모델

나는 이것이 최고의 사진 중 하나라는 것을 말하고 싶습니다. 사실 상황은 훨씬 더 나쁩니다. 그러나 이것은 내가 지금까지 달성한 최고입니다 ....

또한 동일한 PCA를 사용하여 표시기를 추가하거나 기능의 차원을 줄이면 입력의 정확도가 떨어질 뿐만 아니라 완전히 사라집니다. 즉, 모든 것이 즉시 떠 있는 것처럼 보입니다. 이것이 바로 나는 기능의 불일치라고 부릅니다.


추신

나는 시장에서 네트워크 교육에 대한 고전적인 접근 방식을 최대한 활용했다고 생각합니다. 결과에 만족하지 않습니다. 이 규칙이 누군가에게 도움이 되기를 바랍니다. 그러나 이러한 규칙조차도 수용 가능한 결과로 이어지지 않을 것입니다. 예측 변수를 찾는 바로 그 개념을 변경해야 합니다. 훨씬 더 깊이 볼 필요가 있습니다. 저는 그러한 개념을 가지고 있지만 불행히도 개념 수준에서만, 이 개념에 관심이 있고 좋은 프로그래밍 기술을 가지고 있다면 기꺼이 이야기하겠습니다. 그러나 커뮤니케이션 측면에서가 아니라 구현 측면에서 제 프로그래밍 기술은 아직 초기 수준이기 때문에 ..

 
유리 레셰토프 :

나는 확실히 볼 것이다. 비록 나는 R을 잘 모르지만.

포트가 수동으로 수행되었습니까? 아니면 어떤 종류의 기계를 통해 수행되었습니까?

딸랑이를 잡습니다 - 초보자에게 매우 유용합니다. 한 시간 안에 배울 수 있습니다 - GUI.

한 번에 전체 모델링 주기: 데이터 마이닝, 모델 피팅(6가지 유형의 모델, 귀하와 유사한 모델 포함 - SVM), 평가. 또한 R 로그를 통해 초보자도 완성된 코드를 볼 수 있습니다. 앞으로 사용할 수 있습니다. 엑셀 파일을 받습니다. 즉, 엑셀을 준비할 수 있고, 마이크로리터에서 엑셀로 추방할 수 있습니다... 일반적으로 초기 데이터에는 전혀 문제가 없습니다.


숙련된 사용자에게도 유용합니다. 무언가를 알아내려면 시도해 보십시오.

R에서는 예측자를 선택할 수 있는지 작성해야 합니다. 그런 다음 딸랑이에 사용된 모델의 모드를 변경하고 다른 모델을 가져오고... 일반적으로 최소한 캐럿을 사용합니다. 그러나 먼저 특정 대상 변수에 대한 예측력이 있는 예측 변수입니다.

추신.

위의 게시물은 샘플 사용을 권장합니다.

나는 추천하지 않는다.

rattle 자체는 매우 복잡한 방식으로 파일을 나눕니다. 그러나 훈련, 테스트, 검증을 위한 세트 생성을 의미하는 경우 - 이렇게 하면 딸랑이 및 샘플 자체가 필요하지 않으며 이러한 세트 외부를 검사하기 위해 시뮬레이션할 때 매우 중요합니다. 향후 경매에서 소스 파일을 기계적으로 인덱스별로 나누어야 하며 첫 번째 부분은 덜렁거리고 두 번째 부분은 결과를 덜렁이로 비교해야 합니다. 같은 딸랑이에서 이것을 할 수 있습니다. 네 가지 오류가 모두 일치했으며 20% 미만의 오류에도 불구하고 앞으로 몇 년 동안 성배가 될 것입니다.

PSPS.

에서 딸랑이를 사용한 예는 파일이 첨부되어 있으니 직접 사용해도 되고 샘플로 사용해도 됩니다.

 
mytarmailS :

target - 지그재그 반전의 바로 그 사실(방향이 아님)

결국, 우리는 여전히 교사의 가치를 얻기 위해 지그재그를 취합니다. 어깨 위로 - 1, 어깨 아래로 - 0.

귀하의 용어로: "역전의 바로 그 사실"입니까? 그렇지 않다면 무엇을 의미합니까?

 
산산이치 포멘코 :


rattle 분할 자체는 매우 복잡한 방식으로 파일을 나눕니다. 그러나 훈련, 테스트, 유효성 검사를 위한 세트 생성을 의미하는 경우 - 이것은 덜걱거립니다.

내가 기억하는 한, 이것은 복잡하게 "샘플" 함수라고 불립니다 ;)
 
산산이치 포멘코 :

결국, 우리는 여전히 교사의 가치를 얻기 위해 지그재그를 취합니다. 어깨 위로 - 1, 어깨 아래로 - 0.

귀하의 용어로: "역전의 바로 그 사실"입니까? 그렇지 않다면 무엇을 의미합니까?

죄송해요 제가 표현을 잘 못했나봐요... 반전이 있었던 양초만 대상으로 하고 나머지는 다 다른 클래스 '반전 아님' 클래스
 
mytarmailS :
죄송해요 제가 표현을 잘 못했나봐요... 반전이 있었던 양초만 대상으로 하고 나머지는 다 다른 클래스 '반전 아님' 클래스
아주 흥미롭게 해봤는데 어째서인지 떨어뜨렸네요...기억이 안나네요
 
mytarmails :
내가 기억하는 한, 이것은 복잡하게 "샘플" 함수라고 불립니다 ;)
정확히는 딸랑이 자체가 하는 것이고 당신은 그것에 대해 전혀 알지 못할 수도 있습니다. 여기서 두 번째 부분은 과적합 추정에 근본적으로 중요하며 표본에서 얻어서는 안 됩니다.
 
산산이치 포멘코 :
아주 흥미롭게 해봤는데 어째서인지 떨어뜨렸네요...기억이 안나네요

그리고 거기에 어떤 예측 변수를 주었습니까?

내 이해 에 따르면 예측 변수와 목표는 하나의 전체와 같으며 모든 것이 거기에서 상호 연결되어야 합니다. 예측 변수로 200번째 이동 평균 을 제공하여 정확한 리바운드를 잡으려는 것은 매우 어리석은 일입니다. 교차하지 않는 두 개의 다른 우주와 같습니다.

사유: