트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 42

 
mytarmailS :

안녕하세요!

두 가지 질문이 있습니다

1) 마지막 페이지의 순환 네트워크에 대해 "rnn" 패키지를 삭제했는데 정말 이상하고 생각이 거의 없었고 "RSNNS"로 전환하고 "Elman" 네트워크를 사용하고 데이터를 업로드했으며 모든 것이 잘 작동했습니다. 그러나 하나의 "하지만"이 있습니다. 여기 "rnn"에서 "네트워크가 과거에 자신을 기억하는 정도"에서 설정하는 위치와 방법을 여전히 이해하지 못합니다. 각 변수가 계산되는 행렬로 바뀌는 것이 즉시 명확해졌습니다. 열은 말 그대로 네트워크 메모리의 크기에 해당했지만 "RSNNS" 에서는 그러한 매개 변수를 찾지 못했지만 순환 네트워크의 본질이 바로 이것에 있기 때문에 존재하지 않을 수 없습니다.

2) " rminer "에서 정확히 무엇을 볼 수 있습니까? "arima"와 같은 것을 의미한다면 이것은 이미 논의된 대로 작동하지 않을 것입니다.

나 자신은 여러 단계에 대해 예측하기 위해 분류기에 대해 그러한 목표를 작성하려고 시도했지만 예측할 수 없었고 컷이 어떻게 든 이상했습니다. 먼저 품질이 떨어졌습니다(예측이 다음 촛불이 아니기 때문에 이것은 정상입니다. 그러나 5일이나 10일)에는 반상관관계가 최소한 유지되고 덜 두드러지긴 했지만, 농담은 내가 선행효과를 얻지 못했고, 지표 반전이 시장 반전과 같은 위치에 있었다는 것, 즉, 사실, 나는 전에 가지고 있던 것을 얻었지만 더 나쁜 품질을 얻었습니다. 왜 나는 이해하지 못합니까?

안녕하세요.

1. Elman 네트워크는 Jordan 네트워크와 마찬가지로 이전 단계만 기억합니다. 이전 단계 중 많은 부분을 고려하려면 RNN을 체인에 연결해야 합니다. 이것이 소위 LSTM입니다. 이 기사 는 그러한 네트워크에 대해 매우 알기 쉽게 설명되어 있습니다. 불행히도 그것들은 파이썬으로 구현됩니다. 하지만 그건 문제가 되지 않죠? Python과 R은 완벽하게 통합되어 있습니다.

2. rminer 에는 lforecast 기능이 있습니다. 입력으로 1-ahead 예측을 반복적으로 사용하여 다단계 예측을 수행합니다. 몇 단계 앞서 예측하는 것에 대해 말하면, 확실히 회귀를 의미합니까?

행운을 빕니다

 
mytarmailS :


결론 : 각 표시를 가져 와서 유용한 것을 분리해야합니다.이 작업을 수행하는 방법에 대한 생각이 있지만 그것을 말하기 전에이 문제에 대한 귀하의 생각, 아이디어 및 제안을 듣고 싶습니다.

기록 데이터에서만 기호에서 무언가를 분리하는 것이 가능합니다. 새로운 막대가 올 때 기호는 무언가를 예측해야 하고, 예측하려면 예측 능력이 있어야 합니다. 예측 능력은 특성의 특정 효능입니다. 이것은 일부 특성 값이 한 클래스를 예측하고 다른 특성 값이 다른 클래스를 예측할 때입니다. 나는 이미 그러한 예측 능력의 예를 들었다. 대상: "남성/여성". 기호: "옷". 기능에 바지/치마라는 두 가지 의미만 있는 경우 이슬람 사회에서 이러한 값을 가진 기능은 클래스를 명확하게 예측합니다. 그러나 비무슬림 사회에는 엄청난 수의 품목 외에도 남녀공용 의류가 있습니다.

따라서 "남성/여성" 클래스의 두 값을 갖는 대상 변수에 대해 "의류" 속성의 예측 능력을 결정하는 문제는 다음과 같이 공식화됩니다. 옷 속성 값의 몇 퍼센트가 남성을 명확하게 예측하고 여성의 비율은 얼마입니까? 이것이 서구 사회이고 모든 옷이 남녀공용이라면 "옷" 기호는 예측 능력이 없습니다. 이슬람 사회에서 "옷"이라는 속성은 매우 좋은 예측 능력을 가질 것입니다. age....를 입력하여 예제를 더 현실적으로 만들면 더 현실적인 예측력을 얻습니다. 그것은 구체적이며 예측 오류를 결정하는 것은 이 예측 능력입니다.

저것들. 예측자의 예측 능력에서 예측 오차가 따르며, 선택한 모델이 기존 문제와 일치하면 이 오차는 모델 선택에 거의 의존하지 않습니다.

아이디어와 제안에서.

이 스레드와 이 포럼에서 여러 번 표현했습니다. 가장 큰 어려움은 "예측 능력"에 대한 나의 관점이 아직 우리의 이해가 아니라는 것입니다.

그 도구들 중 제가 기사 링크를 줬고 Dr.Trader 에서 적용을 시도했지만 성공하지 못했습니다. 나는 그의 결과의 부정적인 점을 그의 특징 세트의 특수성, 즉 작은 가치를 가진 많은 특징 때문이라고 생각합니다. 이것은 Forex를 위한 매우 구체적인 기능 세트입니다. Forex에서 모든 기호는 수천 개의 값을 가질 수 있으며 수십 가지가 있습니다.

Principal Components Regression, Pt. 3: Picking the Number of Components | R-bloggers
Principal Components Regression, Pt. 3: Picking the Number of Components | R-bloggers
  • Nina Zumel
  • www.r-bloggers.com
In our previous note we demonstrated Y-Aware PCA and other y-aware approaches to dimensionality reduction in a predictive modeling context, specifically Principal Components Regression (PCR). For our examples, we selected the appropriate number of principal components by eye. In this note, we will look at ways to select the appropriate number...
 
산산이치 포멘코 :

이 스레드와 이 포럼에서 여러 번 표현했습니다. 가장 큰 어려움은 "예측 능력"에 대한 나의 관점이 아직 우리의 이해가 아니라는 것입니다.

이 관점이 귀하의 테스트 또는 테스트 결과 에서 지원되지 않기 때문일 수 있습니까? :)

그리고 일반적으로 왜 이러한 킬로미터 길이의 교육 프로그램은 표지판에서 유용한 것을 얻는 방법이 아니라 표지판을 선택하는 방법이었습니다. 이것들은 다른 것입니다. 여기 기사에 대한 링크는 일반적으로 어디에도 없습니다 ...

 
mytarmailS :

이 관점이 귀하의 테스트 또는 테스트 결과 에서 지원되지 않기 때문일 수 있습니까? :)

그리고 일반적으로 왜 이러한 킬로미터 길이의 교육 프로그램은 표지판에서 유용한 것을 얻는 방법이 아니라 표지판을 선택하는 방법이었습니다. 이것들은 다른 것입니다. 여기 기사에 대한 링크는 일반적으로 어디에도 없습니다 ...

우리는 킬로미터 교육 프로그램을 작성해야 합니다. 요컨대, 기호는 하나의 전체이며 아무 것도 빼낼 수 없습니다. 전체 기능이 맞는지 여부를 결정할 수 있습니다.

추신.

나는 예측 능력이 있는 기능의 선택을 주문하기 위해 수행합니다. 내 알고리즘에 따라 선택한 기능을 사용할 때 재학습 없이 모델을 얻습니다.

 
산산이치 포멘코 :

우리는 킬로미터 교육 프로그램을 작성해야 합니다. 요컨대, 기호는 하나의 전체이며 아무 것도 빼낼 수 없습니다. 전체 기능이 맞는지 여부를 결정할 수 있습니다.

글쎄, 어떻게 할 수 있는지 이해하지 못한다면 그것이 불가능하다는 것을 의미하지는 않습니까? 나는 매시 이론과는 거리가 멀지만 몇 가지 옵션이 있습니다. 학습
 
산산이치 포멘코 :

추신.

나는 예측 능력이 있는 기능의 선택을 주문하기 위해 수행합니다. 내 알고리즘에 따라 선택한 기능을 사용할 때 재학습 없이 모델을 얻습니다.

와우, 멋지네요... 재학습되지 않은 모델의 구체적인 결과를 말씀해 주시겠습니까? 또는 "보이는" 로봇과 "벌고 있는 것 같은" 로봇처럼 가능한 모든 방법으로 이 주제를 "건너뛸" 것입니다.

그리고 일반적으로 Sanych는 이미 충분할 수 있습니다?!?!

실제로 아닌 것에 대해 이야기하기 위해 모든 것이 오랫동안 나에게 분명해졌습니다 ...

이건 안 좋은데, 냉정하게 말해서 당신을 읽고 아무데도 가지 않는 길을 하이킹하는 데 시간을 보내는 다른 회원들과 관련하여

 
mytarmailS :

와우, 멋지네요... 재학습되지 않은 모델의 구체적인 결과를 말씀해 주시겠습니까? 또는 "보이는" 로봇과 "벌고 있는 것 같은" 로봇처럼 가능한 모든 방법으로 이 주제를 "건너뛸" 것입니다.

그리고 일반적으로 Sanych는 이미 충분할 수 있습니다?!?!

실제로 아닌 것에 대해 이야기하기 위해 모든 것이 오랫동안 나에게 분명해졌습니다 ...

이건 안 좋은데, 냉정하게 말해서 당신을 읽고 아무데도 가지 않는 길을 하이킹하는 데 시간을 보내는 다른 회원들과 관련하여

행운을 빕니다.
 
mytarmailS :

수준과 "RSI"지표의 두 가지 신호만 있고 판매 거래가 있는 거래 시스템이 있다고 가정해 봅시다. 이렇게 들립니다 - 레벨이 깨지고 RSI가 0.9를 넘으면 매도...

거래 시스템이란 무엇입니까? 거래 시스템 이 경우 거래자가 노이즈에 들어가는 것을 허용하지 않는 필터인 데이터 필터 역할을 하며 이 예에서 RSI와 노이즈의 비율은 농담이 아닙니다. RSI 범위가 -1부터이기 때문입니다. 1로, 상인은 >0.9 그 5%만 필요합니다. ...

12개의 다른 지연이 있는 12개의 지표를 취하면 잘 작동합니다. 그러나 어떤 지표를 취하고 어떤 시차가 있는지는 여전히 결정해야 합니다. 우선, 그들 중 많은 수를 취하여 몇 가지 규칙에 따라 일부를 선택하십시오. 그러면 이 수백 개의 최종 예측자의 전체가 이미 미래를 예측할 수 있는 진정한 기회를 제공할 것입니다. 래틀(임의의 포리스트)에서 포리스트 모델을 가져와 데이터를 제공한 다음 의사결정 트리를 만듭니다. 예를 들어, rsi[20]>0.4이고 ma(16)[20]>1.2이면 구매합니다. 그리고 rsi <0.1이면 판매입니다. 숲의 모습에 대한 샘플 사진은 http://www.intuit.ru/studies/courses/6/6/lecture/174 에서 찾을 수 있습니다. 일반적으로 숲은 한 번에 수십 개의 지표에 대해 원하는 대로 격리된 유용한 값과 임계값이 있는 바로 그 표시를 제공합니다.

숲이 다시 훈련하는 경향이 있다는 뉘앙스가 있습니다. 유용한 예측 변수와 함께 일부 쓰레기도 포리스트에 공급하면 포리스트가 이를 논리에 추가합니다. 그리고 "입력의 쓰레기는 출력의 쓰레기로 이어진다"라는 규칙에 따라 쓰레기를 기반으로 구축된 모델의 예측은 데이터 전면 테스트에서 무작위이며 쓸모가 없습니다. 이는 예측 변수를 선택할 때 항상 고려되어야 하며 모델을 테스트하기 위해 교차 검증을 수행해야 합니다.

 
mytarmailS :

이건 안 좋은데, 냉정하게 말해서 당신을 읽고 아무데도 가지 않는 길을 하이킹하는 데 시간을 보내는 다른 회원들과 관련하여

SanSanych가 여기에 쓴 내용에 전적으로 동의합니다. 들어보길 권합니다. 나는 그에게서 많은 것을 배웠고, 확인하고, 기억을 위해 적었습니다.
 
Dr.Trader :
SanSanych가 여기에 쓴 내용에 전적으로 동의합니다. 들어보길 권합니다. 나는 그에게서 많은 것을 배웠고, 확인하고, 기억을 위해 적었습니다.
그리고 Sanych의 길을 따르면 이미 낮은 확률로 탐내는 1 %를 칠 확률을 크게 줄일 수 있다고 생각합니까?
사유: