트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 419

 
좋아, 여기에 던질게. 사실은 시장을 예측 하기 위해 어떤 데이터를 사용해야 하는지 알고 있지만 불행히도 전체 및 올바른 형식으로 수집하는 것은 불가능합니다. 누군가가 수집 구성을 도왔다면 최적화 도구를 그와 공유할 것입니다. , 글쎄, 일반적으로 전략. 데이터는 이미 충분하지만 훌륭하게 만들려면 무언가를 추가해야 합니다. 프로그래밍과 ksv 파일의 여러 사이트에서 온라인 데이터를 얻을 수 있는 능력이 뛰어난 사람은 누구입니까?
 
마이클 마르쿠카이테스 :
좋아, 여기에 던질게. 사실은 시장을 예측 하기 위해 어떤 데이터를 사용해야 하는지 알고 있지만 불행히도 전체 및 올바른 형식으로 수집하는 것은 불가능합니다. 누군가가 수집 구성을 도왔다면 최적화 도구를 그와 공유할 것입니다. , 글쎄, 일반적으로 전략. 데이터는 이미 충분하지만 훌륭하게 만들려면 무언가를 추가해야 합니다. 프로그래밍과 ksv 파일의 여러 사이트에서 온라인 데이터를 얻을 수 있는 능력이 뛰어난 사람은 누구입니까?
내 모델은 다중 스레드 및 다양한 데이터를 기반으로 합니다. 데이터 파싱 경험이 있습니다. 기꺼이 참여하겠습니다.
 

내 블로그에서 신경망 매개변수 선택에 대해 썼습니다. 신경망 구성 선택 .

최소한 초기 단계에서는 이렇게 하는 것이 좋습니다. 즉, 필요한 경우 NN을 단순화할 수 있습니다.

블로그의 선택 예시는 추상적이지만, 그런 고려에서 내 NN의 매개변수를 선택했습니다. 학습 결과는 일반적으로 좋습니다.

NS의 볼륨은 다소 무섭습니다. 이미 3개의 MA에 대한 예에서 이것은 이미 100개 이상의 뉴런이며 이것은 아직 TS가 아니라 공백일 뿐입니다.

 
유리 아사울렌코 :

내 블로그에서 신경망 매개변수 선택에 대해 썼습니다. 신경망 구성 선택 .

최소한 초기 단계에서는 이렇게 하는 것이 좋습니다. 즉, 필요한 경우 NN을 단순화할 수 있습니다.

블로그의 선택 예시는 추상적이지만, 그런 고려에서 내 NN의 매개변수를 선택했습니다. 학습 결과는 일반적으로 좋습니다.

NS의 볼륨은 다소 무섭습니다. 이미 3개의 MA에 대한 예에서 이것은 이미 100개 이상의 뉴런이며 이것은 아직 TS가 아니라 공백일 뿐입니다.

이것을 시도합시다-주말이나 다음 주에 흥미로운 예측 변수를 여기에서 버릴 것입니다. 그리고 당신은 그들에 대한 당신의 의견을 말해 줄 것입니다 ..? MT5의 지표 형태의 예측 변수만 4개

그리고 도전을 준비하는 것이 가능할 것입니다. 원하는 사람들 중 누가 이러한 예측자를 사용하여 돈을 벌기 위해 NN을 훈련할 수 있을까요? 그것들을 사용하여 유익하게 거래하기 위해, 그러나 나는 아직 많이 실험하지 않았습니다.

 
막심 드미트리예프스키 :

이것을 시도합시다-주말이나 다음 주에 흥미로운 예측 변수를 여기에서 버릴 것입니다. 그리고 당신은 그들에 대한 당신의 의견을 말해 줄 것입니다 ..? MT5의 지표 형태의 예측 변수만 4개

그리고 도전을 주선하는 것이 가능합니다. 원하는 사람들 중 누가 이 예측자를 사용하여 돈을 벌도록 NN을 가르칠 수 있을까요? :)

글쎄, 실제 거래하기 전에 나는 여전히 컷과 컷을해야합니다.) 그리고 나는 한 달 이상 그것을하고 있습니다.(사실, 간헐적으로.

물론 귀하의 지표를 보는 것은 흥미롭지만 죄송합니다. 제 지표를 게시하지 않겠습니다. 그러나 기초(2008년의 첫 번째 버전)는 여기에서 찾을 수 있습니다 - 버터워스 이동 평균 - MetaTrader 4에 대한 지표 . 물론 이제 모든 것이 다르게 수행됩니다.

 
유리 아사울렌코 :

글쎄, 실제 거래하기 전에 나는 여전히 컷과 컷을해야합니다.) 그리고 나는 한 달 이상 그것을하고 있습니다.(사실, 간헐적으로.

물론 귀하의 지표를 보는 것은 흥미롭지만 죄송합니다. 제 지표를 게시하지 않겠습니다. 그러나 기초(2008년의 첫 번째 버전)는 여기에서 찾을 수 있습니다 - 버터워스 이동 평균 - MetaTrader 4에 대한 지표 . 물론 이제 모든 것이 다르게 수행됩니다.


예, 질문이 아닙니다. 주기적으로 뇌가 튜브에 싸여 있고 외부의 의견이 필요하기 때문에 게시합니다. :)
 

나는 누구를 화나게하고 싶지 않지만, 슬프게도 대부분의 사람들은 목표를 올바르게 준비하는 방법을 모릅니다. 이 모든 고무적인 결과(75-80% 정확도)는 느린 양초(> 10분)가 있는 피쳐에서, 실제로는 순수한 땀입니다. 55%의 정확도는 샤프 비율을 2보다 높게 만들기에 충분하고 느린 데이터에서 60%의 정확도는 전설의 동일한 성배 , 샤프 비율 3-4, 실생활에서 아무도 이렇게 거래하지 않습니다, 오직 XFT -shniki, 그러나 그들은 거래 비용의 규모가 다르며 SR 이 적습니다. <2는 수익성이 없습니다.

간단히 말해서…

기능 을 대상 으로 하지 마십시오!

즉, 목표를 계산할 때 특성 계산에 사용되는 데이터를 사용할 수 없습니다. 그렇지 않으면 결과가 한 눈에 알 수 있습니다. 명백한 이유로 ZZ 와 같은 "손재주" 용광로로, 그것은 피처가 고려되는 영역까지 극단 사이를 보간합니다. 결과는 문제 없이 하늘 높이, 적어도 90% 정확도이지만 이것은 가짜입니다. 이를 바탕으로 "예측이 중요한 것이 아니다"라는 사실, 여전히 차량을 만들 수 있어야 한다는 등의 모호한 논의가 있습니다. 사실 이 "90%"는 여전히 같은 "즐겨찾기"이기 때문에 50%


신중하세요 :)

 
알료샤 :


간단히 말해서…

기능 을 대상 으로 하지 마십시오!

즉, 목표를 계산할 때 특성 계산에 사용되는 데이터를 사용할 수 없습니다. 그렇지 않으면 결과가 한 눈에 알 수 있습니다. 명백한 이유로 ZZ 와 같은 "손재주" 용광로로, 그것은 피처가 고려되는 영역까지 극단 사이를 보간합니다. 결과는 문제 없이 하늘 높이, 적어도 90% 정확도이지만 이것은 가짜입니다. 이를 바탕으로 "예측이 중요한 것이 아니다"라는 사실, 여전히 차량을 만들 수 있어야 한다는 등의 모호한 논의가 있습니다. 사실 이 "90%"는 여전히 같은 "즐겨찾기"이기 때문에 50%


신중하세요 :)

일반적으로 귀하의 결론과 마찬가지로 ZZ에 대한 귀하의 결론에 동의할 수 없습니다.

예를 들어, RSI. 이는 33을 특정 예측자로 보간하거나 그 반대로 보간합니다. 그 동안 나는 33에 대한 예측 변수인 RSI가 꽤 좋은 예측력을 가지고 있음을 보여줄 수 있습니다. 그리고 예를 들어, mashka는 ZZ에 대한 예측 능력이 없고 ZZ에 대해 100% 노이즈입니다. 예측자로서 완전히 쓸모가 없습니다. 마스코트를 기반으로 하면 10% 미만의 오차로 33에 대한 모델을 얻을 수 있지만 이 훈련된 모델을 훈련 파일과 연관되지 않은 새 파일에서 실행하면 임의의 오류.

ZZ에 대한 예측 변수 중 예측 변수가 있다고 지적한 문제 외에도 바로 이 ZZ가 얻어지며 대상 변수에 의존하지 않는 근본적인 또 다른 문제가 있습니다. 이것은 예측 변수가 다음과 같은 문제입니다. 대상과 관련이 없으며 특정 대상(33도 예외는 아님) 대상 변수 노이즈에 대한 것입니다. 소음은 매우 편리한 예측 변수입니다. 노이즈 값 중에서 예측 오차를 줄이는 값을 항상 찾을 수 있습니다. 이것을 이해하지 못했을 때 나는 종종 약 5%의 예측 오차를 받았습니다.

그러나 특정 대상 변수에 대한 노이즈에서 원래 예측 변수 집합을 정리할 수 있다면 적어도 저에게는 오류를 30% 미만으로 줄이는 것이 매우 어렵습니다.

마지막으로: 특정 대상 변수에 대한 잡음인 잡음 예측자는 과적합으로 이어지며 33도 예외는 아닙니다.

 
산산이치 포멘코 :

나는 일반적으로 귀하의 결론과 마찬가지로 ZZ에 대한 귀하의 결론에 동의할 수 없습니다.

예를 들어, RSI. 이는 33을 특정 예측자로 보간하거나 그 반대로 보간합니다. 그 동안 나는 33에 대한 예측 변수인 RSI가 꽤 좋은 예측력을 가지고 있음을 보여줄 수 있습니다. 그리고 예를 들어, mashka는 ZZ에 대한 예측 능력이 없고 ZZ에 대해 100% 노이즈입니다. 예측자로서 완전히 쓸모가 없습니다. 마스코트를 기반으로 하면 10% 미만의 오차로 33에 대한 모델을 얻을 수 있지만 이 훈련된 모델을 훈련 파일과 연관되지 않은 새 파일에서 실행하면 임의의 오류.

ZZ에 대한 예측 변수 중 예측 변수가 있다고 지적한 문제 외에도 바로 이 ZZ가 얻어지며 대상 변수에 의존하지 않는 근본적인 또 다른 문제가 있습니다. 이것은 예측 변수가 다음과 같은 문제입니다. 대상과 관련이 없으며 특정 대상(33도 예외는 아님) 대상 변수 노이즈에 대한 것입니다. 소음은 매우 편리한 예측 변수입니다. 노이즈 값 중에서 예측 오차를 줄이는 값을 항상 찾을 수 있습니다. 이것을 이해하지 못했을 때 나는 종종 5% 정도의 예측 오차를 받았습니다.

그러나 특정 대상 변수에 대한 노이즈에서 원래 예측 변수 집합을 정리할 수 있다면 적어도 저에게는 오류를 30% 미만으로 줄이는 것이 매우 어렵습니다.

마지막으로: 특정 대상 변수에 대한 잡음인 잡음 예측자는 과적합으로 이어지며 33도 예외는 아닙니다.


아주! 이 매우 중요한 주제에 대해 논의해 보겠습니다. 나는 무엇이 무엇인지 알아내기 위해 일련의 실험을 수행할 것을 제안합니다.

그래서 나는 확언한다:

1) 무작위에서 특징 및 분류의 수정, 합성   2개의 클래스에 대한 일련 의 시계열은 충분한 수의 샘플(5-10k)로 50% 정확도(동전과 같은)를 제공합니다. 통계적으로 유의미한 정확도 편향(>51%)이 있는 경우 기능 합성 및/또는 분류 프로세스에 오류가 있는 것입니다.

2) 특성 계산에 사용된 데이터를 사용하는 대상을 사용할 때 정확도에서 상당한 편향을 얻습니다(55, 60, 90%).   ON RANDOM TIME SERIES, 선험적으로 예측할 수 없는(50%). 그래서 이것은 거짓입니다.

 
알료샤 :


2) 특성 계산에 사용된 데이터를 사용하는 대상을 사용할 때 정확도에서 상당한 편향을 얻습니다(55, 60, 90%).   ON RANDOM TIME SERIES, 선험적으로 예측할 수 없습니다(50%). 그래서 이것은 거짓입니다.

왜 뭔가를 확인합니까? 그것은 나에게 분명하다.

나는 RSI-ZZ의 예를 들었습니다. 공통점은 없지만 50% 미만의 오차로 모델을 만들 수 있습니다.

또 다른 예: mashka-ZZ - 쉽게 10% 미만의 오류. 새 파일에서 테스트할 때 결과는 완전히 임의적입니다.

사유: