트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 170

 
알렉세이 버나코프 :

다시 한 번, 나는 또한 수십 개의 모델을 가지고 있으며 예측 변수와 매개 변수도 휘젓습니다. 그리고 이 모델들은 각각 8년의 기간 동안 확실한 플러스가 됩니다! 그리고 이것은 테스트 기간입니다. 그러나 테스트에서 선택한 "가장 좋은"모델이 지연 샘플링으로 확인되면 놀라움이 있습니다. 그리고 이것을 호출합니다. 모델은 교차 검증을 위해 조정됩니다.

예를 들어, 지연된 샘플에 대해 검증을 수행했습니다. 연기된 데이터 병합에 대한 모델을 인정합시다. 그런 경우에는 어떻게 합니까? 지연된 샘플에 대한 유효성 검사를 성공적으로 통과하기 위해 매개변수에서 무언가를 선택하기 위해 다시 시작하면 기본적으로 교차 검증에 지연된 샘플의 데이터를 포함하고 교차 검증도 적합하게 됩니다. 새로운 지연된 가져오기를 추가하여 이 문제를 해결할 수 있습니다. 그리고 모델도 여기에 병합되면 어떻게 될까요? 전달할 매개변수와 보류 중인 새 샘플을 선택하려면? 끝없는 레이스입니다.

교차 검증에 지연된 샘플링을 포함하고 새로운 지연된 샘플링을 생성하는 것은 선택 사항이 아니지만 행운이 당신에게 미소 짓고 모델이 실수로 지연된 검증을 통과할 때까지 끝없는 반복입니다. 그런 다음 멈출 수 있지만 이것은 외환 결정이 아니지만 운이 당신에게 미소 지었지만 통계에 따르면 배수가 될 것입니다.

따라서 문제는 지연된 데이터의 모델이 병합되었다고 가정해 보겠습니다. 그런 경우에는 어떻게 합니까?

 
Dr.Trader :

따라서 문제는 지연된 데이터의 모델이 병합되었다고 가정해 보겠습니다. 그런 경우에는 어떻게 합니까?

그렇게 생각했는데 질문이 너무 사적이었어요 :)

이 방법이 더 좋습니다. 모델이 지연된 샘플링 테스트에 실패하면 교차 검증에 지연된 샘플링을 포함하고 새로운 지연된 샘플링을 생성합니까? 아니면 다르게 행동합니까?


예를 들어, San Sanych가 이미 1000번 반복한 것을 기초로 삼았습니다. 예측자의 품질을 평가해야 합니다. "품질"은 느슨한 개념입니다. 예를 들어 이러한 교차 검증을 통해 수행하며 이는 모델 매개변수보다 예측변수의 선택입니다 . 모델이 훈련 중에 어떤 영역의 데이터에서도 동일한 종속성을 찾으면 예측 변수가 대략적이라는 중요한 인수입니다.
나는 당신이 앙상블을 교환해야 한다는 내 접근 방식을 좋아하지 않습니다. 종속성이 일정하면 마지막에 선택한 예측자에 대해 하나의 모델만 훈련하는 것으로 충분하며 동일한 종속성을 다시 찾고 자체적으로 거래할 수 있습니다. 그러나 예측 변수 선택에서 누락된 것이 있는데 하나의 모델이 대처할 수 없습니다.

 
Dr.Trader : 예측 변수의 품질....
대상의 속성이 그다지 중요하지 않다는 것은 원시적인 예를 따릅니다...
 
나는 더 많은 것을 말할 것이다. 목적 함수는 알고리즘이 분리를 만드는 데 도움이 되는 목적 함수이기 때문에 모델을 구축할 때 매우 중요한 포인트입니다. 이 문제를 두 번 이상 겪었지만 완전히 해결하지 못해서 목표를 50핍 형태로 남겨두었습니다. 스프레드보다 약간 높은...
 
알렉세이 버나코프 :

다시 한 번, 나는 수십 개의 모델을 가지고 있으며 예측 변수와 매개 변수도 휘젓습니다. 그리고 이 모델들은 각각 8년의 기간 동안 확실한 플러스가 됩니다! 그리고 이것은 테스트 기간입니다. 그러나 테스트에서 선택한 "최상의" 모델이 지연 샘플링으로 확인되면 놀라움이 있습니다. 그리고 이것을 - 교차 검증을 위해 모델이 조정됩니다.

이것을 이해하면 순수한 실험이 계속됩니다. 이것이 명확하지 않으면 실생활에서 품질이 여러 배로 떨어지는 것을 볼 수 있습니다. 99%의 경우에 관찰됩니다.

이 모든 것은 시장이 종종 자체 통계 메가에 반하기 때문에 발생합니다 ...

1) 먼저 내가 그렇게 생각하는 이유를 보여주고 증명할 것이다.

2) 그런 다음 왜 이런 일이 발생하는지 설명하겠습니다. 바로 그 과정의 역학

두어시간 줘...

나는 스스로 그것을 가지고 있지 않기 때문에 기성품 솔루션을 제공하지 않을 것이지만 프로세스에 대한 이해는 이미 무언가 ...

하나)

===================================================== ================

내가 한 첫 번째 일은 확률적 출력으로 두 개의 심층 네트워크를 훈련하는 것이었습니다. 실제로 모든 네트워크가 수행할 것입니다. 가장 중요한 것은 네트워크의 출력이 명확한 클래스 답이 아니라는 것입니다. "1", "0", 하지만 확률 클래스에 속하는 것, 즉 출력은 유효합니다 - "0.13" 그리고 이것은 현재 데이터가 확률로 클래스 "1"에 속한다는 것을 의미합니다 - "0.13%"

하나의 네트워크는 구매 전용으로 훈련했고 두 번째 네트워크는 판매 전용으로 훈련했습니다.

마을의 신호(목표 재미. )는 적어도   가격의 0.2%,


일

즉,   사실 역전점을 노리고... 타겟은 이렇게 생겼어요   "000000000010000000000" 여기서 "1"은 마을의 회전이고 "0"은 회전이 아닙니다.

차례의 경우 모든 것이 각각 동일합니다 ...

마지막 세 개의 OHLC 양초의 모든 가격이 예측 변수 로 사용되었습니다. 모든 종류의 조합을 만들었습니다.   그들 사이의 차이점

따라서 네트워크가 훈련되고 네트워크 예측(해당 출력)을 가져와 가격 아래 차트를 작성합니다. 아래 차트는 구매 및 결제를 위한 두 네트워크의 출구를 보여줍니다. 예를 들어 마을로의 네트워크 출구는 다음 캔들에서 하향 반전이 있을 확률을 의미합니다. 그림 참조. 1, 모든 것이 베이에 대해 동일합니다 ..

녹색은 베이로의 네트워크 출력을 나타내고 빨간색은 마을로의 네트워크 출력을 나타냅니다.

에프

자세히 보면   도에 2, 가격 차트가 이러한 확률에 반대되는 것을 눈으로 보아도 알 수 있습니다.   확률이   상향 반전은 하향 반전 가능성이 더 높으며(녹색 그래프가 빨간색 그래프보다 높음) 가격은 항상 하락합니다. 사실 우리는 네트워크에 그 반대로 가르쳤지만 시장이 자체 통계와 반대로 움직이고 있다고 가정할 수 있습니다. 데이터를 보다 시각적으로 표현하려고 합니다.   먼저 구매 및 마을에 대한 네트워크 출력의 누적 합계를 작성해 보겠습니다.

정액 (buy.neural)     ;    정액(sell.neural)

나

쌀. 삼

그리고 이제 우리는 대부 사이의 차이를 만들 것입니다. 구매 및 금 네트워크의 양. 합집합   마을을 위한 네트워크

정액 (buy.neural)     -     정액(sell.neural)


씨

도 1을 참조하여 알 수 있듯이. 파란색 차트와 가격 차트의 4에서 가격은 완전히 반비례합니다.   네트워크 예측(파란색 그래프). 좀 더 명확하게 하기 위해 파란색 그래프의 부호(반전)를 변경하겠습니다.

정액 (buy.neural)     -     정액(sell.neural)   /   -하나

에게

도를 보면 5개의 의혹이 남아있다   가격은 네트워크의 예측과 반대이며 흥미로운 결론을 도출할 수도 있습니다.   뭐라고요   신경망과 그 통계적 확률의 도움으로 우리는 완전히   다음 캔들에서 반전이 있을지 없을지 확률적 지식에 의해서만 가격을 재구성합니다.

그리고 이 모든 것은 매우 훌륭하지만 본질적으로 쓸모가 없습니다. 우리의 파란색 차트에는 예측 기능이 없기 때문에 가격을 능가하지 않지만 "유지"합니다. 즉, 본질적으로 차이가 없습니다. 가격을 보십시오. 또는 파란색. 그래프이지만 시장의 역학은 이해할 수 있습니다.   - "하향 반전 가능성이 있는 경우   반전 가능성보다 더 높으면 가격이 올라갈 것입니다. " 당신은 미래에 그것을 구축 할 수 있습니다 ...

===================================================== =========================

이동....

훈련된 은닉 마르코프 모델 HMM 또는 부르주아 HMM - 은닉 마르코프 모델

이것은 비 고정 데이터에 특별히 사용되는 확률 모델이며 다음을 포함한 시장에 대해 말합니다.

2개의 모델도 만들어졌는데, 타겟 하나만은 반전이 아니라 그냥 추세를 잡아서 한 모델은 상승 추세를 파악하고 확률적 추정을 하고, 다른 모델은 하락 추세의 확률을 줬습니다.

N

거래에주의를 기울이지 마십시오. 나는 거기에서 무언가를 실험했습니다 ..

그래서 아래에 상승 추세 녹색 과 하락 추세 빨간색 의 확률을 가진 두 개의 벡터가 있습니다 . 검은색 선은 모델이 생성하는 피크 확률과 같으며, 표준 편차일 뿐이며, 볼린저가 더 간단합니다.

모델이 어떤 이벤트의 피크 확률을 제공하기 시작하면(아래에서 위로 검은색 선을 넘어) 모든 것이 반대 방향으로 발생합니다...
그래서 여기, 사실, 우리는 우리 자신의 통계에 비해 가격이 움직였습니다...

그리고 이제 시장이 그런 야수라면) 그러한 행동을 보이는 MO 알고리즘이 시장을 예측할 수 있는지 생각해 봅시다. 실제로 RF가 무엇인지, 네트워크가 무엇인지, SMM이 무엇인지 등 .. 어떤 식 으로든 통계적으로 예측을 작성하는 경우 ....

사실 이것은 최적화(최적화)가 최소 3배 유전적이며 4배 교차 검증이 되었는지 여부에 관계없이 최적화 후 두 번째 날에 모델이 거의 중단되는 이유에 대한 답변 입니다.

어떻게 할까요??? 내가 알 때까지

 
mytarmails :

하나)

===================================================== ================

내가 한 첫 번째 일은 확률적 출력으로 두 개의 심층 네트워크를 훈련하는 것이었습니다. 실제로 모든 네트워크가 수행할 것입니다. 가장 중요한 것은 네트워크의 출력이 명확한 클래스 답이 아니라는 것입니다. "1", "0", 하지만 확률 클래스에 속하는 것, 즉 출력은 유효합니다 - "0.13" 그리고 이것은 현재 데이터가 확률로 클래스 "1"에 속한다는 것을 의미합니다 - "0.13%"

하나의 네트워크는 구매 전용으로 훈련했고 두 번째 네트워크는 판매 전용으로 훈련했습니다.

마을의 신호(목표 재미. )는 적어도   가격의 0.2%,


즉,   사실 역전점을 노리고... 타겟은 이렇게 생겼어요   "000000000010000000000" 여기서 "1"은 마을의 회전이고 "0"은 회전이 아닙니다.

차례의 경우 모든 것이 각각 동일합니다 ...

마지막 세 개의 OHLC 양초의 모든 가격이 예측 변수 로 사용되었습니다. 모든 종류의 조합을 만들었습니다.   그들 사이의 차이점

따라서 네트워크가 훈련되고 네트워크 예측(해당 출력)을 가져와 가격 아래 차트를 작성합니다.

자세히 보면   도에 2, 가격 차트가 이러한 확률에 반대되는 것을 눈으로 보아도 알 수 있습니다.

도를 보면 5개의 의혹이 남아있다   가격은 네트워크의 예측과 반대이며 흥미로운 결론을 도출할 수도 있습니다.   뭐라고요   신경망과 그 통계적 확률의 도움으로 우리는 완전히   다음 캔들에서 반전이 있을지 없을지 확률적 지식에 의해서만 가격을 재구성합니다.

결국 똑똑한 사람들은 온갖 신경망을 개발하고 훈련하지만, 여전히 단순한 것은 보지 못한다. 나는 당신의 게시물을 읽고 놀랐습니다. 내가 모든 것을 올바르게 이해했다면 대략적으로 말하면 특정 고점 이후에 모든 가격이 0.2 % 하락한 것을 발견 한 다음이 고점 영역에서 세 개의 양초를 가져 와서 가격으로 일종의 조작을 수행하여 결국 가져 왔습니다. 특정 확률로. 그러나 실례합니다. 이 접근 방식이 너무 원시적인 것 같지 않습니까? :) 당신은 잘못된 곳을 파고 있습니다. 그렇기 때문에 결과는 현실과 정반대입니다. 나는 당신의 접근 방식을 다음과 같이 특징지을 것입니다: 당신은 FullHD 이미지에서 3픽셀을 가져오려고 하고, 이 3픽셀을 사용하여 전체 그림에 대한 아이디어를 얻으려고 합니다. 모두는 아니지만 이미지 영역의 최소 10%를 정확하게 예측할 확률은 얼마입니까? 내 예가 명확하기를 바랍니다. 사진을 보기 위해 픽셀을 볼 필요는 없습니다. 즉, 차트를 이해하려면 개별 막대를 볼 필요가 없으며 전체 차트를 봐야 합니다. 그리고 문제의 해결책은 예를 들어 대수학, 물리학 또는 생물학이 아니라 기하학 분야에 있습니다. 여기에서 사람들이 하고 있는 연구를 읽을 때면 지리학의 도움으로 인간의 구조를 이해하려고 한다는 강한 느낌을 받습니다. :)
 

블랙톰캣 :
1) 님의 글을 읽고 많이 놀랐습니다. 내가 제대로 이해했다면,

2) 결국 신경망의 도움으로 특정 확률로 가져옵니다. 그러나 실례합니다. 이 접근 방식이 당신에게는 너무 원시적인 것 같지 않습니까? :) 당신은 잘못된 곳을 파고 있습니다. 그렇기 때문에 결과는 현실과 정반대입니다.

3) 나는 당신의 접근 방식을 다음과 같이 특징지을 것입니다: 당신은 FullHD 이미지에서 3픽셀을 가져오려고 하고, 이 3픽셀을 사용하여 전체 그림에 대한 아이디어를 얻으려고 합니다. 모두는 아니지만 이미지 영역의 최소 10%를 정확하게 예측할 확률은 얼마입니까? 내 예가 명확하기를 바랍니다. 사진을 보기 위해 픽셀을 볼 필요는 없습니다.

4) 즉, 차트를 이해하려면 개별 막대를 볼 필요가 없으며 전체 차트를 봐야 합니다. 그리고 문제의 해결책은 예를 들어 대수학, 물리학 또는 생물학이 아니라 기하학 분야에 있습니다. 여기에서 사람들이 하고 있는 연구를 읽을 때면 지리학의 도움으로 인간의 구조를 이해하려고 한다는 강한 느낌을 받습니다. :)

1) 맞아..

2) 좋습니다. 하지만 확률이 반대인 이유는 무엇입니까? 실제로는 역상관이 아니라 어리석게 무작위적이어야 합니다.

3) 가장 압축된 형태로 최대한 많은 정보를 가져와야 한다는 데 동의합니다. 그래서 최근에 볼륨 프로필, 음, 또는 몇 가지 대안에 대해 이야기하고 있습니다.

네트워크 데이터를 표현하는 방법에 대한 제안 사항이 있습니까? 공유해주세요. 그래서 우리 모두가 여기에 있습니다.

4) 나는 당신에게 절대적으로 동의합니다. 나는 오랫동안 이것을하는 방법에 대해 어리둥절 해 왔습니다. 예를 들어 가격이 현재 범위에 포함 된 모든 수준을 기억해야합니다.이 작업을 수행하는 방법 ? 네트워크에 레벨을 제출하는 방법은 무엇입니까? 게다가 초마다 번호가 다르잖아요.

ps. 제 글을 완전히 인용하지 말아주시길 부탁드립니다. 몇 마디만 해도 충분히 이해가 가실 겁니다. 초과분은 삭제해주세요.

 
블랙톰캣 :
결국 똑똑한 사람들은 온갖 신경망을 개발하고 훈련하지만, 여전히 단순한 것은 보지 못한다. 나는 당신의 게시물을 읽고 놀랐습니다. 내가 모든 것을 올바르게 이해했다면 대략적으로 말하면 특정 고점 이후에 모든 가격이 0.2 % 하락한 것을 발견 한 다음이 고점 영역에서 세 개의 양초를 가져 와서 가격으로 일종의 조작을 수행하여 결국 가져 왔습니다. 특정 확률로. 그러나 실례합니다. 이 접근 방식이 당신에게는 너무 원시적인 것 같지 않습니까? :) 당신은 잘못된 곳을 파고 있습니다. 그렇기 때문에 결과는 현실과 정반대입니다. 나는 당신의 접근 방식을 다음과 같이 특징지을 것입니다: 당신은 FullHD 이미지에서 3픽셀을 가져오려고 하고, 이 3픽셀을 사용하여 전체 그림에 대한 아이디어를 얻으려고 합니다. 모두는 아니지만 이미지 영역의 최소 10%를 정확하게 예측할 확률은 얼마입니까? 내 예가 명확하기를 바랍니다. 사진을 보기 위해 픽셀을 볼 필요는 없습니다. 즉, 차트를 이해하려면 개별 막대를 볼 필요가 없으며 전체 차트를 봐야 합니다. 그리고 문제의 해결책은 예를 들어 대수학, 물리학 또는 생물학이 아니라 기하학 분야에 있습니다. 여기에서 사람들이 하고 있는 연구를 읽을 때면 지리학의 도움으로 인간의 구조를 이해하려고 한다는 강한 느낌을 받습니다. :)

동의한다. 전체 그림을 봐야 합니다.

그러나 이것은 정적 이미지에만 좋습니다. 즉, 조건부로 전체 그림을 100개 부분으로 나누고 70개 부분으로 학습하고 30개 부분으로 우수한 예측 능력을 얻을 수 있습니다. 시장 예측에서도 거의 동일한 작업이 수행됩니다. 그럼 캐치는 뭡니까? 문제가 이미 실시간으로 발생하는 이유는 무엇입니까?

그리고 문제는 그림이 고정되어 있지 않다는 것입니다. 이 영화. 당연히 영화의 프레임 중 하나에서 예측하는 방법을 연구하고 배웠으므로 실생활에서 그림의 이웃 영역을 예측하는 것은 쓸모가 없습니다. 다음 프레임은 이미 다릅니다! 그리고 이 영화의 어떤 프레임도 절대복사본을 갖고 있지 않고, 과거와 같은 유사한 프레임이 미래에도 발견된다 하더라도, 이 프레임 이후에 다른 프레임이 따라오고, 유사한 프레임에 대해 과거에 따라온 것과 같지 않습니다. 이게 문제 야.

따라서 영화의 개별 프레임을 보면 프레임이 무작위적이라는 결론을 내릴 수도 있습니다. 많은 사람들이 시장이 100%는 아니더라도 매우 무작위적이라고 확신하는 것과 같습니다. 그러나 우리는 영화를 볼 때 그것이 의미가 있다는 것을 알고 있으며 영화가 끝날 때 어떤 일이 일어날지 쉽게 예측할 수도 있습니다! 그래서 무슨 거래? - 더 넓게 볼 필요가 있다는 사실 때문에 절대 변하지 않는 더 많은 글로벌 패턴을 탐색해야 할 수도 있습니다. 예를 들어, 어떻게든 평균적으로 가격이 얼마나 수익률이 돌아오는지 확인했고, 그래서 30%( 메모리가 올바르게 제공되면 ), 그러나 결론은 이 수치가 모든 TF와 모든 상품(통화 쌍 및 금속, CFD 및 기타 항목을 확인하지 않았지만 똑같다)! 놀랍습니다. 사용해야 하는 것은 바로 이러한 일정한 패턴이지만, MO를 사용하려면 영화에서 의미를 결정할 수 있어야 하기 때문에 신경망 , 숲 등 없이 이를 수행하는 것이 더 쉬운 경우가 많습니다. 그리고 이것은 불가능하지는 않더라도 매우 어렵습니다.

 
안드레이 딕 :

그리고 문제는 그림이 고정되어 있지 않다는 것입니다. 이 영화.

또 다른 비유를 드리겠습니다.

스마트의 거의 모든 사람들은 스마트 키보드를 가지고 있습니다. 단어를 입력하면 clave가 다음 단어를 제안합니다. 단어와 이전에 입력한 단어에 따라 다릅니다. Claudia가 제공하는 단어에서 상당히 의미 있는 텍스트를 입력할 수도 있습니다. 단어는 패턴이고 단어 그룹은 패턴 그룹입니다.

그러나 이 기술은 시장에서 ML처럼 시장에서 무력할 것입니다. 시장에서 "단어"가 시간이 지남에 따라(개별 문자의 순서와 조합) 변하고 개별 "단어"의 의미가 변하기 때문입니다. 물론 우리가 사용할 수없는 전체 텍스트의 특정 더 높은 의미가 남아 있습니다.

이제 그들은 나에게 묻습니다. 지금 무엇을해야합니까? - MO로 무엇을 해야할지 모르겠습니다. 결과는 여전히 나쁠 것입니다.

또는 누군가가 "예, 당신은 MO를 요리하는 방법을 모릅니다!"라고 말할 것입니다. - 아마 예, 할 수 없습니다. 그러나 누가 그것을 어쨌든 할 수 있습니까? 누가 시장에서 MO를 사용할 수 있었습니까? 그러한 성공적인 사례를 아는 사람이 있습니까? 예, 이제 그들은 Better를 예로 인용하지만 그는 또한 후속 시제로 병합되었습니다 ...

 
mytarmailS :

2) 좋습니다. 하지만 확률이 반대인 이유는 무엇입니까? 실제로는 역상관이 아니라 어리석게 무작위적이어야 합니다.

네트워크 데이터를 표현하는 방법에 대한 제안이 있습니까? 공유해주세요. 그래서 우리 모두가 여기에 있습니다.

너무 큰 인용문에 대해 사과하지만 지금은 전화로 작성하고 여기에 편집 옵션이 제한되어 있습니다. 인용문을 덮어쓰기 시작한 다음 텍스트의 빈 필드로 돌아가지 못할 수 있습니다. PC에서는 해결하기 쉽지만 폰에서는 문제가 됩니다.
단락 2에 따르면 - 나는 그것이 완전한 무작위로 밝혀져야 한다는 것에 동의하지만 사실 나는 당신이 반대 결과를 얻은 순방향 테스트 기간이 교육을 실시했습니다. 이 기간 사이에 시간 간격이 있습니까? 일반적으로 패턴(시장에 있는 경우)은 점진적으로 작동을 멈춥니다. 테스터의 균형 차트는 먼저 기울기를 낮춘 다음 아래로 떨어집니다. 패턴이 흐릿해지고 인식되어 많은 사람들이 이를 악용하기 시작했습니다. 이 때문에 역 패턴으로 변합니다. 그러나 이 패턴에 대한 논리적(시장) 정당성이 있다면 얼마 후 다시 작동하기 시작할 수 있습니다. 그러나 여기서는 다음이 사실인 것 같습니다. 이전에 패턴이 더 오래 작동할수록 "망각" 기간이 더 오래 지속됩니다. 그러나 나는 아직 이것을 철저히 테스트하지 않았습니다.
저는 신경망을 다루지 않기 때문에 훈련을 위해 데이터를 준비하는 방법을 모릅니다. 그래픽( 기하학적 ) 방법은 눈으로 잘 인식되지만 형식화하기 어렵다. 지금은 그래픽 방식을 사용하는 TS 작업을 하고 있습니다. 제 생각에는 여전히 작업 패턴이 어디에나 있다면 여기에서만 가능합니다.
이전 게시물에 몇 가지 설명을 추가하고 싶습니다. 거기서 개별 막대 분석을 열심히 했습니다. 그러나 실제로는 그렇지 않습니다. 개별 막대의 분석은 존재할 권리가 있지만 이러한 핵심 막대는 일반적으로 상위 영역에 있지 않습니다.
사유: