트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 257

 

혼란스러워요.

가격이 있습니다. 나는 마지막 200개의 막대를 가지고 2등급 모델(구매/판매)을 훈련시키려고 합니다. 숲, 심지어 뉴런까지 무엇이든 훈련할 수 있지만 이 모든 것은 쓸모가 없습니다. 왜냐하면 모든 훈련 예제를 200차원 공간의 점으로 나타내면 두 클래스가 거기에서 고르게 혼합되어 분리하려고 시도하기 때문입니다. 초평면에 의한 것은 충분히 정확하지 않습니다.

이제 옵션이 더 좋습니다. 가격에 기반한 모든 종류의 헤지 펀드는 새로운 예측 변수(지표, 클러스터, 일부 공식 등)를 생성합니다. 그리고 얻은 새로운 예측 변수에 대해 첫 번째 단락과 동일한 모델이 학습되지만 이 경우 양배추는 잘게 썬다.

따라서 두 번째 경우에는 새로운 정보가 생성되거나 추가되지 않습니다. 이들은 모두 200차원 공간에서 더 낮은 차원 공간으로 이동된 동일한 점입니다. 저것들. 그러한 독특한 차원의 감소, 공간에서 같은 등급의 점들이 서로 더 가깝게 이동합니다. 그러나 결국 기계 학습 모델 도 이 작업을 수행하고 알고리즘으로 차원을 줄이고 클래스를 서로 더 가깝게 이동합니다. 이 두 가지 방법의 차이점은 무엇입니까?

다양한 트릭을 사용하여 반자동으로 공간에 포인트를 가져온 다음 모델 교육을 수행하면 작동하는 이유는 무엇입니까? 그리고 모델 자체를 원래 공간으로 작업하도록 맡기면 실패합니까? 두 경우 모두 동일한 작업입니다.

 
트레이더 박사 :

이제 옵션이 더 좋습니다. 가격에 기반한 모든 종류의 헤지 펀드는 새로운 예측 변수(지표, 클러스터, 일부 공식 등)를 생성합니다. 그리고 얻은 새로운 예측 변수에 대해 첫 번째 단락과 동일한 모델이 학습되지만 이 경우 양배추는 잘게 썬다.

...

다양한 트릭을 사용하여 반자동으로 공간에 포인트를 가져온 다음 모델 교육을 수행하면 작동하는 이유는 무엇입니까? 그리고 모델 자체를 원래 공간으로 작업하도록 맡기면 실패합니까? 두 경우 모두 동일한 작업입니다.

그리고 큰 시장 참가자들이 가격을 움직이는 것을 고려하지 않습니까?
 
Dr.Trader :

혼란스러워요.

가격이 있습니다. 나는 마지막 200개의 막대를 가지고 2등급 모델(구매/판매)을 훈련시키려고 합니다. 숲, 심지어 뉴런까지 무엇이든 훈련할 수 있지만 이 모든 것은 쓸모가 없습니다. 왜냐하면 모든 훈련 예제를 200차원 공간의 점으로 나타내면 두 클래스가 거기에서 고르게 혼합되어 분리하려고 시도하기 때문입니다. 초평면에 의한 것은 충분히 정확하지 않습니다.

이제 옵션이 더 좋습니다. 가격에 기반한 모든 종류의 헤지 펀드는 새로운 예측 변수(지표, 클러스터, 일부 공식 등)를 생성합니다. 그리고 얻은 새로운 예측 변수에 대해 첫 번째 단락과 동일한 모델이 학습되지만 이 경우 양배추는 잘게 썬다.

따라서 두 번째 경우에는 새로운 정보가 생성되거나 추가되지 않습니다. 이들은 모두 200차원 공간에서 더 낮은 차원 공간으로 이동된 동일한 점입니다. 저것들. 그러한 독특한 차원의 감소, 공간에서 같은 등급의 점들이 서로 더 가깝게 이동합니다. 그러나 결국 기계 학습 모델도 이 작업을 수행하고 알고리즘으로 차원을 줄이고 클래스를 서로 더 가깝게 이동합니다. 이 두 가지 방법의 차이점은 무엇입니까?

다양한 트릭을 사용하여 반자동으로 공간에 포인트를 가져온 다음 모델 교육을 수행하면 작동하는 이유는 무엇입니까? 그리고 모델 자체를 원래 공간으로 작업하도록 맡기면 실패합니까? 두 경우 모두 동일한 작업입니다.

그리고 원칙적으로 데이터마이닝을 하는 이유는 무엇입니까?

그리고 라디오 엔지니어링과 계량 경제학 에서도 다른 필터가 필요한 이유는 무엇입니까? 매끄럽게 하고 더 많이 ....

통계는 매우 사악한 과학입니다. 숫자 게임에 쉽게 빠져들 수 있습니다. 그리고 어떤 단계에서든.

목표 변수를 결정했다면 이 목표 변수에 대한 예측 변수를 선택해야 하며 아무 것도 선택하지 않고 이 목표 변수와 CONTENTLY로 관련된 예측 변수만 선택해야 합니다. 우리는 항상 예측 변수를 살펴보고 "이 예측 변수가 대상 변수에 반영하는 속성, 특성은 무엇입니까?"라는 질문에 답하려고 노력합니다. 그리고 일반적으로 예측자는 금융 시장과 어떤 관련이 있습니까?

예를 들어, RSI: 과매수/과매도 시장을 반영하는 것 같습니다. 분명히 반전을 나타냅니다. 등.

또는 Burnakov를 기억합시다(그 사람이 현장에서 홍수에서 살아남은 것을 이해하는 대로): 다소 큰 지연이 있는 증분은 주기성으로부터의 경고입니다.

그리고 일반적으로 말하면 금융 시장의 일반적이고 구두적인 모델을 공식화할 필요가 있습니다.

예를 들어, 힌디어(예측 패키지)입니다. 그에 따르면 시장은 다음과 같이 구성됩니다.

  • 세 가지 유형의 추세
  • 세 가지 유형의 소음
  • 주기가 일정하며 농산물과 같은 생산 데이터와 일치합니다.
아마도 이것이 유일한 접근 방식은 아닙니다. 하지만 확실한 건 시끄러운 소음이 아니라

이 접근 방식을 사용하면 커피 찌꺼기, 토성의 고리(점성가 목록 참조)를 옆으로 쓸어 넘길 것입니다.

그리고 '비정상성'이라는 금융 데이터의 재앙을 잊지 말자.

그리고 금융 시장에 대한 모델은 거의 항상 과도하게 훈련된다는 사실을 잊지 마십시오.

다들 이기셨나요? 담배 피우는 대나무...

 
Dr.Trader :

혼란스러워요.

1) 단지 자금이 그렇게 하지 않기 때문일까요?

2) 시장이 무엇인지 이해해야 하지만 자신만의 방식으로 ...

3) 누구에게, 왜 돈을 받아야 하는지 명확하게 알아야 하고, 그들만의 구체적인 아이디어 가 있어야 합니다.

4) 모든 MO 등등.. 이것은 단지 당신의 특정한 아이디어를 설명하기 위한 툴킷일 뿐이지 , 아이디어 자체는 아니지만 여기 분기에서 거의 모든 사람들이 MO가 모든 것을 생각해낼 것이라고 생각하면서 춤을 추는 곳입니다.

그것이 얼마나 한심하게 들릴지 모르지만 나는 시장을 어느 정도 적절하게 예측할 수 있었습니다. 이를 위해 하나의 양초를 계산하는 데 약 6분이 걸리는 다소 복잡한 알고리즘이 있지만 주요 요소 중 일부는 C로 다시 작성됩니다. ++

그러나 지금까지 이 복잡한 알고리즘으로 계산된 결과는 눈으로 분석해야 하며 자동 모드가 아니라 반자동으로 얻어지지만 가까운 장래에 시각적 분석을 패턴에 대한 일종의 MO로 대체하려고 노력할 것입니다. 그런데 인식은 MO를 아주 잘 인식합니다. 예측과 달리 저는 알고리즘에서 출력(차트 형식으로 되어 있음)을 가져와 실제로 수동으로 대상을 생성했습니다. 각 출력을 눈으로 살펴보고, 말그대로 이건 매수 시그널로 생각하지만 시그널로 생각하지 않고 내 비전에 따라 타겟을 만들었습니다. 목표에서, 그래서 테스트를 위해 ... 100 훈련. 샘플과 50 컨트롤, 평소의 숲을 훈련하고 어떻게 생각하십니까? 숲은 새로운 샘플의 90%를 인식했습니다.

 

안녕하세요, 작업:

- X,Y,Z 값의 배열이 있습니다.

- n번째 Yk에서 1에서 1000까지 X만큼 슬라이스를 가져옵니다.

-최소값과 최대값의 몇 가지 점이 있습니다. 슬라이스가 X이면 모든 값 ​\u003e 1이 중요합니다.

축을 기준으로 한 가중치 유형 계산을 재생성하기 위해 볼 방향입니다.

즉, 물체 측정을 시작합니다.

신호가 x-55 y-163 셀에 도착한 경우 작업은 X 및 Y 축(대각선으로 가능)을 기준으로 점의 값(가중치)을 결정하여 물체에서 점의 위치를 느끼는 것입니다.

통계적 특성, 분산, 중앙값, 모드, 비대칭의 기본 사항을 살펴봐야 한다고 생각합니다.

일반적으로 다른 물체의 존재가 물체의 포인트 값에서 고려되도록 서로 상대적인 각 단위에 대해 어떤 식으로든 물체 측정을 시작해야 합니다.

파일:
eiova.jpg  382 kb
1.jpg  320 kb
 
Top2n :

안녕하세요, 작업:

또는 더 간단한 것일 수도 있습니다. 그렇지 않으면 여전히 원하는 것이 명확하지 않습니다.
 
산산이치 포멘코 :


감사합니다. 이해가 가는 부분이 있습니다.

모델은 본질적으로 예측 변수 공간을 구매 클래스와 판매 클래스의 두 부분 공간으로 최적으로 나눕니다.
무작위로 오랫동안 새로운 예측 변수를 만들기 시작하면 모델을 약간 도울 수 있고 일부 작업을 직접 수행할 수 있습니다. 그러나 이것이 더 나은 안정성과 예측 가능성을 제공할 필요는 없으며 모델이 더 적은 반복으로 작업을 수행하는 데 도움이 될 수 있으며 실제로 이 작업에서 원하는 만큼의 유용성이 없습니다.

그러나 언급한 작업(노이즈 제거, 평활화, 추세 검색 등)은 더 이상 모델에 편리한 예측 변수를 만드는 것이 아닙니다. 이것은 어떻게 든 시장의 내부 프로세스를 설명하는 예측 변수의 생성입니다.
나는 다양한 오래된 작업 전략을 보았고, MA가 21이면 RSI가 14인 경우 등 항상 몇 가지 상수가 있습니다. 이러한 모든 상수와 이를 사용하여 구축된 지표는 모델이 데이터를 보다 쉽게 분류하는 데 도움이 될 뿐만 아니라 시장의 내부 프로세스를 설명하는 특정 속성을 전달합니다. 또한 예측 변수에 대한 공식의 다른 상수는 이미 일부 새로운 데이터이므로 원본 데이터에 새로운 정보를 추가합니다.

아무 생각 없이 새로운 예측자를 생성하기 시작하면 모델이 더 나은 훈련 정확도를 달성하는 데 도움이 되지만 시장 내부의 프로세스를 설명하는 데 도움이 되지 않으므로 예측을 신뢰할 수 없습니다. 따라서 많은 생각을 하도록 생성해야 한다는 점에 동의합니다. :)

그리고 저에게는 예측자의 흥미로운 새로운 속성이 있었습니다. 바로 원본 데이터의 내부 프로세스에 대한 설명이었습니다.
저것들. 예를 들어 수백 개의 가격 막대를 쉽게 복원하는 데 사용할 수 있는 12개의 예측 변수가 있다면 시장의 필수 속성을 분명히 전달하고 이를 기반으로 구축된 모델이 더 좋아야 합니다.

 
Top2n :


아마도 나는 당신이 필요로하는 것을 이해하지 못했지만 특정 반경, 예를 들어 4를 취하고 각 점에 대해이 반경의 평균 값을 찾을 것입니다.
저것들. X=BC, Y=158, Z=1이면 이 반지름 R=4에 있는 모든 점의 평균값을 찾을 수 있습니다. 이것은 포인트(BC,158.1)와 그 주변의 평균 무게가 됩니다. 배열의 모든 점에 대해 이 작업을 수행하면 숫자가 클수록 원래 배열의 해당 이웃에 더 많은 신호가 있는 새 배열을 얻을 수 있습니다.
그런 다음 이 모든 것을 하나의 축에 투영할 수 있습니다(Z 좌표를 버리고 Z가 다른 X 및 Y로 해당 셀을 모두 더함). 그런 다음 Y 자체를 버리고 모든 셀을 X로 합산합니다.

파일:
w5rtduyghjbn.png  388 kb
 
Dr.Trader :


아무 생각 없이 새로운 예측자를 생성하기 시작하면 모델이 더 나은 훈련 정확도를 달성하는 데 도움이 되지만 시장 내부의 프로세스를 설명하는 데 도움이 되지 않으므로 예측을 신뢰할 수 없습니다. 따라서 많은 생각을 하도록 생성해야 한다는 점에 동의합니다. :)


그래도 춤을 추어야 할 난로는 시장에 대한 구두적이고 직관적인 설명입니다.

나는 금융 시장에서 ZZ가 이 직관적인 설명을 제공한다는 아이디어를 오랫동안 가지고 놀았습니다. 그것을 보면 다음과 같습니다.

  • 가시적인 추세
  • 노이즈는 직선과의 편차로 도입됩니다.
  • 가시적 주기성

우리의 모든 문제는 두 축을 따라 무작위로 변하는 이 주기성에 있는 것 같습니다. 이것이 바로 우리가 집중하고 있는 것입니다. 우리가 이 비정상성을 다루는 법을 적어도 어떻게든 배운다면 나머지는 이미 더 쉽습니다.

 
산산이치 포멘코 :

그래도 춤을 출 수 있는 난로는 시장에 대한 구두적이고 직관적인 설명입니다.

나는 금융 시장에서 ZZ가 이 직관적인 설명을 제공한다는 아이디어를 오랫동안 가지고 놀았습니다. 그것을 보면 다음과 같습니다.

  • 가시적인 추세
  • 노이즈는 직선과의 편차로 도입됩니다.
  • 가시적 주기성

우리의 모든 문제는 두 축을 따라 무작위로 변하는 이 주기성에 있는 것 같습니다. 우리는 바로 그것을 향해 가고 있습니다. 우리가 이 비정상성을 다루는 법을 적어도 어떻게든 배운다면 나머지는 이미 더 쉽습니다.

엄밀히 판단하거나 내가 무슨 말을 하는지 묻지 마십시오. 하지만 White_Noise Generator가 도움이 될 수 있습니다. 누군가가 Fourier_Laplace_Z 변환에 대한 경험을 공유할 수 있는 경우.
사유: