트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 2526

 
Alexey Nikolaev # :

이렇게 하면 샘플의 마지막 값과 다른 모든 값의 상관 관계만 얻을 수 있지만 서로 어떻게든 상관 관계가 있습니다. 예를 들어 1<=t1<=t2<n이면 ACF(t1,t2)= 제곱(t1/t2).

다른 질문이 있습니다. 여기서 우리는 무한 크기의 샘플에서 이웃 값의 ACF를 고려합니다. 예를 들어, t1=1, t2=2입니다. ACF = sqrt(0.5) ~ 0.707을 얻습니다. 이제 t1=10000, t2=10001과 같은 다른 인접 값을 사용합니다. 우리는 ACF = 1(거의)을 얻습니다. 인접한 값은 서로 다른 상관 관계가 있음이 밝혀졌습니다. 이건 괜찮아?

 
레나트랩 # :

솔직히 말해서, 나는 아무것도 이해할 수 없습니다.

ps. 어떤 똑똑한 수학자가 저를 불쌍히 여겨 여기에서 무슨 일이 일어나고 있는지 설명해 줄 수 있습니까?

당신은 거래에 "슈퍼 똑똑한 수학자"가 필요하지 않습니다 .....

DL에는 3개의 레이어가 있습니다 - 내부(숨겨진)는 각각 t 모멘트를 처리하고 외부 t-1 및 t + 1 ... - 자기 상관은 여기에서 가능합니다 ... IMHO ... 저는 이렇게 봅니다.

어떤 이유로 시간이 지남에 따라 기능의 델타 변화가 아니라 일부 인덱스를 취하면 아마도 시간 공간에서 이러한 교차 값의 자기 상관 효과가 어떻게 든 평준화 될 수 있다고 생각합니다. ... 논쟁의 여지가 있습니다 ... close(t )/close(t-1) 에도 교차점이 있으므로 자기 상관이 있기 때문에 ... TF>15min에서 자기 상관이 사라지는 것처럼 보이지만(눈에 띄지 않음) - 나는 ' 직접 확인해보니.. 아직 필요한 인덱스가 아니네요...

적절한 TF에서 가격 움직임을 모델링할 때 자기 상관을 위해 기도하는 것은 쓸모가 없습니다... 그리고 각 틱 후에 모델을 당기는 것은 이미 모델링에 의미가 없습니다(패턴, 특히 장기 패턴 유도에서와 같이)... 또한 IMHO(하지만 더 확률적으로 공정) ...

그러나 순환 신경망은 정보를 앞으로만 전송합니다(볼츠만 기계의 출현으로 다층 확률 학습에 사용되기 시작함) ... 이미 들리 긴 했지만

순환 네트워크와 베이지안 방법은 그 자체로 금융 시계열에서 "메모리"를 추출하거나 새로운 데이터에서 가장 안정적인 모델을 추론할 수 없는 것으로 나타났습니다.

따라서 오류 역전파 및 최소화 dy/dx가 있는 재귀 네트워크는 실제 문제에서 사용됩니다(최소화 기능 dy/dx 때문에 통합을 허용하기 때문에).

추신

일반적으로 나에 관해서는 - 동일한 몬테카를로 방법 - 기계의 힘에 의해서만 ... 나는 역전파를 사용하여 순방향 검색에서 아직 새로운 것을 보지 못했습니다 ... 순전히 용어 적으로 ...

pps

Theano를 사용하면 PC 리소스를 많이 로드하지 않고 무언가를 시도할 수 있다는 점을 제외하고(TensorFlow가 승격되었지만) ...

그리고 Y는 무엇이며 X는 무엇인지 - 개발자의 재량에 따라(선험적으로 또는 통계 분석 결과로) ... python과 친구인 경우 - sklearn에서 2-in-1의 가능성도 이미 일부 방법으로 구현되어 있습니까? 예! -- 그리고 기능 중요성 자체와 ML 자체가 -- 또한 몇 줄 (몇 줄에서 corrcoef 를 찾은 것처럼)

 
레나트랩 # :

실제 시장에서? 개인적으로 나는 어떤 종류의 철학을 고수합니다.

*하지만 증거가 없으면 가정에 대해 논의하는 것은 무의미하기 때문에 논의하고 싶지 않습니다.

! 실제 거래에서 - 의미를 변경하지 마십시오 ...

예, 철학, 실제로 모든 사람에게는 고유한 것이 있습니다. 통계의 목적은 분산을 설명하는 것입니다.

독립 시도의 종속성을 공식화합니다.

 
의사 # :

다른 질문이 있습니다. 여기서 우리는 무한 크기의 샘플에서 이웃 값의 ACF를 고려합니다. 예를 들어, t1=1, t2=2입니다. 우리는 ACF = sqrt(0.5) ~ 0.707을 얻습니다. 이제 t1=10000, t2=10001과 같은 다른 인접 값을 사용합니다. ACF = 1(거의)을 얻습니다. 인접한 값은 서로 다른 상관 관계가 있음이 밝혀졌습니다. 이건 괜찮아?

모든 것이 정확합니다. 이것이 SB의 비정상성에 대해 이야기하는 두 번째 이유입니다(첫 번째는 시간에 따른 분산의 증가입니다). ACF가 시간 차이 ACF(t1,t2)=ACF(t1-t2)에만 의존하는 것은 고정 프로세스(그 정의에 따라)에만 해당됩니다. 이것이 고정 급수에 대한 ACF가 일반적으로 하나의 인수 t1-t2의 함수로 작성되는 이유입니다.

 
의사 # :

물론 질문은 Alexei에게 리디렉션되어야 합니다. 그러나 나는 "상관없다"고 말하고 싶다. 요점은 SB가 sqrt(t)에 비례하여 경로를 이동한다는 것입니다.

"플레이어의 파멸에 관한" 잘 알려진 문제를 의미했습니다. 예를 들어, 가격이 일부 수준으로 "경향"하는 효과의 통계적 유의성을 테스트하는 데 사용할 수 있습니다.

 
Alexey Nikolaev # :

"플레이어의 파멸에 관한" 잘 알려진 문제를 의미했습니다. 예를 들어, 가격이 일부 수준으로 "경향"하는 효과의 통계적 유의성을 테스트하는 데 사용할 수 있습니다.

이제 이것은 훨씬 더 흥미 롭습니다.

그것은 일반적으로 시장이 시계열이라는 관점을 버리고 마침내 시장 분석에서 돌파구를 만들 수 있습니다..

 
Alexey Nikolaev # :

모든 것이 정확합니다. 이것이 SB의 비정상성에 대해 이야기하는 두 번째 이유입니다(첫 번째는 시간에 따른 분산의 증가입니다). ACF가 시간 차이 ACF(t1,t2)=ACF(t1-t2)에만 의존하는 것은 고정 프로세스(그 정의에 따라)에만 해당됩니다. 이것이 고정 급수에 대한 ACF가 일반적으로 하나의 인수 t1-t2의 함수로 작성되는 이유입니다.

자 그리고 나서. 다른 방식으로 질문을 드리겠습니다. 아래에 설명된 두 가지 상황은 서로 다른가요?

1) 무한한 크기의 표본이 있습니다. 우리는 시간 n과 (nt)의 두 순간을 고려합니다. 우리는 1 <= (nt) <= n이라고 생각합니다. ACF((nt),n)=sqrt((nt)/n)를 계산합니다.

2) 길이가 n인 표본이 있습니다. 시차 t로 샘플 ACF를 계산합니다. ACF(t) = sqrt((nt)/n).

 
JeeyCi # :

어떤 이유로 시간이 지남에 따라 기능의 델타 변화가 아니라 일부 인덱스를 취하면 아마도 시간 공간에서 이러한 교차 값의 자기 상관 효과가 어떻게 든 평준화 될 수 있다고 생각합니다. ... 논쟁의 여지가 있습니다 ... close(t )/close(t-1) 에도 교차점이 있으므로 자기 상관이 있기 때문에 ... TF>15min에서 자기 상관이 사라지는 것처럼 보이지만(눈에 띄지 않음) - 나는 ' 직접 확인해보니.. 아직 필요한 인덱스가 아니네요...


아마도 이것이 실제로 필요하지 않을 수 있지만 어떤 추세와 함께 시계열 데이터는 자기 상관을 나타내기 시작하고 때로는 매우 높아 이론상 많은 분석 모델/신경망을 방해해야 합니다.

이 효과는 예측에 사용하기가 정말 어렵습니다. 아무 것도 영원히 지속되지 않고 추세가 범위로 바뀌고 혼돈이 질서 정연하며 무작위로 방황하는 시계열이 갑자기 오랫동안 방황하지 않을 수 있으며 그 반대의 경우도 마찬가지입니다. 그런 평가를 통해 프로세스의 구조를 이해하는 것은 너무 간단하며 200SMA 이상에서 거래하는 것과 같습니다.

그러나 아마도 신경망이 자기상관에 어떻게 반응하는지 확인하는 것은 여전히 가치가 있을 것입니다. 그리고 자기상관이 존재하는 경우 이를 제거하고 간섭하고 처리하고 적절한 데이터 준비를 하는 것이 제 생각에는 그러한 시스템으로 작업하는 데 가장 중요한 것입니다. 인접한 요소에는 교차점이 전혀 없어야 하며(내 생각이라면?), 이러한 데이터를 사용한다면 모델이 작동한다면 큰 기적이 될 것입니다.

 
레나트랩 # :

아마도 이것은 필요하지 않을 것입니다. 그러나 어떤 경향이 있더라도 시계열 데이터는

바꾸지 마세요: 나에게 무언가 반대하려고 하는 중 - 당신은 여전히 당신 자신에 대해 이야기하고 있습니다 ... 시계열에 대해서만 ... (아무도 샘플링 방법을 취소하지 않았습니다) ...

가격은 오랫동안 시간에 의존하지 않습니다. 저는 이미 제 관점을 두 번 이상 표현했습니다. .. 그리고 X와 Y에 대해, 그리고 어떤 종속성을 모델링하기 위해 청구할 것인지 - 저도 10번째로 쓰고 있습니다 - 개발자의 재량에 따라...

나는 당신의 모델을 개발하고 있지 않습니다 - 나는 시간이 지남에 따라 가격의 행동을 증명할 필요가 없습니다 ... 모든 분야에서 한 단어) ... MO-th에 관련된 엔지니어 (여기에 있지 않음)는 여전히 이해할 것입니다 모델이 벼룩(자기상관)이 올라갈 수 있는 지평보다 훨씬 더 넓은 측면과 더 넓은 훈련 지평에서 구축된 경우 추세에서도, 심지어 틱에서도 자기상관에 대한 논쟁의 좁음(난해한 연설을 위해). .. 그것이 딥 러닝의 목적입니다(모든 것을 설명하기 위해)

... 저에게 거래의 문제는 질문이 아닙니다.

Alexey Nikolaev # :

"선수의 파멸에 관한" 잘 알려진 문제.

...그래서 내가 오랫동안 이 말도 안되는 소리를 피하고 있었어... 그들이 여기서 모델링에 대해 전혀 모른다는 것이 밝혀졌고, 누구든지 이 스레드에 시간을 낭비하지 않습니다 ... 글쎄, 좋아, 거기 이미 여기에서 쏟아져 나온 모든 깡패 전문 용어보다 네트워크에서 훨씬 더 합리적인 DL ...

통계의 기초에 대해, 당신은 학계의 수학자들과 더 잘 이야기해야 합니다. 여기서 당신은 분명히 나에게 대답할 필요가 없습니다 ... - 자기 상관이 DL에서 무언가를 지배한다는 당신의 확신에 관심이 없습니다 ... - 5번째 나는 "이것은 나쁜 모델이다"라고 쓴다(나는 10번째를 쓰고 싶지 않다) ... 당신의 학자들이 당신에게 대답하게 하라(내 대답이 당신에게서 무언가를 증명하려는 욕구를 불러일으켰다면)

 
의사 # :

자 그리고 나서. 다른 방식으로 질문을 드리겠습니다. 아래에 설명된 두 가지 상황은 서로 다른가요?

1) 무한한 크기의 표본이 있습니다. 우리는 시간 n과 (nt)의 두 순간을 고려합니다. 우리는 1 <= (nt) <= n이라고 생각합니다. ACF((nt),n)=sqrt((nt)/n)를 계산합니다.

2) 길이가 n인 표본이 있습니다. 시차 t로 샘플 ACF를 계산합니다. ACF(t) = sqrt((nt)/n).

차이점은 첫 번째 경우 ACF가 가능한 모든 시점 쌍에 대해 고려되고 두 번째 경우 시점 중 하나가 t2=n으로 고정되고 많은 시점 쌍이 고려에서 제외된다는 것 입니다 ( 예: , 쌍 t1=1, t2=2). 일반적으로 ACF는 두 인수의 함수입니다. 고정 프로세스에 대해서만 ACF는 하나의 인수 t=t1-t2(지연)의 함수로 간주될 수 있습니다.

샘플 ACF는 항상 프로세스의 특정 숫자 샘플(구현)에 대해 계산되며 항상 하나의 인수(지연 값)의 함수로 판명됩니다. 이것이 SB 구현을 위한 샘플 ACF가 ACF에 대한 추정치가 아닌 주된 이유입니다.

사유: