트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 3005

 
Maxim Dmitrievsky #:
초기 급수를 그래프, 양자, 레벨, 사인 곡선 또는 기타 발명품으로 변환하는 것과 같은 말도 안되는 일을하기 전에 생각하라는 요청이었습니다.
문제가 올바르게 설정되지 않았다는 것은 여기에서 오랫동안, 마지막으로 10-20 페이지 전에 말했기 때문에 가르쳐 줄 것이 없으며 모든 것을 완벽하게 잘 이해하고 있습니다 ...

그리고 작업을 변환하려면 데이터를 변환해야합니다 ...

그래서 당신이 그것에 대해 생각하라고 말하는 동안 나는 이미 그것에 대해 생각해 왔고 내 옵션을 고려하고 있습니다.
 
mytarmailS #:
작업이 올바르게 설정되지 않았다는 사실, 이것은 내가 여기서 오랫동안, 마지막으로 10-20 페이지 전에 말했기 때문에 나에게 가르 칠 것이없는 것처럼 모든 것을 완벽하게 잘 이해합니다......

그리고 작업을 변환하려면 데이터를 변환해야합니다 ...

그래서 당신이 생각하라고 말하는 동안 나는 이미 그것에 대해 생각했고 옵션을 살펴보고 있습니다.
그리고 다시 일반화 대신 암기를 하게 될 것입니다.
 
Maxim Dmitrievsky #:
데이터에 일정한 신호가 존재한다는 것은 거의 즉시 일반화를 의미하며, 노이즈는 오류로 이어집니다. 신호가 없는 경우, 분류 오류는 단순히 다른 레이블과 동일한 특징값을 가진 샘플이 겹치는 암기 오류입니다. 두 번째 모델은 예측값이 없습니다. 이것이 제 레버스에 대한 답입니다. 그리고 이는 합성 데이터와 실제 데이터에 대한 테스트를 통해 확인되었습니다.

패턴 (웨이블릿, 샤플릿 등)이 있지만 신호가없는 경우 훈련 된 것과 훈련되지 않은 것으로 나누는 것만 작동합니다. 훈련 가능한 것은 분류되고 훈련 불가능한 것은 필터링됩니다. 여기서 좋은 암기는 필터 역할을 하고 일반화는 패턴의 일반화 역할을 합니다.

시장에서와 같이 뚜렷한 지속적인 패턴은 없지만 비효율성이 있는 경우에는 비효율성을 항상 패턴으로 설명할 수 없기 때문에 접근 방식을 더욱 정교하게 다듬어야 합니다. 여기서 기억해야 할 것과 일반화해야 할 것을 구분해야 합니다. 알고리즘적으로.

데이터를 변형하면 표현 방식은 바뀌지만 궁극적으로 거래되는 것은 원래 시리즈이기 때문에 그 자체로 문제가 해결되지는 않습니다.

규칙성은 변동 확률을 가지며, 주기적으로 나타나거나 완전히 사라질 수도 있습니다. 저는 큰 시간 범위에서 작업하며 이러한 현상을 관찰했습니다.

2008~2017년(10년) 동안 모델을 훈련하는 것이 가능하다고 말씀드릴 수 있으며, 이는 오늘까지 작동할 것입니다. 이러한 모델에는 신호가 거의 없습니다. 최대 30 %까지 리콜하지만 이는 또한 향후 몇 년 동안 작동 할 10 년 동안의 패턴이 거의 없다는 것을 의미합니다 (테스트 샘플).

그러나 이러한 패턴이 주기적 또는 일회성(아마도 수십 년의 주기로)인지는 아직 확립할 수 없으므로 계속 작동할 모델을 선택하는 것은 불가능합니다.

이상적으로는 적어도 3개월에 한 번씩 주기적인 패턴을 찾는 것이 필요하며, 그러면 모델이 하락세에서 벗어날 수 있을 것으로 기대할 수 있습니다.

다양한 주기적 패턴으로 훈련된 이러한 모델 패키지는 드로다운을 줄일 수 있습니다.

따라서 중요한 것은 초기 신호 + 목표 + 예측 변수가 목표에 대해 주기적으로 양의 규칙성을 갖는 것입니다.


흔들고 선별하는 접근 방식은 탐사자의 작업과 유사합니다. 물론 많은 흥미로운 것을 찾을 수 있고 배울 수는 없지만 안정적이라고 어떻게 확신 할 수 있습니까?

저는 날짜를 직접 깨는 것을 좋아하고이 방향에 대한 아이디어가 있지만 이제는 모델의 안정성 확률을 높이는 방향으로 파고 들고 싶습니다.

 
Aleksey Vyazmikin #:

당신의 접근 방식-흔들고 선별하는 것은 탐사자의 작업과 같습니다. 물론 많은 흥미롭고 배울 수없는 것을 찾을 수 있지만 그것이 안정적 일지 확인하는 방법은 무엇입니까?

나는 나 자신이 날짜를 흔드는 것을 좋아하고이 방향으로 아이디어를 가지고 있지만 이제는 모델의 안정성 확률을 높이는 방향으로 파고 들고 싶습니다.

나는 아무것도 할 가치가없는 기본적인 이해를 썼습니다. 각 요점을 확인하기 위해서만 (처음에 얻지 못한 경우 🙂 )

안정성, 테스트, 테스트 및 더 많은 테스트를 확인하려면 다른 것은 없습니다. MO가 가장 적합합니다.

이론적 인 징징 거리는 사람들은 MO의 기본조차 이해하지 못한 채 tsos 및 기타 말도 안되는 것에 대해 많이 이야기하기 때문입니다. 이 엔터테인먼트는 정신적, 도덕적 약자를위한 것이 아니며 징징 거리는 것이 더 쉽습니다 :).
 
Maxim Dmitrievsky #:
나는 아무것도 할 가치가없는 기본적인 이해를 썼습니다. 각 요점을 확인하기 위해서만 (처음에 이해하지 못했다면 🙂 )

안정성, 테스트, 테스트 및 더 많은 테스트를 확인하려면 다른 것은 없습니다. MO가 가장 적합합니다.

나는 당신의 설명과 일반적인 접근 방식에 대해 이의를 제기하는 것이 아니라 다른 구현을 사용했지만 오래 전에 본질적으로 설명했습니다.

저의 인공 실험에 따르면 10개의 단순한 규칙성(제 경우에는 예측값이 떨어진 양자 세그먼트)이 있는 행을 뽑아내는 것만으로도 전체 샘플의 확률을 15~20% 정도 1로 이동시키는 동시에 샘플을 35%까지 줄일 수 있는 경우가 많았습니다. 이는 머신러닝 방법으로는 달성할 수 없습니다. 본질적으로 이것은 쓸모없거나 모순되는 데이터의 침출입니다. 그러나 우리는 현재 날짜에 더 가깝게, 즉 통계적으로 이력을 아는 것이 아니라 거짓/모순된 패턴만 선택하는 몇 가지 방법으로 이를 수행하고자 합니다.

모델이 모든 기기에서 작동해야하는 작업을 설정하면 테스트가 가능하지만 그러한 안정적인 패턴은 훨씬 적습니다. 그리고 역사를 통해 경주하거나 더 나쁜 것은 합성물을 복용하는 것 - 나는 그것이 효과적이라고 생각하지 않습니다. 기껏해야 날짜를 섞어서 매일 단위로 합성 물질을 만들 수 있지만 아직 사용할 수 없습니다. 시도해 보셨나요?

 
mytarmailS #:
나는 완전히 루프에서 벗어 났지만 가격을 그래프로 표현할 수 있는지, 그리고 일반적인 2 차원 표현에 비해 어떤 이점이 있는지 궁금합니다.
이에 대해 아는 분 있나요?

만델브로트의 가격 표현을 각 움직임이 세 개(같은 방향으로 두 개의 움직임과 그 사이의 보정)로 나뉘는 삼원 나무의 숲으로 생각할 수 있습니다.

장점은 가격의 프랙탈 구조에 대한 모든 통계를 수집할 수 있다는 것입니다. 단점은 알고리즘이 복잡하고 한치 앞을 내다보기 어렵다는 점입니다.

 
Stanislav Korotky #:

그리고 이것은 위에서 설명한 '병렬' 플랫폼의 매트릭스 및 예시와 어떤 관련이 있을까요?

예를 들어, 링크에서 케라스로 연결되는 행렬을 가져와서 호출합니다:

그리고 0을 얻습니다.

제어 예제는 적합하지 않습니다.

범주형 교차 엔트로피는 두 개 이상의 클래스가 있는 분류 모델에서 사용됩니다. 그리고 소프트맥스 이후. 소프트맥스는 값 집합을 합이 1인 확률 집합으로 변환합니다.

다음과 같은 제어 예제를 사용해 보세요:

pred: 0.1, 0.1, 0.2, 0.5, 0.1

true: 0, 0, 1, 0, 0, 0, 0

 
Aleksey Vyazmikin #:

기껏해야 날짜를 섞어서 일 단위로 합성어를 만들 수 있지만 아직 이 기능을 사용할 수 없습니다. 시도해 보셨나요?

나는 그러한 가정의 근거가 무엇인지 이해하지 못하며 이것은 다시 학습 방식을 개선하는 것이 아니라 특성으로 작업하고 있습니다. 그래서 그것은 부차적입니다.

학교와 같습니다. 한 교과서에서 가르칠 수도 있고 다른 교과서에서 가르칠 수도 있습니다. 정보는 변형과 마찬가지로 본질적으로 변하지 않습니다. 그러나 그것은 한 머리로 날아가고 다른 머리에서 날아갈 것입니다 :)

최종 목표가 명확하지 않은 경우 합성 작업은 어렵습니다. 시퀀스의 일부 속성을 테스트하고 다른 부분으로 혼합하여 결과가 어떻게 변하는 지 확인하는 데 사용하는 것이 좋습니다. 예를 들면? 데이터의 오프셋을 여전히 정렬하는 경우.
일반적으로 원본 데이터의 암기를 줄여 일반화 가능성을 높이는 데는 유용하지만, 기성품 TS를 만드는 측면에서는 여전히 불완전합니다. 간단한 선형 모델을 포함한 다양한 모델의 앙상블을 훈련할 때 원본 데이터에서도 비슷한 결과를 얻을 수 있습니다.

글쎄, 당신은 그것을 통해 훌륭한 것을 얻는 것은 여전히 불가능하지만 그것을 개선하는 것은 가능하다는 대략적인 대답을 알고 있습니다.

 
Aleksey Nikolayev #:

만델브로의 가격 표현은 각 움직임이 세 가지(같은 방향으로 두 번 움직이고 그 사이에 조정이 있음)로 나뉘는 삼원 나무의 숲으로 볼 수 있습니다.

장점은 가격의 프랙탈 구조에 대한 모든 통계 수집에 액세스할 수 있다는 것입니다. 단점은 알고리즘이 복잡하고 앞을 내다보기 어렵다는 점입니다.

연관 규칙의 형태로 제시할 수 있나요?
 
mytarmailS #:
연관 규칙으로 표현할 수 있나요?

생각해 본 적은 없지만 가격에서는 움직임의 순서가 중요하기 때문에 가능성은 낮다고 생각합니다.

만일을 대비해 만델브로의 아이디어를 설명하기 위해 그림을 그려보겠습니다. 각 가격 움직임은 가능하면 세 개의 움직임으로 나뉘고 (그 안에서 최대 조정을 선택하면) 트리의 노드가됩니다. 이동 내에 보정이 없거나 주어진 값보다 작으면 트리의 잎이 됩니다.


사유: