트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 3190

 
Aleksey Nikolayev #:

적어도 대략적으로나마 수익과 연관시키고 실제 수익과 무작위 수익 샘플을 비교합니다. 오류가 없는지 확인하는 방법은 샘플의 평균 수익이 0과 같다는 것입니다. 샘플 대비 실제 수익의 양의 중요성, 즉 3 시그마 법칙을 확인합니다.

제 업무가 너무 바빠서 자세히 설명할 준비가 되지 않았습니다.

추가 분류를 위한 데이터 전처리에 대해 이야기할 때 수익과 어떤 관련이 있을까요?

알렉세이 니콜라예프 #:

퀀타가 수익 창출을 위해 설계되었나요? 이에 대한 계획이 있나요? 샘플을 대략적으로나마 빠르게 계산하고 실제 결과가이 샘플의 꼬리에 해당하는지 확인하기 위해 극단적으로 단순화하십시오.

몬테카를로처럼 단순하고 널리 알려진 아이디어에 대해서는 전혀 탐구하지 않으려는 의지와 함께 사람들에게 당신의 사고방식을 탐구하도록 요구하는 것은 지루합니다.

이 정도면 충분하다고 생각합니다.

누구나 자신의 시간을 관리할 권리가 있습니다.

그러나 분명히 당신은 조언을 한 질문을 이해하지 못한 것 같습니다.

도와주려고 노력해 주셔서 감사합니다.

 
Aleksey Vyazmikin #:

이해합니다.

숲 조성 과정을 더 관리하기 쉽게 만들고 각 나무의 뿌리를 선택한 양자 세그먼트의 구체적인 하위 샘플로 삼는다면 어떨까 하는 또 다른 제안이 있습니다.

깊이는 2-3 분할이어야하므로 잎별로 분류 가능한 클래스의 예가 1 % 이상이어야합니다.

모델이 더 안정적일 것이라고 생각합니다.

즉, 10 개의 퀀타 / 스플릿을 선택한 다음이 스플릿의 예제에 대해 10 개의 트리를 훈련시키는 경우? 간단 해 보입니다.
OOS의 안정성에 대해 - 실험이 보여줄 것입니다. 데이터 창의 크기 (2 개월 및 4 개월)를 변경하고 2 % (토요일 대신 화요일에 훈련)로도 이동할 때 안정성이 위반됩니다. 나무는 다른 것으로 밝혀졌습니다.

알렉세이 비아즈미킨 #:

GIF를 게시 한 샘플로 실험을 수행했는데 샘플에는 이미 47 % 단위가 있으며 데이터는 표에 요약되어 있습니다.

...
이러한 양자 세그먼트의 품질 (유용성)이 원래 양자 세그먼트보다 10 배 더 나쁘다 (적음)는 것이 밝혀졌습니다.

그러한 열화 (시간)에 대해 나는 fxsaber와 의사 소통 할 때 그의 알고리즘에 의한 믹싱에 대해 가정했습니다. 그는 자신의 데이터에 그렇게 큰 차이가 없습니다. 분명히 그는 마크 업에서 모든 막대가 연속적으로 (또는 연속적으로 서있는 행)이 아니라 큰 간격으로 모든 막대가 없기 때문입니다. 막대가 가까운 경우 과거와 미래가 매우 유사합니다. 즉, 클래스 1의 예가 20개 연속으로 있을 수 있습니다. 무작위로 정렬하여 평균 0101010....으로 만들고, 20개의 '1'을 20개의 '0'으로 바꿔야 합니다. 서로 가깝고 하나의 예로 계산할 수 있기 때문입니다. 당신에게 그렇지 않다면 나에게도 그렇습니다 (나는 모든 막대를 연속으로 평가하기 때문에이 아이디어가 나온 이유입니다).

일반적으로 10 배의 강한 차이로 10000 번의 테스트를 수행하지 않을 수 있다고 생각합니다. 처음 10 번의 테스트에서 너무 분명한 차이 (모두 더 나쁨)가 다른 10000 번이 결과를 원본과 동일하게 올릴 것이라고 가정하기에는 너무 분명합니다. 3번 더 나빴고, 3번 더 좋았고, 4번은 거의 같았다면 통계를 계속 누적해도 됩니다.

데이터가 직렬화된 경우, 문제는 과거 어딘가에서 비슷한 과거를 가진 일련의 1이 20개 발견된다는 것입니다. 이것은 시장 무작위 추출입니다. 111111111 을 010101010 으로 만드는 것이 아닙니다.

따라서 시장 데이터에 대한 01010101 형태의 몬테카를로는 시장 데이터(직렬화된 경우)에는 작동하지 않는다고 생각합니다. 직사각형과 정사각형을 같은 정사각형으로 나눈 다음 그 정사각형이 어느 기본 도형에 속하는지 알아내는 것과 같습니다)).

 
Aleksey Vyazmikin #:

명확성을 위해 예시로 엄격한 순서에 대해 썼습니다. 그리고 이 문제를 해결하면 모델의 안정성을 향상시킬 수 있다고 썼습니다. 하지만 해결책은 다를 수 있습니다.

위에서 언급 한 문제를 해결하지 않고도 올바른 양자 테이블을 선택하면 학습이 향상되며, 이는 수십 개의 샘플에서 테스트되었습니다.

그런 다음 일관되지 않은 데이터에서 샘플을 정리하여 훈련을 위한 전처리를 빠르게 수행하는 방법을 보여주었습니다. 이 방법을 사용하면 새로운 데이터에서 수익성 있는 모델을 얻을 수도 있다는 것을 GIF에서 확인할 수 있습니다.

결국 이 접근 방식은 효과가 있으며, 이를 발전시키는 것이 저의 목표입니다.

따라서 그렇지 않다고 말하는 것은 현실을 부정하는 것입니다.

저는 가격이 적어도 부분적으로 분해할 수 없는 순수한 SB라고 생각하지 않습니다. 만약 순수한 SB라면 전체 스레드가 실수입니다.

나는 우리가 기계공 회의를해야한다고 믿습니다. 분명히 뷔페와 아랍 에미리트 어딘가에서. 그리고 그곳에서 공식적인 분위기와 비공식적 인 분위기에서 모든 것을 논의 할 수 있습니다. 그렇지 않으면 포럼을 통해 하는 것은 불편합니다.

하루는 회의, 하루는 모두가 술을 마시고, 다음 날은 모두가 싸우고, 서로의 가슴을 잡아 당기고, 다시 회의를 계속하는 식으로 프로그램이 진행됩니다. 즉석에서 :)

스폰서이자 메인 연사는 Saber, 그다음은 Alexei Nikolaev, 그다음은 다른 모든 사람이 될 것입니다 :)
 
Aleksey Vyazmikin #:

추가 분류를 위해 데이터를 전처리하는 것과 수익은 어떤 관련이 있을까요?

점점 가파르게 상승하는 대차대조표가 담긴 수많은 GIF의 요점은 무엇일까요? 질문에 대한 답을 이해하지 못하셨나요?

 
Maxim Dmitrievsky #:
기계 컨퍼런스를 해야 할 것 같아요. 뷔페를 포함해야 하고 아랍에미리트 어딘가에서 개최해야 합니다. 그리고 그곳에서 공식적인 분위기와 비공식적인 분위기에서 모든 것을 논의해야 합니다. 그렇지 않으면 포럼을 통해 하는 것은 불편합니다.

하루는 회의를 하고, 하루는 모두가 술을 마시고, 다음날은 모두가 싸우고, 서로의 가슴을 잡아당기고, 다시 회의를 하는 식으로 프로그램이 진행됩니다. 즉석에서 :)

스폰서이자 메인 연사는 Saber, 그다음은 Alexei Nikolaev, 그다음은 다른 모든 사람이 될 것입니다 :)

세이버의 돈으로 자신의 전략에 익숙해 지려는 아이디어는 훌륭하고 잘 생각한 것 같습니다. 뭐가 잘못될지 모르겠어요 🤔

 
Aleksey Nikolayev #:

세이버의 돈이 자신의 전략에 익숙해지도록 하는 아이디어는 훌륭하고 잘 생각한 것 같습니다. 뭐가 잘못될지 모르겠네요 🤔.

😀😀 가장 성공적인 메인 스폰서를 추가하는 것을 잊었습니다. 하지만 모두가 힘을 합쳐야 합니다.
그의 강연을 후원할 사람들을 찾을 수 있을 것 같아요.

컨퍼런스의 요점은 아마도 구체적인 전략이 아니라 일반적인 접근 방식, 철학, 도구 등을 논의하는 것일 것입니다.
 
Forester #:

즉, 10개의 퀀타/세그먼트를 선택한 다음 이 세그먼트의 예시를 사용하여 10개의 트리를 훈련하는 건가요?
OOS의 안정성에 대해 - 실험이 표시됩니다. 데이터 창의 크기 (2 개월 및 4 개월)를 변경하고 2 %라도 이동 (토요일 대신 화요일에 훈련)할 때 안정성이 위반됩니다. 나무가 다른 것으로 밝혀졌습니다.

예, 모든 것이 그렇습니다. 물론 접근 방식을 더 복잡하게 만들 수 있지만 원한다면 그렇게 할 수 있습니다.

지금 제 기억이 맞다면 트리의 예측자는 분할하기에 가장 좋은 위치를 찾지 않고 범위의 절반에 불과합니까?

아이디어의 성공에 관해서는 전적으로 동의하지만 누워있는 돌 아래에서도 물이 흐르지 않습니다.

포레스터 #:

나는 그의 알고리즘과의 믹싱에 대해 fxsaber와 이야기했을 때 (시간별로) 그러한 악화에 대해 생각했습니다. 그는 데이터에 그렇게 큰 차이가 없습니다. 분명히 그는 마크 업에서 모든 막대가 연속적으로 (또는 연속적으로 서있는 행)가 아니라 큰 간격이 있기 때문입니다. 막대가 가까운 경우 과거와 미래가 매우 유사합니다. 즉, 클래스 1의 예가 20개 연속으로 있을 수 있습니다. 무작위로 정렬하여 평균 0101010....으로 만들고, 20개의 '1'을 20개의 '0'으로 바꿔야 합니다. 서로 가깝고 하나의 예로 계산할 수 있기 때문입니다. 여러분에게는 그렇지 않다면 저에게는 그렇습니다(저는 모든 막대를 연속으로 평가하기 때문에 이 아이디어가 떠올랐습니다).


일반적으로 10 배의 큰 차이로 10000 번의 테스트를 수행하지 않을 수 있다고 생각합니다. 처음 10 개의 테스트에서 너무 명백한 차이 (모두 더 나쁨)가 다른 10000 개가 결과를 원본과 동일하게 올릴 것이라고 가정하기에는 너무 분명합니다. 3번 더 나빴고, 3번 더 좋았고, 4번은 거의 같았다면 통계를 계속 누적하는 것이 좋습니다.

데이터가 직렬화되어 있다면, 문제는 역사 어딘가에서 비슷한 과거를 가진 일련의 1이 20개 발견된다는 것입니다. 이것은 시장 무작위 추출입니다. 111111111 을 010101010 으로 만드는 것이 아니라

따라서 시장 데이터에 대한 01010101 형태의 몬테카를로는 시장 데이터(직렬화된 경우)에는 작동하지 않는다고 생각합니다. 직사각형과 정사각형을 같은 정사각형으로 나눈 다음 정사각형이 속한 기본 모양을 결정하는 것과 같습니다)).

안타깝게도 데이터를 처리할 때 실수를 저질렀습니다(이 테스트를 위해 스크립트를 빠르게 재설계하면서 한 가지 뉘앙스를 고려하지 않았습니다). 결과적으로 테이블은 다음과 같습니다.

결론은 데이터가 무작위로 양자 테이블의 범위에 속할 수 있으며 사용 가능한 안정성 테스트를 통과할 수 있다는 것입니다. 기본 설정 / 기준이 사용되었으므로 이제이를 강화하고 결과를 확인하려고합니다.

그러나 이전에 퀀텀 컷오프의 약 30%만이 다른 두 샘플에서 효율성을 보인다고 썼기 때문에 결과는 일반적으로 예상된 것이었습니다. 다만 그 이상함 때문에 모든 것을 다시 확인하게 되었습니다. 선택 결과를 개선하는 것이 과제입니다.

그러나 정량화의 목적은 확률 변화를 가진 그룹을 선택하는 것입니다. 그룹 자체가 새로운 데이터에서 다른 대상으로 이동하더라도 분할을 통해 그 안에서 안정적인 잎을 찾을 수 있습니다.

제가 실험한 샘플에서는 하루에 평균 1개의 신호가 발생하기 때문에 막대가 멀리 떨어져 있는 것 같습니다.

위에서 제안한 실험의 결과를 보면 무작위로 생성된 목표 응답이 샘플링된 양자 세그먼트에 얼마나 자주 포함되는지 보여주는 것이 더 흥미로울 것 같습니다. 알렉세이 니콜라이예프가 추상화에서 제안한 것처럼 이것은 이미 고정 된 간격이 이미 "가슴"이 될 것입니다.

샘플을 보내 주시면 양자 세그먼트를 선택하고 이 데이터로 수정된 포리스트 생성을 실험하거나 제 샘플을 드릴 수 있습니다.

 
Maxim Dmitrievsky #:
기계 컨퍼런스를 해야 할 것 같아요. 뷔페를 포함해야 하고 아랍에미리트 어딘가에서 개최해야 합니다. 그리고 그곳에서 공식적인 분위기와 비공식적인 분위기에서 모든 것을 논의해야 합니다. 그렇지 않으면 포럼을 통해 하는 것은 불편합니다.

하루는 회의를 하고, 하루는 모두가 술을 마시고, 다음날은 모두가 싸우고, 서로의 가슴을 잡아당기고, 다시 회의를 하는 식으로 프로그램이 진행됩니다. 즉석에서 :)

스폰서이자 메인 연사는 Saber, 그다음은 Alexei Nikolaev, 그다음은 다른 모든 사람이 될 것입니다 :)

Fourchette-나쁘지 않게 들리지만 폭력의 필요성-음, 나는 나 자신을 알아 차리지 못했습니다. 나는 내가 이해하지 못해서 슬프지만 그 자체로 그렇게 강한 공격성을 유발하지는 않습니다.

 
Aleksey Vyazmikin #:

퍼셋-나쁘지 않게 들리지만 폭력의 필요성-음, 나는 그것을 알아 차리지 못했습니다. 내가 이해받지 못한다는 것이 슬프지만 그 자체로 그렇게 강한 공격성을 유발하지는 않습니다.

폭력은 합의에 의해서만 이루어지며 논쟁이 끝나면 모든 문명화 된 사람들은
 
Maxim Dmitrievsky #:
기계 컨퍼런스를 해야 할 것 같아요. 뷔페를 포함해야 하고 아랍에미리트 어딘가에서 개최해야 합니다. 그리고 그곳에서 공식적인 분위기와 비공식적인 분위기에서 모든 것을 논의해야 합니다. 그렇지 않으면 포럼을 통해 하는 것은 불편합니다.
하루는 회의, 하루는 모두가 술을 마시고, 다음날은 모두가 싸우고, 서로의 가슴을 잡아 당기고, 다시 회의를 계속하는 식으로 프로그램이 진행됩니다. 즉석에서 :)
스폰서이자 메인 연사는 Saber, 그다음은 Alexei Nikolaev, 그다음은 다른 모든 사람이 될 것입니다 :)

저는 기계 학습에 대해 읽고 싶었고 여기에서 유머리스트들이 기술을 연마하고 있습니다.

다른 곳에서 주제와 관련이없는 유머 농담과 다른 것들을보고 싶습니다.


이제 주제에 대해 말씀드리겠습니다.

시장이 무작위적이라고 생각한다고 쓰셨는데, 이 주장의 근거는 무엇인가요?

시장 가격 움직임의 무작위성을 증명할 수 있는 확실한 근거가 있나요?

사유: