트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 3061

 
Aleksey Vyazmikin #:

아마도 나는이 모든 것의 목적을 정말로 이해하지 못했을 것입니다.... 그러나 목표는 새로운 요인의 영향을 감지하는 것이거나 지표에 대한 예측 변수의 과거 값 (가격 또는 다른 것-회귀가 대부분 예제에 있음)의 이상치로 생각할 수있는 것처럼 보였습니다. 그런 다음 이벤트의 연대기가 변경되지 않은 상태에서 이러한 이상값을 감지하는 것이 과제입니다(시계열의 경우 샘플 라인을 무작위로 지정할 수 없음). 그리고 이것이 드문 이벤트이거나 일회성 변경인 것으로 밝혀졌습니다. 그런 다음 고정된 기간 동안 예측 지수 분포의 변화를 살펴보는 것으로 충분합니다. 이러한 변화가있는 예측 변수가 원인이며 (또는 그렇지 않을 수도 있습니다-여기서는 원인 또는 결과를 결정하는 방법에 대한 아이디어를 이해하지 못했습니다) 테스트의 다른 부분에서 이러한 변화가 더 자주 "모델이 작동하지 않음"이라는 결과로 이어지면 이러한 예측 변수를 사용하여 모델이 더 신중하게 작동하도록해야합니다.....

예측 변수와 트리트먼트는 다른 개념입니다. 인과 관계는 결과와 함께 작동하여 특성이 없는 경우 ATE(평균 치료 효과)를 결정하고, 공변인(특성)이 있는 경우 일부 외부 영향(예: 트리트먼트인 광고 캠페인)을 고려하여 CATE(조건부 ... ...)를 결정합니다. 이는 대조군에 효과가 있는지 확인하기 위한 것입니다. 그런 다음 그 효과가 있으면 모델이나 일부 지표를 분석하고 개선할 수 있습니다.

... 적용 방법을 모르는 것을 적용하는 방법을 알아내려고 노력하는 사람이 바로 여러분입니다.

짧은 무료 입문 과정 수강하기

 
Maxim Dmitrievsky #:

인과관계와 트리트먼트는 서로 다릅니다. 인과 관계는 결과와 함께 작동하며, 어떤 외부 영향(예: 트리트먼트인 광고 캠페인)을 고려하여 특성이 없는 경우 ATE(평균 치료 효과)를, 공변인(특성)이 있는 경우 CATE(조건부 ... ...)를 결정합니다. 이는 대조군에 효과가 있는지 확인하기 위한 것입니다. 그런 다음 이 효과를 바탕으로 모델 또는 일부 지표를 분석하고 개선할 수 있습니다.

... 적용 방법을 모르는 것을 적용하는 방법을 알아내려고 노력하는 사람이 바로 여러분입니다.

무료 입문 과정을 수강하세요.

저는 이 두 개의 글을 읽었는데, 동영상과 함께 아이디어를 얻게 해준 글입니다.

https://habr.com/ru/companies/ru_mts/articles/485980/

https://habr.com/ru/companies/ru_mts/articles/485976/ 

저도 비슷한 작업을 하고 있기 때문에 뉘앙스에 대한 나름의 견해가 있습니다. 하지만 네 - 새로운 용어가 혼란스럽습니다.

모델 예측의 확률을 빼는 것은 특히 이러한 확률이 CB에서 어떻게 분포되는지 알고 있다면 좋지 않다고 생각합니다.

이러한 문제를 전문으로 다루는 라이브러리를 실험해 보신다면 그 결과와 상황에 대한 견해를 공유해 주세요.

그들의 접근 방식의 주요 아이디어가 미끄러지는 한 가장 중요한 것은 분석 주제에 대한 분석가의 경험과 지식입니다 :)

 
Aleksey Vyazmikin #:

저는 이 두 사람의 글을 읽었는데, 이 글들이 동영상과 함께 아이디어의 기반이 되었습니다.

https://habr.com/ru/companies/ru_mts/articles/485980/

https://habr.com/ru/companies/ru_mts/articles/485976/ 

저도 비슷한 작업을 하고 있어서 뉘앙스에 대한 나름의 견해가 있습니다. 하지만 네, 새로운 용어가 혼란스럽긴 합니다.

모델 예측의 확률을 빼는 것은 특히 이러한 확률이 CB에서 어떻게 분포되는지 알고 있다면 좋은 생각이 아니라고 생각합니다.

이러한 문제를 전문으로 다루는 라이브러리로 실험해 보신다면 그 결과와 비전을 공유해 주세요.

그들의 접근 방식의 주요 아이디어가 미끄러지는 한 가장 중요한 것은 분석 주제에 대한 분석가의 경험과 지식입니다 :)

툴킷이 제공되면 해결하세요.

너무 추상적으로 생각하면 모든 사람이 "유사한 작업"을하고 있습니다 (어떤 작업을 공식화 할 수 없습니다).

 
Maxim Dmitrievsky #:

툴킷이 제공되는지 알아보세요.

너무 추상적으로 생각하면 모두가 '비슷한 작업'을 하고 있는 것일 뿐입니다(다만 어떤 작업인지 공식화할 수 없을 뿐).

포럼에 문제를 해결하기 위한 별도의 스레드가 있습니다. 목표는 예측자(양자 세그먼트)의 확률 분포에 영향을 미치는 새로운 요인이 나타날지 여부를 확인하는 것입니다.

오랫동안 작업하지는 않았지만. 더 정확하게는 아이디어를 종이에서 코드로 옮겨야 합니다.

파이썬에 대한 기본 지식 없이는 그런 일을 처리하기가 어렵습니다. 자유 시간이 전혀 없고 금방 피곤해집니다. 약이 조금 도움이 되었지만 기분이 좋을 때 약을 먹습니다....

Автоматический расчет описательных статистик выборки на MQL5 - Определите, похожи ли в целом средние значения событий?
Автоматический расчет описательных статистик выборки на MQL5 - Определите, похожи ли в целом средние значения событий?
  • 2023.03.24
  • www.mql5.com
Код использует два callback-объекта в обучении модели LearningRateScheduler - позволяет динамически изменять скорость обучения модели в зависимости от номера эпохи. За весь период наблюдения поворот направо был осуществлен в 65
 
Aleksey Vyazmikin #:

포럼에 문제 해결에 관한 별도의 스레드가 있습니다. 목표는 예측자(양자 세그먼트)의 확률 분포에 영향을 미치는 새로운 요인이 나타날지 여부를 확인하는 것입니다.

오랫동안 작업하지는 않았지만. 더 정확하게는 아이디어를 종이에서 코드로 옮겨야 합니다.

파이썬에 대한 기본 지식이 없으면 그런 일을 처리하기가 어렵습니다. 자유 시간이 전혀 없고 금방 피곤해집니다. 약이 조금 도움이 되긴 했지만 기분이 좋을 때 약을 먹어요....

제가 할 수 있는 작업을 설정해야 합니다. 무슨 말인지 읽을 방법이 없어요. 주파수에 타임라인이 있는데... 너무 노골적이에요. 그러다 반사적으로 손가락이 십자가 ❌를 찔렀어요.
 
Maxim Dmitrievsky #:
스스로 목표를 설정해야 합니다. 무슨 말인지 읽을 방법이 없어요. 주파수에 시간 척도가 있네요... 너무 노골적이에요. 그러다 반사적으로 손가락이 십자가 ❌를 찔렀습니다.

네, 제가 사용한 시간 척도는 해당 샘플의 독립적인 측정값을 표준화할 수 있는 유일한 방법이며, 적용 값은 손실되지 않습니다.

문제가 어렵고 해결책을 찾지 못할 수도 있다는 데 동의합니다. 그러나 저는 이것이 모델이 작동을 멈추는 주된 이유라고 생각합니다. 예측 범위의 확률 이동 분포가 시간에 따라 많이 변하기 때문입니다. 그리고 여기서 우리는 새로운 요인의 출현 순간을 감지하거나 일종의 생존 작업 인 "생명"의 역사에서 변동성의 전제 조건을 찾기 위해 이런 일이 발생하는 이유를 찾을 수 있습니다.

이 지식을 통해 접근 방식을 살펴보면, 훈련 기간 동안 그 순간에 유의미한 예측 인자의 분포가 안정적인 영역을 간접적으로 찾고, 몇 가지 기준에 따라 다른 분포를 가진 다른 영역을 걸러냅니다. 그러나 표본에서 이러한 영역이 예측자마다 다르다는 사실은 매우 큰 샘플링 기간을 잘라내는 원인이 됩니다. 각 반복에서 예측자의 수를 줄이면 예측자 간의 확률 편향 충돌이 줄어들어 리콜을 높일 수 있습니다.

 
빈도에는 타임라인이 없습니다. 모델 오류로 작업 중입니다 :) 이 접근 방식은 오래 전에 표명되었으며 상승 기술에 대해 알지 못했습니다. 거의 같은 일을 한 것으로 밝혀졌습니다. 이 분포를 보는 이유는 무엇일까요? 이미 명확한 것을 시각화하는 것입니다.
 
Maxim Dmitrievsky #:
빈도에는 타임라인이 없습니다. 모델 오류로 작업 중입니다 :) 이 접근 방식은 오래 전에 표명되었으며 상승 기술에 대해 알지 못했습니다. 거의 같은 일을 한 것으로 밝혀졌습니다. 이 분포를 보는 이유는 무엇일까요? 이미 명확한 것을 시각화하는 것입니다.

제가 용어에 대해 잘못 알고 있는 것일 수도 있는데, 할당된 시간 동안 이벤트의 빈도를 다른 말로 무엇이라고 부를까요?

저는 시각화에 대해 이야기하는 것이 아니라 이 문제를 더 효과적으로 처리하는 방법에 대해 이야기하고 있습니다.

 
Aleksey Vyazmikin #:

제가 용어가 틀렸을 수도 있는데, 할당된 시간 동안 이벤트의 빈도를 다른 말로 뭐라고 부를 수 있을까요?

저는 시각화에 대해 이야기하는 것이 아니라 이 문제를 더 효과적으로 해결하는 방법에 대해 이야기하고 있습니다.

이 스레드에 모두 나와 있으니 나머지는 구글에서 찾아보세요. 인과관계에 관한 책을 소개해 드렸어요.

정확히, 주제에없는 많은 용어 때문에 무슨 일이 일어나고 있는지 그 의미가 사라집니다. 작업 자체는 매우 간단 할 수 있지만.
 

이 주제에 끌린 이유가 무엇인지 모르겠습니다. R 사용자를 위해 이 주제에 대한 여러 패키지를 소개합니다. 이해하거나 사용하는 데 도움이 될 수 있습니다. R 4.2.3/4.3.0

other attached packages:
 [1] regmedint_1.0.0               PSweight_1.1.8                MatchIt_4.5.3                
 [4] InvariantCausalPrediction_0.8 mboost_2.9-7                  stabs_0.6-4                  
 [7] glmnet_4.1-7                  Matrix_1.5-4                  grangers_0.1.0               
[10] dagitty_0.3-1                 CompareCausalNetworks_0.2.6.2 CERFIT_0.1.0                 
[13] causalweight_1.0.4            ranger_0.15.1                 causalsens_0.1.2             
[16] CausalQueries_0.1.0           Rcpp_1.0.10                   dplyr_1.1.2                  
[19] causalPAF_1.2.5               causaloptim_0.9.7             igraph_1.4.2                 
[22] CausalMBSTS_0.1.1             KFAS_1.5.0                    CausalKinetiX_0.2.1          
[25] CausalImpact_1.3.0            bsts_0.9.9                    xts_0.13.1                   
[28] zoo_1.8-12                    BoomSpikeSlab_1.2.5           Boom_0.9.11                  
[31] CausalGAM_0.1-4               gam_1.22-2                    foreach_1.5.2                
[34] causaleffect_1.3.15           causaldrf_0.4.2               causaldata_0.1.3             
[37] causalCmprsk_1.1.0            causal.decomp_0.1.0       

지금까지는 "sr"만 적용했습니다.

행운을 빕니다.


사유: