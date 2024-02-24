트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 1329

유리 아사울렌코 :

선생님 없이도 할 수 있습니다. 나는 이것에 어떤 차이도 보이지 않는다.

몇 개의 if 문으로 해결되는 문제를 학습하고 해결하는 뉴런 무리를 상상해 보십시오.

음, 이해합니다. 이것을 선험적 지식, 내장 피어 리뷰라고 하지만 100% 확신하기 때문에 모델과 함께 다시 확인하지 않습니다.

나는 무작위와 몇 가지 사소한 믿음 외에 무작위 프로세스에 대한 지식이 없습니다.
 
막심 드미트리예프스키 :

네 맞습니다. 이것은 실질적으로 공리입니다. 왜 확인하십시오. 우리는 해결책의 선험적인 부분을 알고 있습니다 - 우리는 시장에서 헛되이 명상하고 있습니다.)

 
막심 드미트리예프스키 :

다시 말하지만, 우리는 다른 접근 방식에 대해 이야기하고 있습니다.

당신은 교사와 함께 훈련을 받았기 때문에 당신은 처음에 먼저 누워, 나는 교사가 없습니다

기억해. 물론 다른 접근 방식이 있습니다. 다시 한 번, 나는 이것에 금기 사항이 없습니다(선생님과 함께). 원하는 경우 확실히 나타나면 모든 것이 실현 가능합니다.

선생님이 없는 RNN이 없는 한 여기에서는 모든 것이 더 복잡하고 저는 잘 모르겠고 사용하지 않았습니다. 그건 그렇고, 당신은 무엇을 사용하고 있습니까? 엠비. 그들은 말했지만 주제를 삽질하기 위해 ...

유리 아사울렌코 :

많은 것들, rn은 여전히 충분하지 않았습니다)) 그러면 할 것입니다.

기본에 대한 기사가 있지만 자연스럽게 그는 더 나아갔습니다.

 
막심 드미트리예프스키 :

사거리에서 - 당신은 오른쪽으로 갈 것입니다 ... 등. Tensorflow는 아주 좋은 기능이지만 매우 무겁다고 합니다. 지금까지는 문서만 읽었습니다. 사용하지 않았다?

유리 아사울렌코 :

면에서 부담? tf 저수준, ano 위에 올려 놓고 tf.theano를 사용하면 모든 것이 더 쉽습니다.

다양한 예제를 살펴보았지만 아직 개발을 해본 적이 없습니다.

두 번째 버전이 진행 중이며 이미 사이트에서 사용할 수 있으며 모델 생성이 단순화됩니다.
 
막심 드미트리예프스키 :

속도면에서. 아마도. 지금은 scikit-learn을 중지하십시오, CHAZ. MLP는 꽤 좋습니다.

유리 아사울렌코 :

모르겠어, 아닌 것 같아

dofiga 패키지, 나는 가장 인기 있고 개발중인 것만 연구하려고합니다.

sklearn은 일종의 잡동사니입니다.

tf 네이티브 아키텍처의 추가 생성자

 
유리 아사울렌코 :

NN은 스케일링을 좋아하지 않습니다. 가격 범위 - 100-120에서 훈련, 가격은 그 이상입니다 - 그게 다야, 단락. 가격과 관련된 모든 것을 가격 자체로 나누고 1을 뺀 다음 계수를 사용하여 변수를 원하는 동적 범위로 이동합니다.

따라서 수용 가능한 메트릭에 대한 데이터 전처리가 필요합니다. 나는 상위 TF에서 내 ATR을 사용하고 그 안에 가격을 배치합니다. 나는 레벨별로 노치가 있는 도미노를 얻고 가격에는 피보나치 레벨 번호가 할당됩니다.

 

완료된 처리 모델, 201에서 401까지의 시드 - 다른 모든 것은 변경되지 않습니다.

균형 평가 결과 표

측정항목이 있는 표

독립 표본에 대한 선택 기준을 충족하는 모델 수가 표시된 표


세 가지 샘플 모두에서 선택 기준과 일치하는 모델 수가 표시된 표

모델 차트(대부분 gif)

서른%

40%

오십%

60%

추세는 주로 모든 지표에 대해 유지되는 것 같습니다. 아래는 델타 표입니다. 변경 사항을 비교하기 위해되었습니다.

메트릭 측면에서 차이는 일반적으로 미미합니다.

수집된 자료를 보면 대체로 이러한 경향이 지속되고 있음을 알 수 있다.

나는 또 다른 질문에 가장 의아해합니다. 다른 샘플의 다른 모델에 대해 그래프가 매우 유사한 이유는 모델이 빈번한 주기성과 다른 샘플 크기(어쨌든, 이 조각은 지속적으로 창에 떨어집니다.) 모델이 활용하는 것은 바로 이 규칙성입니다.

나 자신의 경우, 흥미로운 모델을 찾기 위해 검증 사이트에 찬성하여 모든 데이터 샘플의 30%에서 70%까지 배포하는 것이 꽤 가능하다고 결론지었지만 여전히 30%가 최적인 것 같습니다.

