성배 :

볼륨은 추세에서 평면으로 상태의 변화를 예측하는 데 도움이되지만 "어려움없이"와는 거리가 멀며 일반적으로 "추세 / 평면"의 상태를 예측하는 것은 단위당 다음 증분의 방향보다 훨씬 정확하지 않습니다. 시간, 정확도가 약 57% 정도, 믿을 수 없는 숫자에 대해 말한 내용은 분명히 오류의 결과입니다 .

숫자는 무엇입니까?

 

그럼에도 불구하고 기계 학습은 이상하고 예측할 수 없는 것입니다. CatBoost로 디버깅 작업을 계속하다 보면 이렇게 작동하는 모델을 얻었습니다(교육 + 테스트 + 시험)

2014년부터 2019년까지 거래(346건)가 많지 않을 수도 있지만, 반면 자금의 인출은 전체 기간 동안 1299건으로 10% 미만입니다. 물론 2014년에는 강한 성장이 있었고 다시는 일어나지 않을지 모르지만 그 이후에는 매우 순조로웠습니다.

아래는 검사용 샘플에 대한 그래프입니다. (조건부로 이 테스트보다 샘플이 작기 때문에)

근데 그래프만 보여주는게 아니라 여기도 흔하지 않은데 모델의 내용을 보고 많이 놀랐다고 말씀드리고 싶어요 - 38개의 예측변수 중 4개만 사용!

TimeH - 시간 단위의 시간

DonProcVisota_M15 - M15에서 Donchian 채널의 상대 너비

LastBarPeresekD_Down_M15 - 마지막 Donchian 채널 크로스오버 이후의 막대 수

BB_PeresekN_Total_M1 - 마지막 x 막대에 대한 iDelta 수준의 교차 가격 수

물론 샘플에 많은 수의 예측 변수가 있고 이를 분할한 다음 시드를 지정하고 이 모든 것이 탐욕 원칙에 따라 샘플을 나누는 것이 항상 효과적인 것은 아니라는 내 이론에 맞습니다. 이것은 단지 다음을 수행하는 방법일 뿐입니다. 아무것도 보장하지 않습니다.

이것들은 내가 수집하고 풀링하고 싶은 모델입니다.

 
대부분의 예측 변수는 실제로 잡음이거나 서로 상관 관계가 있을 것으로 예상됩니다.

앉아 - 뭐야? Yandex는 급류 배포에 대해서만 이야기합니다.
 
아이디어는 노이즈가 아니라 일부 예측 변수가 다른 예측 변수와 겹친다는 것입니다. 형성된 연결은 중요하고 생성되어야 합니다.

저는 시딩 중입니다. 물론 저는 저 자신을 위한 용어를 발명했습니다 . 특정 디지털 값과 함께 --random-seed 플래그를 사용합니다. 사실, 나는 이 값의 범위가 무엇인지 모르지만 학습에 상당한 영향을 미치고 이 통제된 무작위화가 나에게 적합하다는 것을 알았습니다.

 
안녕하세요 형제 여러분. 테스터에서 전략 을 테스트 한 결과를 기반으로 자금 차트를 작성하는 지표를 알려주십시오. 나는 뭔가를 찾을 수 없습니다 ... 기억하고 기억합니다. 만일 손에 있는 사람이 나에게 그것들을 던진다면. 감사해요!!!
 
알렉세이 비아즈미킨 :

저는 시딩 중입니다. 물론 저는 저 자신을 위한 용어를 발명했습니다 . 특정 디지털 값과 함께 --random-seed 플래그를 사용합니다. 사실, 나는 이 값의 범위가 무엇인지 모르지만 학습에 상당한 영향을 미치고 이 통제된 무작위화가 나에게 적합하다는 것을 알았습니다.

임의성을 수정합니다. 이것은 일반적으로 다시 시작할 때 재현 가능한 결과에 사용됩니다.
결과에 큰 영향을 미치지 않는 것이 바람직하다. 그렇지 않으면 특정 랜덤에 맞는 것으로 판명됩니다. 저것들. 최적화해야 하는 기능(상당한 영향을 미치는)이 하나 더 있습니다.
 
레나트 아크티아모프 :

숫자는 무엇입니까?

트렌드 \ 아파트는 거의 90 %가 예측한다는 주제에서 위에서 본 것처럼 누군가의 손자 또는 학생이 말하는 것 같았습니다.

 
성배 :

트렌드 \ 아파트는 거의 90 % 예측된다는 주제에서 위에서 본 것처럼 누군가의 손자 또는 학생이 말하는 것 같았습니다.

네, 플랫 이후 추세가 있을 100%입니다. Che는 예측하기 위해 거기에 있습니다.
 
성배 :

트렌드 \ 아파트는 거의 90 % 예측된다는 주제에서 위에서 본 것처럼 누군가의 손자 또는 학생이 말하는 것 같았습니다.

아아

음, 진드기가 없다면 분명히 시장은 평평합니다. 100%

진드기가 많으면 더 이상 평평하지 않습니다.
 
도서관 :
임의성을 수정합니다. 이것은 일반적으로 다시 시작할 때 재현 가능한 결과에 사용됩니다.
결과에 큰 영향을 미치지 않는 것이 바람직하다. 그렇지 않으면 특정 랜덤에 맞는 것으로 판명됩니다. 저것들. 최적화해야 하는 기능(상당한 영향을 미치는)이 하나 더 있습니다.

네, 나중에 결과를 재현하고 일반적으로 결과를 생성하는 것이 필요합니다.

그것이 어떻게 작동하는지 완전히 명확하지 않을뿐입니다. 내가 이해하는 것처럼이 매개 변수는 최상의 옵션을 선택할 때 분할 결과를 계산하는 임의성에 대한 책임이 있지만 어디에서나 세부 정보를 찾을 수 없습니다.

그리고 적합성에 대해... 우리는 모든 것이 잠재적 적합성이라는 사실에서 출발해야 하며 시간이 지남에 따라 관계의 안정성만 확인하고 이러한 관계의 효율성을 제어할 수 있습니다. 예를 들어 해당 모델은 각각 4개의 트리로 구성되어 있습니다. 그 중 깊이는 4입니다. 조합의 수가 적기 때문에 여기에 맞는 것이 매우 효과적입니다. 즉, 샘플에 대한 설명이 아니라 일종의 패턴으로 나타날 수 있습니다.

