트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 1330

 
알렉세이 비아즈미킨 :

나는 또 다른 질문에 가장 의아해합니다. 다른 샘플의 다른 모델에 대해 그래프가 매우 유사한 이유는 모델이 빈번한 주기성과 다른 샘플 크기(어쨌든, 이 조각은 지속적으로 창에 떨어집니다.) 모델이 활용하는 것은 바로 이 규칙성입니다.

나 자신의 경우, 흥미로운 모델을 찾기 위해 검증 사이트에 찬성하여 모든 데이터 샘플의 30%에서 70%까지 배포하는 것이 꽤 가능하다고 결론지었지만 여전히 30%가 최적인 것 같습니다.

아마도 당신은 같은 모델을 가지고 있지만 다른 씨앗을 가지고 있기 때문입니까? ))

모델이 무작위화되면 이것이 100개의 시작을 의미하지는 않습니다. 발전기의 가치는 결과에 크게 영향을 미칠 것입니다

일반 모델은 거의 변경되지 않으며 절대적으로 무작위입니다. 이것은 안정성 테스트일 뿐입니다.

이 모든 결론은 아무 것도 하지 않고 실험도 하지 않고 순전히 이론에서 도출할 수 있습니다.

30/70 순전히 무작위 결과. 결론은 30에서 70 사이의 범위에서 점근적으로 50에 접근한다는 것입니다. 바로 그러한 하위 표본이 포착되었습니다.

 
막심 드미트리예프스키 :

아마도 당신은 같은 모델을 가지고 있지만 다른 씨앗을 가지고 있기 때문입니까? ))

모델이 무작위화되면 이것이 100개의 시작을 의미하지는 않습니다. 발전기의 가치는 결과에 크게 영향을 미칠 것입니다

일반 모델은 거의 변경되지 않으며 절대적으로 무작위입니다. 이것은 안정성 테스트일 뿐입니다.

이 모든 결론은 아무 것도 하지 않고 실험도 하지 않고 순전히 이론에서 도출할 수 있습니다.

자세히 보면 한 샘플에 있는 모델의 재무 결과가 5000에서 1500까지 매우 다를 수 있음을 알 수 있습니다. 이는 Seed가 여전히 모델에 영향을 미친다는 것을 의미합니다. 나는 비슷한 선택 모델이라고 가정 할 것입니다 (확인하겠습니다). 약간의 이익 섹션이 있지만 거의 모든 사람이 모델 중간에 플랫을 가지고 있습니다. 놀라운 것은 동일합니다. 그들은 같은 실수를합니다. 섹션(새 데이터의 이상?).

나는 "정상적인 모델은 거의 변하지 않을 것이며 절대적으로 무작위적일 것이다"라는 말을 이해하지 못했습니다. 두 번째 부분은 첫 번째 부분과 모순됩니다.

막심 드미트리예프스키 :

30/70 순전히 무작위 결과. 결론은 30에서 70 사이의 범위에서 점근적으로 50에 접근한다는 것입니다. 바로 그러한 하위 표본이 포착되었습니다.

이것이 요점입니다 - 무작위 여부, 즉. 이 영역의 샘플 내용이나 샘플의 데이터 양에 따라 달라지며, 이것이 더 많은 영향을 미치는 이해해야 할 사항입니다.

 
알렉세이 비아즈미킨 :

자세히 보면 한 샘플에 있는 모델의 재무 결과가 5000에서 1500까지 매우 다를 수 있음을 알 수 있습니다. 이는 Seed가 여전히 모델에 영향을 미친다는 것을 의미합니다. 나는 비슷한 선택 모델이라고 가정 할 것입니다 (확인하겠습니다). 약간의 이익 섹션이 있지만 거의 모든 사람이 모델 중간에 플랫을 가지고 있습니다. 놀라운 것은 동일합니다. 그들은 같은 실수를합니다. 섹션(새 데이터의 이상?).

나는 "정상적인 모델은 거의 변하지 않을 것이며 절대적으로 무작위적일 것이다"라는 말을 이해하지 못했습니다. 두 번째 부분은 첫 번째 부분과 모순됩니다.

이것이 요점입니다 - 무작위 여부, 즉. 이 영역의 샘플 내용이나 샘플의 데이터 양에 따라 달라지며, 이것이 더 많은 영향을 미치는 이해해야 할 사항입니다.

낮은 오류 모델, 즉 품질, 종자 변경은 영향을 미치지 않습니다. 무작위가 약 0.5이면 모든 무작위 재채기에 대해 과적합되기 때문에 다양한 모델을 갖게 됩니다.

 
막심 드미트리예프스키 :

낮은 오류 모델, 즉 품질, 종자 변경은 영향을 미치지 않습니다. 무작위가 약 0.5이면 모든 무작위 재채기에 대해 과적합되기 때문에 다양한 모델을 갖게 됩니다.

이것은 정확도 99%와 관련이 있을 수 있지만 내 재현율은 낮습니다. 좋은 시나리오에서 20%입니다. 잠재적으로 1의 대부분은 정의되지 않고 항목이 없으므로 다른 모델은 20%의 창으로 0에서 100 사이의 범위에서 작동할 것으로 예상됩니다.

 
알렉세이 비아즈미킨 :

이것은 정확도 99%와 관련이 있을 수 있지만 내 재현율은 낮습니다. 좋은 시나리오에서 20%입니다. 잠재적으로 1의 대부분은 정의되지 않고 항목이 없으므로 다른 모델은 20%의 창으로 0에서 100 사이의 범위에서 작동할 것으로 예상됩니다.

이것은 갈 길이 아닙니다. 모델의 전체 오류를 줄이고 바퀴를 발명하지 않아야 합니다.

그러면 모든 종류의 이상한 접근 방식이 저절로 사라질 것입니다.

50회 작성 - 바퀴를 재발명할 필요가 없습니다. 이 방법은 아무데도 없습니다.
 
막심 드미트리예프스키 :

이것은 갈 길이 아닙니다. 모델의 전체 오류를 줄이고 바퀴를 발명하지 않아야 합니다.

그런 이상한 접근 방식은 모두 저절로 사라질 것입니다.

50회 작성 - 바퀴를 재발명할 필요가 없습니다. 이 방법은 아무데도 없습니다.

나는 주의 깊게 듣는다. 그 밖에 내가 오류를 줄일 수 있는 것은 무엇인가?

이러한 목적을 위해 샘플 구성을 변경하고 모델 생성을 위한 설정을 변경합니다. 다른 무엇을 할 수 있습니까?

 

씨앗이 모델에 어떻게 영향을 미치는지 누가 신경쓰나요? - 30% 샘플을 가져옴, 모든 모델 - 그림을 클릭하여 애니메이션


 
막심 드미트리예프스키 :

이것은 갈 길이 아닙니다. 모델의 전체 오류를 줄이고 바퀴를 발명하지 않아야 합니다.

그러면 모든 종류의 이상한 접근 방식이 저절로 사라질 것입니다.

50회 작성 - 바퀴를 재발명할 필요가 없습니다. 이 방법은 아무데도 없습니다.
동의하지 않는다. 표준 ML 방법이 시장에서 작동했다면 모두가 도움을 받아 돈을 벌었을 것입니다.
알렉세이 비아즈미킨 :

그러나 낮에는 자전거를 발명할 필요가 있습니다. 그리고 밤에 잠을 자요. 당신의 건강을 저장합니다.
 
도서관 :
동의하지 않는다. 표준 ML 방법이 시장에서 작동했다면 모두가 도움을 받아 돈을 벌었을 것입니다.
그러나 낮에는 자전거를 발명할 필요가 있습니다. 그리고 밤에 잠을 자요. 당신의 건강을 저장합니다.

문제는 표준 방법이 아니라 그 방법으로 무엇을 하려는지, 어떤 프로세스로 작업하는지에 대한 기본적인 오해에 있습니다.

저것들. 경제 및 수학 교육의 부족

따라서 취한 조치는 브라운 입자의 방황과 유사합니다 .. 또는 아마도 이렇게 또는 저 ..

그리고 모든 사람들은 특히 영어로 된 "어려운" 책 읽기를 거부합니다. 그러므로 맹인 새끼 고양이의 길을 선택하십시오

 
막심 드미트리예프스키 :

문제는 표준 방법이 아니라 그 방법으로 무엇을 하려고 하는지에 대한 기본적인 오해에 있습니다.

어리석음의 생생한 예 - 출구의 지그재그

Reshetov의 핵 기계는 여기에서 일부 사람들이 사용하는 것과 동일한 자전거입니다. 그리고 분명히 그는 표준보다 더 성공적으로 시장에 대처합니다.

그래서 나는 자전거를 좋아합니다! ) 그러나 물론 그들로 무엇을 해야 하는지도 이해해야 합니다.

사유: