트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 1120

[삭제] 2018.10.19 09:57 #11191
독성 :

이 경우도 있지만 데이터셋으로는 ... 죄송합니다만, 많은 분들이 최소한 수천개의 샘플이 필요하다고 말씀하셨고 , 시장 데이터의 시끄러움을 감안할 때 수십만 개의 포인트가 바람직 하지만 마스터하면 예를 들어 Java를 사용하고 XGB를 사용하면 과거의 인내로 여전히 웃을 것입니다))

이것은 거짓 진술이다

[삭제] 2018.10.19 10:05 #11192
마이클 마르쿠카이테스 :

그래서 저는 매튜스 계수에 대한 개선된 메트릭을 생각해 냈습니다. 하지만 여기에서 날려버리고 여기서 떠나면 무슨 말을 할 수 있을까요? :-(

한 클래스에서 다른 클래스로 배열을 전송하고 피펫을 실행했습니다... 물어볼 사람이 없습니다 :-(

메트릭이 차량에 대한 자체인 경우 왜 메트릭을 귀찮게 합니까? 예를 들어 샘플의 이익 계수를 측정하면 됩니다.

가장 작은 오류가 새 데이터에 대한 가장 큰 안정성을 의미하지 않기 때문에 모델의 내부 추정치는 이차적입니다.

새로운 데이터에 대한 거래 실적을 통해 외부 평가 기준을 선택하기만 하면 됩니다.

그러나 테스트를 위한 큰 샘플이 있을 때까지 볼트를 핥을 것입니다. 그리고 기차에 대한 작은 샘플은 중요하지 않습니다. 여기에서는 모든 것이 괜찮습니다.

[삭제] 2018.10.19 12:09 #11193
독성 :

주장할 수 있지만 충실도/비충실도는 시장에서 전혀 중요하지 않으며 작동하는 것이 더 중요하며 일반적으로 샘플이 많을수록 결과가 좋습니다)))

동일한 포리스트 또는 xgb를 사용하면 재교육할 샘플 수에 신경 쓰지 않습니다. 모델의 무게는 기가바이트입니다. 그러나 외부 메트릭이 있는 기능의 재귀적 열거는 외부 샘플이 아닌 작은 하위 샘플에서도 열매를 맺기 시작했습니다.

itslek 2018.10.19 12:31 #11194
마법사_ :

Tren = 100k 라인. 나머지 8k+(테스트)에서 모델을 적용합니다. 데이터가 뒤죽박죽입니다.

로그 손실 메트릭. 컷을 게시합니다. 트렌 =... 테스트 =...

물론 시계열에서는 이것이 수행되지 않습니다. 그러나 재미를 위해 데이터를 전혀 건드리지 않고 거의 기본 LightGBM에 넣었습니다.

기차: 0.6879388421499111

테스트: 0.6915181677127092

CatBoost를 보너스로 사용하여 소스 테스트:

https://yadi.sk/d/55DDn-hViNWP6Q

그리고 당신의 결과는 무엇입니까?

test_xz.ipynb
disk.yandex.ru
Посмотреть и скачать с Яндекс.Диска

Ivan Negreshniy 2018.10.19 12:32 #11195
막심 드미트리예프스키 :

테스트의 경우 일반적으로 무제한 공간이 있어야 합니다.

누군가가 데이터의 품질을 확인하려는 경우 일종의 진흙탕 CSV 파일 형식이 아니라 지표 형식으로 제공되어야 합니다.

템플릿을 사용하면 가능하지만 대상에 마크업이 없을 수도 있고 이익이 있어야 할 것이 너무 분명합니다.

그러면 모든 모델을 교육하고 Expert Advisor를 만들고 원래 지표와 함께 객관적으로 테스트할 수 있습니다.

뭐, 하고 싶은 게 있으면 하는 말인데 그냥 말만 하면...

Ivan Negreshniy 2018.10.19 14:28 #11196
독성 :

노이즈가 많을수록 샘플이 많을수록 기본 통계 수준에서 명확해야하며 시장 데이터는 매우 시끄럽습니다. 재교육은 또 다른 문제입니다. 올바르게 구축 된 기능과 올바른 대상을 가르치는 경우 수십에서 수백의 테스트에서 수천 개의 샘플에서 재교육은 실제로 달성하기 어렵습니다. 그렇기 때문에 데이터 과학자나 알고리즘 트레이더가 마조히스트나 근거리 시장이 아니며 기능이 있는 혼합 대상이 없는 경우에는 재훈련하기 어렵기 때문에 대규모 데이터 세트가 좋은 이유입니다. 우려의 명백한 원인은 기능이 대상과 3-5% 이상 상관 관계가 있다는 것입니다. 즉, 엿보는 것 같지만 원칙적으로 그런 가능성이 없도록 기능을 구축하는 것이 좋습니다. 이렇게 하면 알고리즘이 약간 복잡해집니다. , 그러나 아마도 초보 알고리즘 거래자의 주요 실수를 제거할 것입니다.

여기 계신 분들은 다 야시장 가까운 사람들을 꾸짖으시고 저도 그렇긴 한데, 님 자신은 쿨하고 시장알고리즘 트레이더인 것 같고, 글만 봐도 어느 시기에 무엇을 가르쳐야 하는지, 무엇을 매매해야 하는지 잘 아실 것입니다.

하지만 저는 잘 모르겠습니다. 어제 토론을 보았을 때 참여하지 않고 그냥 시도하기로 결정했습니다. 저는 10월 8일부터 10월 18일까지 EURUSD M1에 대한 데모를 교육했으며, 브로커가 얼마를 가지고 시작했는지 실시간으로 상담합니다.

그리고 이제 그는 여전히 이익으로 거래하고 있으며 전문가로서 질문은 그가 병합을 시작할 때입니다. 로그인 - 2096584180, 비밀번호 - na3tbvr, Tradize-Demo, 그러나 특히 열린 공간을 갈아엎는 우주선에 관한 것은 아닙니다. 볼쇼이 극장 (c))

10포인트 3.mq4
세뇌 EA HedgeHog 시스템 및 EA

Ivan Negreshniy 2018.10.19 14:50 #11197
독성 :

훈련 샘플이 부족하고 테스터와 옵티마이저의 논리가 투명하지 않습니다(블랙박스)...

결론은 99.999999999% 이 Expert Advisor가 무작위이고 주식은 거래 비용으로 인해 하향 기울기가 있는 무작위 기하학적 보행입니다.

거래 빈도에 따라 연간 마이너스 SR<-0.5만 가능

1. 실시간 거래, MT4 테스터, 신경망이 있습니다.

2. 정답은 100% 틀립니다. 조언자는 무작위가 아닙니다.

3. 8일간의 트레이딩 데이터로 훈련했지만, 1년 동안의 예측은...?:)

추신: 구체적으로 질문했습니다. 예를 들어 교육 기간에 대한 거래 기간의 비율은 최대 30%이고 고문은 모레 또는 오늘 10%를 소모하기 시작하지만 과학은 침묵하기 때문에 ...

Igor Makanu 2018.10.19 14:51 #11198
독성 :

흠, 이건 제 사진인데 저기 뭐가 보이나요?

;)

Yuriy Asaulenko 2018.10.19 15:09 #11199

나는 또한 그것이 결코 될 수 없기 때문에 이것이 불가능하다고 말하고 싶습니다. (c) 그리고 50번의 트레이드를 훈련하는 것은 비현실적이지만 결론을 내리기 위해서는 또 다른 30-40번의 트레이드(이것은 3-4일)를 봐야 합니다. 물론 우리가 그들을 본다면.

그러나 일반적으로 이것은 이미 이상합니다.

Ivan Negreshniy 2018.10.19 15:14 #11200

다음은 테스터에서 실행된 것입니다. 이것은 무작위입니까?

파일:
StrategyTester.zip  23 kb
이 경우도 있지만 데이터셋으로는 ... 죄송합니다만, 많은 분들이 최소한 수천개의 샘플이 필요하다고 말씀하셨고 , 시장 데이터의 시끄러움을 감안할 때 수십만 개의 포인트가 바람직 하지만 마스터하면 예를 들어 Java를 사용하고 XGB를 사용하면 과거의 인내로 여전히 웃을 것입니다))
이것은 거짓 진술이다
그래서 저는 매튜스 계수에 대한 개선된 메트릭을 생각해 냈습니다. 하지만 여기에서 날려버리고 여기서 떠나면 무슨 말을 할 수 있을까요? :-(
한 클래스에서 다른 클래스로 배열을 전송하고 피펫을 실행했습니다... 물어볼 사람이 없습니다 :-(
메트릭이 차량에 대한 자체인 경우 왜 메트릭을 귀찮게 합니까? 예를 들어 샘플의 이익 계수를 측정하면 됩니다.
가장 작은 오류가 새 데이터에 대한 가장 큰 안정성을 의미하지 않기 때문에 모델의 내부 추정치는 이차적입니다.
새로운 데이터에 대한 거래 실적을 통해 외부 평가 기준을 선택하기만 하면 됩니다.
그러나 테스트를 위한 큰 샘플이 있을 때까지 볼트를 핥을 것입니다. 그리고 기차에 대한 작은 샘플은 중요하지 않습니다. 여기에서는 모든 것이 괜찮습니다.
주장할 수 있지만 충실도/비충실도는 시장에서 전혀 중요하지 않으며 작동하는 것이 더 중요하며 일반적으로 샘플이 많을수록 결과가 좋습니다)))
동일한 포리스트 또는 xgb를 사용하면 재교육할 샘플 수에 신경 쓰지 않습니다. 모델의 무게는 기가바이트입니다.그러나 외부 메트릭이 있는 기능의 재귀적 열거는 외부 샘플이 아닌 작은 하위 샘플에서도 열매를 맺기 시작했습니다.
Tren = 100k 라인. 나머지 8k+(테스트)에서 모델을 적용합니다. 데이터가 뒤죽박죽입니다.
로그 손실 메트릭. 컷을 게시합니다. 트렌 =... 테스트 =...
물론 시계열에서는 이것이 수행되지 않습니다. 그러나 재미를 위해 데이터를 전혀 건드리지 않고 거의 기본 LightGBM에 넣었습니다.
기차: 0.6879388421499111
테스트: 0.6915181677127092
CatBoost를 보너스로 사용하여 소스 테스트:
https://yadi.sk/d/55DDn-hViNWP6Q
그리고 당신의 결과는 무엇입니까?
테스트의 경우 일반적으로 무제한 공간이 있어야 합니다.
누군가가 데이터의 품질을 확인하려는 경우 일종의 진흙탕 CSV 파일 형식이 아니라 지표 형식으로 제공되어야 합니다.
템플릿을 사용하면 가능하지만 대상에 마크업이 없을 수도 있고 이익이 있어야 할 것이 너무 분명합니다.
그러면 모든 모델을 교육하고 Expert Advisor를 만들고 원래 지표와 함께 객관적으로 테스트할 수 있습니다.
뭐, 하고 싶은 게 있으면 하는 말인데 그냥 말만 하면...
노이즈가 많을수록 샘플이 많을수록 기본 통계 수준에서 명확해야하며 시장 데이터는 매우 시끄럽습니다. 재교육은 또 다른 문제입니다. 올바르게 구축 된 기능과 올바른 대상을 가르치는 경우 수십에서 수백의 테스트에서 수천 개의 샘플에서 재교육은 실제로 달성하기 어렵습니다. 그렇기 때문에 데이터 과학자나 알고리즘 트레이더가 마조히스트나 근거리 시장이 아니며 기능이 있는 혼합 대상이 없는 경우에는 재훈련하기 어렵기 때문에 대규모 데이터 세트가 좋은 이유입니다. 우려의 명백한 원인은 기능이 대상과 3-5% 이상 상관 관계가 있다는 것입니다. 즉, 엿보는 것 같지만 원칙적으로 그런 가능성이 없도록 기능을 구축하는 것이 좋습니다. 이렇게 하면 알고리즘이 약간 복잡해집니다. , 그러나 아마도 초보 알고리즘 거래자의 주요 실수를 제거할 것입니다.
여기 계신 분들은 다 야시장 가까운 사람들을 꾸짖으시고 저도 그렇긴 한데, 님 자신은 쿨하고 시장알고리즘 트레이더인 것 같고, 글만 봐도 어느 시기에 무엇을 가르쳐야 하는지, 무엇을 매매해야 하는지 잘 아실 것입니다.
하지만 저는 잘 모르겠습니다. 어제 토론을 보았을 때 참여하지 않고 그냥 시도하기로 결정했습니다. 저는 10월 8일부터 10월 18일까지 EURUSD M1에 대한 데모를 교육했으며, 브로커가 얼마를 가지고 시작했는지 실시간으로 상담합니다.
그리고 이제 그는 여전히 이익으로 거래하고 있으며 전문가로서 질문은 그가 병합을 시작할 때입니다. 로그인 - 2096584180, 비밀번호 - na3tbvr, Tradize-Demo, 그러나 특히 열린 공간을 갈아엎는 우주선에 관한 것은 아닙니다. 볼쇼이 극장 (c))
훈련 샘플이 부족하고 테스터와 옵티마이저의 논리가 투명하지 않습니다(블랙박스)...
결론은 99.999999999% 이 Expert Advisor가 무작위이고 주식은 거래 비용으로 인해 하향 기울기가 있는 무작위 기하학적 보행입니다.
거래 빈도에 따라 연간 마이너스 SR<-0.5만 가능
1. 실시간 거래, MT4 테스터, 신경망이 있습니다.
2. 정답은 100% 틀립니다. 조언자는 무작위가 아닙니다.
3. 8일간의 트레이딩 데이터로 훈련했지만, 1년 동안의 예측은...?:)
추신: 구체적으로 질문했습니다. 예를 들어 교육 기간에 대한 거래 기간의 비율은 최대 30%이고 고문은 모레 또는 오늘 10%를 소모하기 시작하지만 과학은 침묵하기 때문에 ...
흠, 이건 제 사진인데 저기 뭐가 보이나요?
;)
나는 또한 그것이 결코 될 수 없기 때문에 이것이 불가능하다고 말하고 싶습니다. (c) 그리고 50번의 트레이드를 훈련하는 것은 비현실적이지만 결론을 내리기 위해서는 또 다른 30-40번의 트레이드(이것은 3-4일)를 봐야 합니다. 물론 우리가 그들을 본다면.
그러나 일반적으로 이것은 이미 이상합니다.
다음은 테스터에서 실행된 것입니다. 이것은 무작위입니까?