트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 402

 
알료샤 :

XGB - https://en.wikipedia.org/wiki/Xgboost - 기계 학습 열핵 무기.

hft의 경우 3개월은 전체 시뮬레이션 주기에 충분하지 않습니다. 모델은 다른 시장, 모드 변경, 플래시 지붕 및 다른 백조에서 테스트해야 하기 때문에 합성 응력 테스트는 실제 시장에서 이를 수행할 수 없습니다. 최종 모델은 대부분 1주일 이상의 데이터를 사용하지 않지만 구성하려면 모든 곳에서 문제가 발생하지 않도록 연간 1-3개의 샘플에서 실행해야 합니다. 3개월 분량의 데이터로 학습할 수 있고 데이터 과학자가 자신의 내용을 알면 일반 버기 모어를 얻을 수 있지만 어느 날, 아마도 3개월 후, 어쩌면 반년 후에 모든 것이 갑자기 고장날 수 있습니다. " 더 정확하게는 모델이 시장의 메타 상태와 충돌하지 않고 아마추어 성능을 포함했기 때문에 더 정확하게 알려진 이유입니다.


아 글쎄, 체계적으로 재훈련을 해야 한다 5년 안에 훈련을 하는 게 무슨 소용이 있겠어, 신경도 자원도 부족하지

아 그래디언트 부스팅 .. 듣긴 들었는데 안 했네요. 숲으로 들어갈수록 어려운 용어

 
막심 드미트리예프스키 :


5년 안에 hft를 가르친다는 게 무슨 의미가 있겠어

아마도 LTCM 을 가진 사람들도 이런 식으로 주장했을 것입니다.) 그들은 그들의 모델을 두 번 더 뒤돌아보았다면 그렇게 매혹적으로 병합되지 않았을 것이라고 말합니다.

어쨌든 훈련은 5년 동안 전체 샘플에 대해 한 번에 진행되지 않으며, 지속적으로 학습하면서 슬라이딩 윈도우가 있는 샘플을 당연히 취하지만 무언가가 변경될 때 모델이 얼마나 빨리 "이해"할지 아는 것이 중요합니다. 시장에서 극적으로 그리고 이것은 아웃라이어가 아니며, 누군가의 어리석음도 아니며, 갑자기 떠오르는 추세인 Kolya의 요청에 대담하게 보충하지 않을 것입니다.

 
알료샤 :

아마도 LTCM 을 가진 사람들도 이런 식으로 주장했을 것입니다.) 그들은 그들의 모델을 두 번 더 뒤돌아보았다면 그렇게 매혹적으로 병합되지 않았을 것이라고 말합니다.

어쨌든 훈련은 5년 동안 전체 샘플에 대해 한 번에 진행되지 않으며, 지속적으로 학습하면서 슬라이딩 윈도우가 있는 샘플을 당연히 취하지만 무언가가 변경될 때 모델이 얼마나 빨리 "이해"할지 아는 것이 중요합니다. 시장에서 극적으로 그리고 이것은 아웃라이어가 아니며, 누군가의 어리석음도 아니며, 갑자기 떠오르는 추세인 Kolya의 요청에 대담하게 보충하지 않을 것입니다.


Mdya ...... 당신은 그 일을 비방 할 수 있지만 당신 자신은 완전히 다른 것에 대해 이야기하고 있습니다. 원칙적으로 모델은 균형곡선의 지지선을 돌파할 때 부적합한 것으로 인식되었다가, 앞서 보여드린 것처럼 회복됩니다... 모델의 작품을 믿느냐 믿지 않느냐는 철학적인 문제입니다. 3개월 분량의 데이터가 너무 적다고 말하는 사람은 없습니다. 하지만 질문이 있습니다. 내가 어떻게 수집하고 무엇에 속하는지 어떻게 압니까 ???? 글쎄, 그것은 흥미 롭습니다. 3개월 이내에 시장 개발을 위한 모든 가능한 옵션이 모델에 제시된다면 모델이 의미를 잃을 것이라는 생각을 갑자기 왜 드셨나요????

시장을 예측하기 전에 시장이 무엇인지 이해해야 합니다. 네, 글로벌 시대의 시장은 변화하지만 가격의 원인이 되는 데이터를 사용합니다. 즉, 가격을 변경하는 것은 이러한 데이터이며 그 반대의 경우는 아닙니다. 또한 언로드 후 쓰레기에서 데이터를 청소하는 고유 한 처리를 적용하므로 그러한 모델을 얻습니다. 무역 자체가 나에게 그렇게 뜨겁지는 않지만. 로봇이 시급합니다. 그리고 바로 청중을 위한 질문... 실제 거래에서 따옴표 , 위안 및 기타 쓰레기를 고려한 거래 로봇의 골격을 가진 사람이 있습니까????

 
마이클 마르쿠카이테스 :


3개월 분량의 데이터가 너무 적다고 말하는 사람은 없습니다. 하지만 질문이 있습니다. 내가 어떻게 수집하고 무엇에 속하는지 어떻게 압니까 ???? 글쎄, 그것은 흥미 롭습니다. 3개월 이내에 시장 개발을 위한 모든 가능한 옵션이 모델에 제시된다면 모델이 의미를 잃을 것이라는 생각을 갑자기 왜 드셨나요????

3개월 동안 데이터에 대해 교육했다면 모델이 훨씬 더 오래 작동할 것이라고 기대할 수 없습니다. 모델이 본 시장은 이 모델이 거래할 수 있습니다. 특히, 데이터 세트는 일반적으로 완전히 말도 안되는 것이며, 이에 대한 거래는 커피 찌꺼기에서 추측할 수 있는 것입니다. 데이터가 전혀 선형이 아닐 때 선형 모델에 대한 계수를 생성하는 "Reshetov 기계"에도 동일하게 적용됩니다. "AI")))))))))) <500 포인트의 데이터 세트에서 선형 모델이 몇 주 동안 연구되었다는 이 말도 안되는 소리를 믿으려면 전혀 멀리 있지 않아도 됩니다. 몰라....이건 마틴게일보다 더 쿨하고 "디포 오버클럭"

 
알료샤 :

3개월 동안 데이터에 대해 교육했다면 모델이 훨씬 더 오래 작동할 것이라고 기대할 수 없습니다. 모델이 본 시장은 이 모델이 거래할 수 있습니다. 특히, 데이터 세트는 일반적으로 완전히 말도 안되는 것이며, 이에 대한 거래는 커피 찌꺼기에서 추측할 수 있는 것입니다. 데이터가 전혀 선형이 아닐 때 선형 모델에 대한 계수를 생성하는 "Reshetov 기계"에도 동일하게 적용됩니다. <500포인트의 데이터 세트에서 선형 모델이 "AI"이기 때문에 몇 주 동안 연구되었다는 이 말도 안되는 소리를 믿으려면 전혀 멀리 떨어져 있지 않아도 됩니다. 왜냐하면 이것이 "AI"))))))))) ..... 몰라....이건 마틴게일보다 더 쿨하고 "디포 오버클럭"


몇 주를 생각하세요???? Alyosha, 글쎄, 당신은 종류 ALYOSHA Ha ha ha .... 글쎄, 어떤 사람들이 갔다. 좋아, Alexeyushka, 당신은 우리 것입니다. 먼저 여기 기사를 읽으면 내가 3개월 만에 500점을 모았다는 것을 이해하게 될 것입니다. 왜냐하면 분류기를 모든 막대로 밀어넣지 않기 때문입니다. 3개월 동안 500포인트에 대한 시장과 당신의 모델이 그를 위해 제대로 훈련되지 않았다는 사실은 당신의 AI 시스템이 "FUCKING"이기 때문입니다. ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ 개발을 위해 마지막 비밀 하나를 알려 드리겠습니다. 그래야 "빵을 부수는" 사람이 누구인지 이해할 수 있습니다.

내 데이터 세트가 50%보다 나쁘다고 생각하는 모든 사람들에게 바칩니다!!!!!!! AI 시스템이 올바르게 구축되지 않았거나 버그가 있거나 !!!!!! 그리고 나서 드럼롤 .... 2~3주 안에 제대로 학습할 수 있는 그리드를 사용하면(완전히 재훈련이 없다는 것을 원칙으로 합시다) 공부한 자료의 양에 따라 시스템이 제한됩니다. 1~2주 동안 외출. 그런 시스템이 있고 아무 문제가 없습니다 IT WORKS!!!! 그러나 빅 데이터 네트워크를 연결하면 엄청난 오버트레이닝 또는 언더트레이닝이 시작되어 궁극적으로 큰 훈련 오류로 이어지며 데이터세트가 엉터리라고 생각하기 시작합니다. 이는 AI 시스템에 매우 합리적입니다. 하지만 AI 시스템이 정말 멋지면 이 데이터 세트에서도 모델을 구축할 수 있습니다. 그것은 모델이 많은 수의 입력으로 구성될 것이라는 점입니다. 저는 10-12와 다항식이 충분히 길 것이라고 생각합니다. 그런 모델은 50% 이상의 이익을 가질 것입니다. 오히려 RESHETOV 옵티마이저라도 한계가 있긴 한데 성공하지 못한 사람들보다 훨씬 많죠..... 뭐 이런게.....

 

그리고 가장 흥미로운 점은 이 옵티마이저 작업의 주요 결과가 일반화 비율이고 100% 일반화 수준으로 모델을 구축했다는 것입니다. 그러나 샘플이 증가함에 따라 백분율이 떨어지기 시작하고 50% 미만으로 떨어지는 순간이 오고 모델이 배수되기 시작합니다. 그러나 여기에 50의 표시에 대한 대략적인 근사치가 있을 것입니다. 어떤 식으로든 데이터에 물고기가 있으면 그는 그것을 찾을 것이고, 그렇지 않으면 selyavi를 찾을 것입니다.

또한 선택한 변수에 대한 데이터가 얼마나 좋은지에 대한 질문에 매우 잘 대답합니다. 데이터가 완전한 똥이면 바로 볼 수 있습니다 ....

겁이 나서 게시한 데이터 세트를 깨고 샘플 중 하나가 138 줄로 밝혀졌습니다. 시작했습니다. 기다리고 있습니다 .... 결과를 게시하는 것이 흥미로울 것입니다 ....

 
마이클 마르쿠카이테스 :


몇 주를 생각하세요???? Alyosha, 글쎄, 당신은 종류 ALYOSHA Ha ha ha .... 글쎄, 어떤 사람들이 갔다. 좋아, Alexeyushka, 당신은 우리 것입니다. 먼저 여기 기사를 읽으면 내가 3개월 만에 500점을 모았다는 것을 이해하게 될 것입니다. 왜냐하면 분류기를 모든 막대로 밀어넣지 않기 때문입니다. 3개월 동안 500포인트에 대한 시장과 당신의 모델이 그를 위해 제대로 훈련되지 않았다는 사실은 당신의 AI 시스템이 "FUCKING"이기 때문입니다. 대괄호로 묶어서 어떻게든 올려봤어요 :-) 오 알료샤, 알료샤...... 그러다 주말을 보니 트롤이 일어났는데..... 알았어, 개인적으로 상관없어, 난' 당신이 "덩어리를 부수는"누구를 이해할 수 있도록 개발을 위해 마지막 비밀을 알려줄 것입니다.

내 데이터 세트가 50%보다 나쁘다고 생각하는 모든 사람들에게 바칩니다!!!!!!! AI 시스템이 올바르게 구축되지 않았거나 버그가 있거나 !!!!!! 그리고 나서 드럼롤 .... 2~3주 안에 제대로 학습할 수 있는 그리드를 사용하면(완전히 재훈련이 없다는 것을 원칙으로 합시다) 공부한 자료의 양에 따라 시스템이 제한됩니다. 1~2주 동안 외출. 그런 시스템이 있고 아무 문제가 없습니다 IT WORKS!!!! 그러나 빅 데이터 네트워크를 연결하면 엄청난 오버트레이닝 또는 언더트레이닝이 시작되어 궁극적으로 큰 훈련 오류로 이어지며 데이터세트가 엉터리라고 생각하기 시작합니다. 이는 AI 시스템에 매우 합리적입니다. 하지만 AI 시스템이 정말 멋지면 이 데이터 세트에서도 모델을 구축할 수 있습니다. 그것은 모델이 많은 수의 입력으로 구성될 것이라는 점입니다. 저는 10-12와 다항식이 충분히 길 것이라고 생각합니다. 그런 모델은 50% 이상의 이익을 가질 것입니다. 오히려 RESHETOV 옵티마이저라도 한계가 있긴 한데 성공하지 못한 사람들보다 훨씬 많죠..... 뭐 이런게.....


그리고 가장 흥미로운 점은 이 옵티마이저 작업의 주요 결과가 일반화 비율이고 100% 일반화 수준으로 모델을 구축했다는 것입니다. 그러나 샘플이 증가함에 따라 백분율이 떨어지기 시작하고 50% 미만으로 떨어지는 순간이 오고 모델이 배수되기 시작합니다. 그러나 여기에 50의 표시에 대한 대략적인 근사치가 있을 것입니다. 어떤 식으로든 데이터에 물고기가 있으면 그는 그것을 찾을 것이고, 그렇지 않으면 selyavi를 찾을 것입니다.

또한 선택한 변수에 대한 데이터가 얼마나 좋은지에 대한 질문에 매우 잘 대답합니다. 데이터가 완전한 똥이면 바로 볼 수 있습니다 ....

겁이 나서 게시한 데이터 세트를 깨고 샘플 중 하나가 138 줄로 밝혀졌습니다. 시작했습니다. 기다리고 있습니다 .... 결과를 게시하는 것이 흥미로울 것입니다 ....

나는 당신과 논쟁하지 않을 것입니다. 논쟁의 여지가 없습니다. 당신은 완전한 이단입니다. "100% 일반화")))))) 제 생각에는 선형과 비선형의 차이점도 이해하지 못합니다 모델. 그리고 "Reshetov 기계"는 선형이며 심지어 c XOR 은 할 수 없습니다. 일종의 유사 유전학에 의한 분리 초평면 계수의 어리석은 최적화입니다. 빌어먹을 베이비 토크...

그게 다야, 나는 아이들을 화나게하지 않는다. 나는 나쁘고 사악한 삼촌이다. 나는 산타 클로스가 존재하지 않는다고 말했다))))

 
알료샤 :

나는 당신과 논쟁하지 않을 것입니다. 논쟁의 여지가 없습니다. 당신은 완전한 이단입니다. "100% 일반화")))))) 제 생각에는 선형과 비선형의 차이점도 이해하지 못합니다 모델. 그리고 "Reshetov 기계"는 선형이며 심지어 c XOR 은 할 수 없습니다. 일종의 유사 유전학에 의한 초평면 계수의 어리석은 최적화입니다. 빌어먹을 베이비 토크...

그게 다야, 나는 아이들을 화나게하지 않는다. 나는 나쁘고 사악한 삼촌이다. 나는 산타 클로스가 존재하지 않는다고 말했다))))


네!!!!! 그래서 저는 그냥 산타클로스입니다!!! 그리고 매년 나는이 멋진 휴가에 아이들을 축하합니다. 당신은 여기서도 패배했습니다 :-)
 
알료샤 :

나는 당신과 논쟁하지 않을 것입니다, 논쟁의 여지가 없습니다, 당신은 완전한 이단입니다, "100% 일반화")))))) 제 생각에는 선형과 비선형의 차이점도 이해하지 못합니다 모델. 그리고 "Reshetov 기계"는 선형이며 심지어 c XOR 은 할 수 없습니다. 일종의 유사 유전학에 의한 분리 초평면 계수의 어리석은 최적화입니다. 빌어먹을 베이비 토크...

그게 다야, 나는 아이들을 화나게하지 않는다. 나는 나쁘고 사악한 삼촌이다. 나는 산타 클로스가 존재하지 않는다고 말했다))))


이제 100% 수준의 일반화로 모델을 버릴 것 같아요....
 
마이클 마르쿠카이테스 :

이제 100% 수준의 일반화로 모델을 버릴 것 같아요....
성배 를 발사할 필요가 없습니다. 급하게 거래하세요. 거래하세요! 모두 감사할 것입니다 :)
사유: