트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩

Maxim Dmitrievsky 2023.08.01 12:28 #31631

Forester #:

어떻게 검색하나요? 모든 청크(예: 100개씩 5000페이지)를 살펴보고 해당 모델의 다른 50만 개의 행이 얼마나 성공적으로 예측하는지 확인하시겠습니까?

예, 연속된 청크 대신 무작위로 샘플을 가져올 수 있습니다.

Dmytryi Nazarchuk 2023.08.01 12:39 #31632

mytarmailS #:

너무 웃어서 눈물이 날 지경이었어요)

나는 바드에게 러시아어로 글을 써달라고 부탁했는데 그는 실수로 썼습니다. 러시아어는 제 모국어가 아니며 본질적으로 여기서만 사용합니다...

그리고 그는 저에게 대답했습니다.)

이해하셨나요?

그는 나를 괴롭히기 시작했습니다)))

정말 잔인하네요))))

그는 당신을 트롤링하지 않습니다.

러시아어는 세르비아어로 "러시아어"입니다.

그래서 세르비아어로 편지를 쓰는 거예요.

mytarmailS 2023.08.01 12:43 #31633

Dmytryi Nazarchuk #:

그는 당신을 트롤링하는 것이 아닙니다.

러스키라고 쓰셨죠? 세르비아어로 '러시아어'를 뜻합니다.

그래서 그가 세르비아어로 편지를 쓰는 겁니다.

Ahh))))

mytarmailS 2023.08.01 12:49 #31634

mytarmailS #:

나무와 나무의 강화 학습에 관한 흥미로운 기사입니다.

https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4760114/

시장 데이터에서 알고리즘을 테스트했습니다...

알고리즘은 Forest에 비해 새로운 데이터에서 안정적으로 실행됩니다....

알고리즘은 재훈련되지 않았으며 모든 검증 샘플에서 결과가 테스트 샘플보다 낫거나 훨씬 좋으며 더 나빠진 것을 보지 못했습니다....

아쿠라시는 포레스트보다 평균 2-4% 더 낫습니다. 포레스트가 0.58이면 RLT는 ~ 0.62입니다.

어쨌든 첫 번째 테스트에 따르면 알고리즘은 가치가 있지만 배우는 데 시간이 오래 걸립니다....

СанСаныч Фоменко 2023.08.01 12:54 #31635

Forester #:
홈메이드. 실험의 가능성은 무한합니다....

네. 홈메이드에 대해 논의할 필요가 없습니다.

왜 직접 만든 것에 시간을 낭비하나요? 수백만 명의 사용자가 실제로 사용하는 알고리즘을 가진 수십 가지의 비수제 알고리즘이 있습니다.....

Aleksey Nikolayev 2023.08.01 14:41 #31636

mytarmailS #:

시장 데이터로 알고리즘을 테스트했습니다.

알고리즘은 새로운 데이터에 대해 Forest....

알고리즘은 재학습하지 않으며 모든 검증 샘플에서 결과가 테스트 샘플보다 낫거나 훨씬 좋으며 더 나빠진 것을 보지 못했습니다....

아쿠라시는 포레스트보다 평균 2~4% 더 우수하므로 포레스트가 0.58이면 RLT는 약 0.62입니다.

어쨌든 첫 번째 테스트에 따르면 알고리즘은 가치가 있지만 배우는 데 시간이 오래 걸립니다....

그들의 이론에 따르면, 잘 작동하는 "강한"특성이 몇 가지 있어야하며 문제는 나머지 "약한"특성과 분리하는 것입니다. 그들의 분야인 유전학에서는 아마도 그럴 것입니다. 하지만 우리의 상황은 분명히 다릅니다. 특성은 강도가 거의 같고, 종종 선형적이며, 시간이 지남에 따라 그 강도가 변할 수 있습니다.

일반적으로 유익한 특성을 선택하는 것이 문제였다면 산 산치는 그의 비법을 통해 오래 전에 1조 달러의 부자가 되었을 것입니다).

mytarmailS 2023.08.01 14:47 #31637

Aleksey Nikolayev #:

그들의 이론은 잘 작동하는 '강한' 특성이 몇 가지 있으며, 유일한 문제는 나머지 '약한' 특성과 분리하는 것이라고 가정합니다. 그들의 분야인 유전학에서는 아마도 이것이 사실일 것입니다. 그러나 우리의 상황은 분명히 다릅니다. 특성은 강도가 거의 같고, 종종 선형적이며, 시간이 지남에 따라 강도가 바뀔 수 있습니다.

일반적으로 유익한 특성을 선택하는 것이 문제였다면 산 산치는 그의 비법을 통해 오래 전에 억만장자가 되었을 것입니다).

글쎄요, 알고리즘은 실제로 작동하고 더 안정적이고 아쿠라시가 더 좋고 카파가 더 좋습니다... 즉, 더 잘 작동합니다 ...

그리고 1000 개의 새로운 관찰 후와 20,000 개의 관찰 후 모두 작동하며 오류는 동일하거나 더 좋습니다.

알렉세이 니콜라이 예프 #:

표지판의 강도는 거의 동일합니다.

글쎄요, 여기서는 동의 할 수 없습니다.

이 알고리즘의 중요성

Forester 2023.08.01 17:55 #31638

СанСаныч Фоменко #:

그래... 직접 만든 것에 대해 논의할 필요가 없습니다.

왜 홈메이드에 시간을 낭비하나요? 수백만 명의 사용자가 실제로 사용하는 알고리즘을 갖춘 수십 가지의 비수제 알고리즘이 있습니다.....

이러한 알고리즘에 포함되지 않은 것들, 즉 블랙박스를 실험하고 수행할 수 있기 때문입니다.
저는 패키지에 대해 논의하지 않고 아이디어에 대해서만 논의할 것을 제안합니다.

mytarmailS 2023.08.02 07:27 #31639

Forester #:
이러한 알고리즘에 포함되지 않은 것들, 즉 블랙박스를 실험하고 실행할 수 있기 때문입니다.
패키지에 대해서는 논의하지 않고 아이디어에 대해서만 논의할 것을 제안합니다.

여기서 논의한 아이디어를 구현해 본 사람이 몇 명이나 될까요?

그리고 기성 라이브러리보다 더 나은 결과를 얻은 사람은 몇 명이나 될까요?

그 수치는 거의 0에 가깝지 않나요?

그리고 라이브러리는 재현 가능한 코드이며 누구나 실행할 수 있고 누구나 예-아니오 답변 + 경험과 지식이 추가 된 형태로 결과, 재현 가능한 결과, 실제 결과를 얻을 수 있습니다.

그리고 토론은 시간 낭비 일 뿐이고, 우리는 토론하고 토론하고 잊어 버렸고, 벤치에있는 할머니처럼 아무도 코드 한 줄도 쓰지 않았고, 시간은 사라지고 삶은 사라지고 ... 그리고 지식도 경험도 추가되지 않았습니다.

Maxim Dmitrievsky 2023.08.02 08:44 #31640

지식이 줄어드는 것처럼 느껴진다면 일괄적인 사고 탓으로 돌리세요.

트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 3164