트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 190

 
안드레이 딕 :

즉, 그렇게 하는 것이 유용합니다. 따라서 4개의 파티션 대신 40개의 파티션을 수행해야 합니다. 4코어의 경우 계산하는 데 10배 더 오래 걸리지만 견고함을 위해 시간을 희생할 수 있다고 생각합니다.

애매한.

예를 들어, 일일 거래를 위해 1시간이 아닌 계산을 위해 10시간을 기다리는 것은 용납되지 않습니다. 우리가 밤새 컴퓨터를 떠나더라도 분명히 오래된 데이터를 기반으로 한 모델을 얻게 될 것입니다.

따라서 계산 시간과 시뮬레이션 품질 사이에 합리적인 절충안이 필요합니다. 그리고 가장 최적의 옵션은 병렬로 계산할 수 있는 것은 모두 병렬화해야 하고, 순차적으로 계산할 수 없는 것은 모두 병렬화해야 한다는 것입니다.

극단적인 경우 컴퓨터를 더 많은 코어로 업그레이드하거나 여러 개인용 컴퓨터에서 컴퓨팅 클러스터 를 조립할 수 있습니다.

기계 학습 알고리즘의 코드가 종종 추가 최적화 가능성이 있다는 사실에 대해 말하는 것이 아닙니다.

멀티태스킹 중 일부를 CPU에서 GPU로 전송할 수도 있습니다.

저것들. 문제를 해결하기 위한 많은 잠재적인 옵션이 있으며(목록은 계속될 수 있음) 소프트웨어에서 " 꼽추 조각"은 그 중 최고가 아니며 경험에서 알 수 있듯이 종종 가장 부적절합니다.

Распределенные вычисления в сети MQL5 Cloud Network
Распределенные вычисления в сети MQL5 Cloud Network
  • cloud.mql5.com
Заработать деньги, продавая мощности своего компьютера для сети распределенных вычислений MQL5 Cloud Network
 
유리 레셰토프 :

애매한.

예를 들어, 일일 거래를 위해 1시간이 아닌 계산을 위해 10시간을 기다리는 것은 용납되지 않습니다. 우리가 밤새 컴퓨터를 떠나더라도 분명히 오래된 데이터를 기반으로 한 모델을 얻게 될 것입니다.

따라서 계산 시간과 시뮬레이션 품질 사이에 합리적인 절충안이 필요합니다. 그리고 가장 최적의 옵션은 병렬로 계산할 수 있는 것은 모두 병렬화해야 하고, 순차적으로 계산할 수 없는 것은 모두 병렬화해야 한다는 것입니다.

극단적인 경우 컴퓨터를 더 많은 코어로 업그레이드하거나 여러 개인용 컴퓨터에서 컴퓨팅 클러스터 를 조립할 수 있습니다.

기계 학습 알고리즘의 코드가 종종 추가 최적화 가능성이 있다는 사실에 대해 말하는 것이 아닙니다.

멀티태스킹 중 일부를 CPU에서 GPU로 전송할 수도 있습니다.

저것들. 문제를 해결하기 위한 많은 잠재적인 옵션이 있으며(목록은 계속될 수 있음) 소프트웨어에서 " 꼽추 조각"은 그 중 최고가 아니며 경험에서 알 수 있듯이 종종 가장 부적절합니다.

나는 "험한 버전"을 주장하지 않고 그냥 묻습니다. 데이터가 더 많이 분할될수록 결과를 분석하여 더 나은 훈련을 얻을 수 있습니다. 90%의 경우에서 모델이 테스트 데이터에 대해 적절한 결과를 보여주고 10%에서만 과적합이 발생한다고 가정해 봅시다. 이는 모델 자체가 가치가 있음을 의미합니다. 그리고 그 반대의 경우 - 처리를 위해. 그리고 데이터를 4가지 다른 옵션으로만 나누면 과적합된 모델을 얻을 확률이 매우 높습니다.

다시 말하지만, "하드웨어" 측면은 다루지 않고 "소프트웨어" 측면만 지정합니다.

 
마법사_ :
...
잘 알려진 것보다 이점이 없지만 ..... 아무도 믿지 않을 것입니다))))

"장점이 있는" 잘 알려진 ...의 구체적인 예를 들어 보십시오.

그런 다음 항상 샘플을 제공하지 않고 소프트웨어를 표시하지 않는다는 사실로 끝나는 근거 없는 비판을 제외하고는 아무 것도 없습니다(모든 것이 엄격하게 분류되고 증인이 제거됨). 반면에 당신 외에는 누구도 확인하거나 반박할 수 없는 비현실적인 인물을 그립니다.

채워야 할 진부한 질문: 인용문에 따르면 92%의 일반화 능력으로 92%를 "받을 수 있는 기회가 있다면", "이점을 갖지 않는 사람에 대해 왜 여전히 공허한 비판에 참여하고 있습니까?" 잘 알려진 ..."이며 구매에 종사하지 않습니다. 공장, 신문, 선박, 섬, 요트 등? 그리고 언제 Forbes의 표지에 당신의 얼굴을 존경 할 수 있습니까?

 
알렉세이 버나코프 :


선형 모델의 상호 작용 해석에는 명확한 규칙이 있습니다. 선형 조합 해석보다 조금 더 복잡합니다. https://www.r-bloggers.com/interpreting-interaction-coefficient-in-r-part1-lm/

그러나 의미 있는 상호 작용을 찾으려면 많은 조합을 살펴봐야 합니다. 여기 매복이 있습니다.

감사합니다.

"상호작용"이라는 단어에 대한 새로운 이해에도 불구하고 나의 당혹스러움은 읽기에서 더 심해졌습니다.

내가 당혹스러워하는 것은 통계의 모든 수치가 어느 정도 내용을 담고 있어야 한다는 사실에 근거합니다.

우리는 다음 방정식 lm을 취합니다

zz ~ rsi*stoch

개별적으로 각 지표는 의미가 있지만 제품의 의미는 무엇입니까? 이 "상호작용"의 의미는 무엇입니까? 아니면 알 수 없는 콘텐츠의 새로운 예측 변수를 얻고 그것이 대상 변수에 어떤 영향을 미치는지 확인합니까?

 
산산이치 포멘코 :

감사합니다.

"상호작용"이라는 단어에 대한 새로운 이해에도 불구하고 나의 당혹스러움은 읽기에서 더 심해졌습니다.

내가 당혹스러워하는 것은 통계의 모든 수치가 어느 정도 내용을 담고 있어야 한다는 사실에 근거합니다.

우리는 다음 방정식을 취합니다 lm

zz ~ rsi*stoch

개별적으로 각 지표는 의미가 있지만 제품의 의미는 무엇입니까? 이 "상호작용"의 의미는 무엇입니까? 아니면 알 수 없는 콘텐츠의 새로운 예측 변수를 얻고 그것이 대상 변수에 어떤 영향을 미치는지 확인합니까?

가끔 들어도 웃기다)

상호 작용이 고전 회귀에서 곱셈으로 정확히 간주되기는 하지만 곱셈에서 물리적으로 새로운 엔터티를 얻을 수는 없습니다.

첫 번째 예측 변수의 기울기 각도는 두 번째 예측 변수의 수준에 따라 달라집니다. 이것이 상호작용의 본질이다. 이것은 단순화되었습니다. 뉘앙스가 있습니다. 그러나 그러한 방정식의 모든 계수를 알면 예를 들어 x1 수준이 1 증가하면 x2 = 3 수준에서 목표 수준이 0.1 증가한다고 말할 수 있습니다. 이와 비슷한 것입니다.

 
안드레이 딕 :

나는 "험한 버전"을 주장하지 않고 그냥 묻습니다. 데이터가 더 많이 분할될수록 결과를 분석하여 더 나은 훈련을 얻을 수 있습니다.

...

다시 말하지만, "하드웨어" 측면은 다루지 않고 "소프트웨어" 측면만 지정합니다.

바보라면 누구나 10번의 반복을 반복할 수 있으므로 샘플의 일부에 걸쳐 패턴이 고르지 않게 분포될 확률을 약간 줄이기 위해 계산 시간을 10배 정도 늘릴 수 있습니다. jPrediction의 소스는 공개 도메인에 있으며 매우 가려운 사람이라면 누구나 수정할 수 있습니다.

더 유망한 방식으로 목표를 달성하기 위해 내 시간과 노력을 보내는 것이 훨씬 더 흥미로웠습니다. 더 높은 일반화 능력을 가진 모델을 훈련하기 위해 컴퓨터의 계산 및 시간 리소스 측면에서 덜 까다로운 알고리즘을 만드는 것입니다.

 
유리 레셰토프 :

바보라면 누구나 10번의 반복을 반복할 수 있으므로 샘플의 일부에 걸쳐 패턴이 고르지 않게 분포될 확률을 약간 줄이기 위해 계산 시간을 10배 정도 늘릴 수 있습니다. jPrediction의 소스는 공개 도메인에 있으며 매우 가려운 사람이라면 누구나 수정할 수 있습니다.

컴퓨터의 컴퓨팅 및 시간 자원 측면에서 덜 까다로운 알고리즘을 만드는 더 유망한 방식으로 유사한 목표를 달성하기 위해 시간과 노력을 들이는 것이 저에게는 훨씬 더 흥미로웠습니다.

Yuri, 나는 당신에게 당신의 소프트웨어에서 무언가를 다시 실행하거나 끝내라고 요구하는 것이 아닙니다. 그리고 Java에서 저는 제 발이 좋지 않습니다. 따라서 오랫동안 당신의 코드를 보고 싶었지만 여전히 거기에서 아무것도 이해하지 못했습니다. .

나는 단지 이론적인 질문을 하는 것입니다. 데이터를 가능한 한 많은 옵션으로 분할할 수 있다면 좋을 것 같습니까? 예 혹은 아니오.

 
안드레이 딕 :

...

나는 단지 이론적인 질문을 하는 것입니다. 데이터를 가능한 한 많은 옵션으로 분할할 수 있다면 좋을 것 같습니까? 예 혹은 아니오.

'기술이 아니라 숫자'라는 원칙으로 사소하게 풀린 문제를 논하는 것은 말이 안 된다. 예를 들어, 한 굴착자가 하루에 n미터 거리에 있는 도랑을 파낼 수 있다면 m명의 굴착자는 같은 시간에 m * n 미터 거리 동안 같은 도랑을 파낼 수 있습니다. 그리고 토론할 것이 무엇입니까? 도랑을 파는 데 시간이 중요한 경우에는 마감일까지 남은 시간을 한 굴착기가 하루에 굴착할 수 있는 거리로 나누고 예상치 못한 상황에 대비하여 몇 명의 추가 굴착기를 준비하십시오. 문제의 해결책은 사소하고 여기에서 논의할 것이 없습니다.

예를 들어, 같은 시간에 더 적은 수의 굴착기로 같은 도랑을 파는 생산성을 높이는 방법과 같이 솔루션이 그리 간단하지 않은 문제에 대해 논의할 수 있습니다. 예를 들어 굴착기를 굴착기로 교체하거나 삽을 개선하는 등의 옵션이 이미 등장하고 있습니다. 등..

 
유리 레셰토프 :

'기술이 아니라 숫자'라는 원칙으로 사소하게 풀린 문제를 논하는 것은 말이 안 된다. 예를 들어, 한 굴착자가 하루에 n미터 거리에 있는 도랑을 파낼 수 있다면 m명의 굴착자는 같은 시간에 m * n 미터 거리 동안 같은 도랑을 파낼 수 있습니다. 그리고 토론할 것이 무엇입니까? 도랑을 파는 데 시간이 중요한 경우 마감일까지 남은 시간을 굴착기 수로 나누고 예상치 못한 상황에 대비하여 추가 굴착기를 몇 개 더 제공해야 합니다. 문제의 해결책은 사소하고 여기에서 논의할 것이 없습니다.

예를 들어, 같은 시간에 더 적은 수의 굴착기로 같은 도랑을 파는 생산성을 높이는 방법과 같이 솔루션이 그리 간단하지 않은 문제에 대해 논의할 수 있습니다. 예를 들어 굴착기를 굴착기로 교체하거나 삽을 개선하는 등의 옵션이 이미 등장하고 있습니다. 등..

대답은 화려합니다. 저는 "예"라고 생각합니다.

집에 각각 4개의 8코어 프로세서가 있는 64개의 클러스터 랙이 있다고 가정합니다. 왜 그런 용도로 사용하지 않아야 합니까? 특히 의미가있는 경우.

 

헛되이 우리는 191 페이지에서 끈을 갈았습니다. 모두들 짠 후루룩 없이 집으로 돌아갈 시간입니다.

https://www.mql5.com/ru/forum/3457/page3396#comment_2939962 참조

나는 인용한다:

블라디미르 카르푸토프 :

모든 것. 기계 학습은 더 이상 필요하지 않습니다 . 모두가 평범한 오피스 스위트에 패배했다

Интересное и Юмор
Интересное и Юмор
  • www.mql5.com
Форум трейдеров MQL5.community
사유: