트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 303

 
유리 아사울렌코 :
확실히 그렇습니다. 그러나 높은 진입 문턱은 또한 다양한 위험을 증가시킵니다. 반드시 재정적인 것은 아닙니다.

모든 것이 그렇습니다. 위의 진부한 형태로 표현할 수 있습니다. "이윤은 합리적인 위험의 단조로운 기능"입니다. 이는 무역뿐만 아니라 모든 인간 활동에 적용됩니다. 또한 다음과 같이 생각하는 사람은 그는 전혀 위험하지 않습니다. 예를 들어, 비경쟁 직업을 선택하고 국가 연금에 의존합니다. 이들은 극단적 인 사람들입니다))


그리고 어떤 종류의 삶이 "위험이 없는" 삶입니까? 모두에게 똑같이 끝날 것이라는 점을 감안할 때 이것은 전혀 흥미롭지 않습니다.

 
글쎄, 내 기사에서 신뢰 구간 등은 동일합니다. 나는 그것을 주의 깊게 읽을 것을 강력히 추천하고 당신은 서비스에 많은 것을 취할 수 있습니다.
 
유리 아사울렌코 :

체계적인 접근 방식으로 나는 결국 당신이하고있는 일에 대한 이해와 그에 따른 행동의 결과를 계획하고 예측하는 능력을 이해합니다.

기사 주셔서 감사합니다. 왜냐하면 나는 특정 소프트웨어에 익숙하지 않지만 초보자에게는 가장 간단하고 이해하기 쉽습니다. 어떤 방법이 사용되는지, 회귀 또는 분류가 이해되지 않았습니까?
당연히 그는 즉시 자신의 시스템을 시험해 보기 시작했습니다. 어떤 질문이 그것을 어렵게 만든다면, 신은 그를 축복할 것이고, 그것은 플레이 과정에서 분명해질 것입니다.

1. 나는 진입과 퇴장을 위해 양초를 사용하지 않습니다 - 시세의 흐름만, 양초는 이전 양초부터 시작하는 히스토리에만 있습니다. 훈련을 하는 것은 괜찮습니다. 양초로 배우게 하세요. 하지만 Rattle이 현재 양초 안에 있는 인용 부호의 흐름을 삼키게 하는 방법은 여전히 미스터리입니다. 동시에 양초의 흐름은 여전히 어떻게든 분석해야 합니다.

2. 조정 가능한 예측 변수로 무엇을 해야 합니까? 예를 들어 회귀선과 시그마가 있습니다. 그것들을 역사(학습용)로 대체할 수도 없습니다. 즉석에서 계산하고 역사에서 이전 구성의 흔적을 제거하는 함수가 필요합니다.

3. 유사하게 - 항상 존재하지 않고 시리즈의 특정 지점에서 구축되고 일반적으로 플레이 과정에서 다시 구축될 수 있는 깜박거리는 예측자.

4 항목 2 및 3에 따른 예측 변수의 정규화 문제 - 근본적으로 불가능합니다.

그리고 예측 변수의 이력은 훈련과 작업 과정에서 모두 계산되어야 합니다.

지금까지 완전한 혼란.


딸랑이는 두 가지 경우에 좋습니다.

  1. 첫 만남에서
  2. 추정, 시도 ... 문제를 소유할 때

1. 회귀 또는 분류. 대상 변수의 종류를 결정합니다. 실수는 회귀입니다. 명목상(인자) - 분류.

2. 대상 변수로 시작하십시오. 단순해 보이지만 질문은 상당히 복잡합니다. 무엇을 예측할 것인가? 방향? 크기, 초과, 수준...

3. 예측자. 대상 변수와 "관련"이 있음을 증명해야 합니다. 이것이 가장 어려운 부분입니다. 나는 시간의 최대 70%가 이 질문을 먹습니다. 나는 지점에서 이것에 대해 많이 썼습니다.

4. 정적에 만족하지 않습니다. R로 가는 것이 여기에서 들어옵니다. R에 대한 모든 작업을 기록하고 이 기성품 코드를 수정에 사용할 수 있기 때문에 rattle은 R로 가는 이러한 종류를 단순화합니다. 일반적으로 다음 단계는 캐럿입니다.

 
산산이치 포멘코 :


2. 대상 변수로 시작하십시오. 단순해 보이지만 질문은 상당히 복잡합니다. 무엇을 예측할 것인가? 방향? 크기, 초과, 수준...

모든 것이 예측되어야 하는 것 같습니다.) 이제 모델(MO 아님)에는 약 30개의 "지표"(예측자라고 부르는 것이 더 정확함) + 상호 처리 및 논리가 있습니다. 10개는 더 있어야 했다.

이러한 양에 수동으로 대처하고 공통 원인에 대한 각 예측 변수의 기여도를 이해하려면 더 이상 좋지 않습니다. 진짜. 따라서, 그건 그렇고, MO를 사용하는 아이디어. 모든 것이 아직 초기 단계에 있습니다.

산산이치 포멘코 :

3. 예측자. 대상 변수와 "관련"이 있음을 증명해야 합니다. 이것이 가장 어려운 부분입니다. 나는 시간의 최대 70%가 이 질문을 먹습니다. 나는 지점에서 이것에 대해 많이 썼습니다.

예, 적응해야 합니다. 그냥 못 받으신 것 같습니다.)

산산이치 포멘코 :

4. 정적에 만족하지 않습니다. R로 가는 것이 여기에서 들어옵니다. R에 대한 모든 작업을 기록하고 이 기성품 코드를 수정에 사용할 수 있기 때문에 rattle은 R로 가는 이러한 종류를 단순화합니다. 일반적으로 다음 단계는 캐럿입니다.

이해했다.

 

흥미로운 플레이트, 가장 일반적으로 사용되는 MO 패키지

수업 이름 패키지 다운로드
surv.coxph Cox 비례 위험 모델 활착 153681
classif.naiveBayes 나이브 베이즈 e1071 102249
classif.svm 지원 벡터 머신(libsvm) e1071 102249
classif.lda 선형 판별 분석 대량의 55852
classif.qda 이차 판별 분석 대량의 55852
classif.randomForest 랜덤 포레스트 랜덤 포레스트 52094
classif.gausspr 가우스 프로세스 커널 랩 44812
classif.ksvm 서포트 벡터 머신 커널 랩 44812
classif.lssvm 최소 제곱 지원 벡터 머신 커널 랩 44812
cluster.kkmeans 커널 K 수단 커널 랩 44812
regr.rvm 관련성 벡터 머신 커널 랩 44812
classif.cvglmnet Lasso 또는 Elasticnet 정규화를 사용한 GLM(교차 검증된 Lambda) 글름넷 41179
classif.glmnet 올가미 또는 Elasticnet 정규화를 사용한 GLM 글름넷 41179
surv.cvglmnet 정규화가 포함된 GLM(교차 검증된 Lambda) 글름넷 41179
surv.glmnet 정규화가 포함된 GLM 글름넷 41179
classif.cforest 조건부 추론 트리 기반 랜덤 포레스트 파티 36492
classif.ctree 조건부 추론 트리 파티 36492
regr.cforest 조건부 추론 트리 기반 랜덤 포레스트 파티 36492
regr.mob 각 터미널 노드와 연결된 적합 모델이 있는 트리를 생성하는 모델 기반 재귀 분할 파티,모델도구 36492
surv.cforest 조건부 추론 트리 기반 랜덤 포레스트 파티, 서바이벌 36492
 
산산이치 포멘코 :

흥미로운 플레이트, 가장 일반적으로 사용되는 MO 패키지

수업 이름 패키지 다운로드
surv.coxph Cox 비례 위험 모델 활착 153681
classif.naiveBayes 나이브 베이즈 e1071 102249
classif.svm 지원 벡터 머신(libsvm) e1071 102249
classif.lda 선형 판별 분석 대량의 55852
classif.qda 이차 판별 분석 대량의 55852
classif.randomForest 랜덤 포레스트 랜덤 포레스트 52094
classif.gausspr 가우스 프로세스 커널 랩 44812
classif.ksvm 서포트 벡터 머신 커널 랩 44812
classif.lssvm 최소 제곱 지원 벡터 머신 커널 랩 44812
cluster.kkmeans 커널 K 수단 커널 랩 44812
regr.rvm 관련성 벡터 머신 커널 랩 44812
classif.cvglmnet Lasso 또는 Elasticnet 정규화를 사용한 GLM(교차 검증된 Lambda) 글름넷 41179
classif.glmnet 올가미 또는 Elasticnet 정규화를 사용한 GLM 글름넷 41179
surv.cvglmnet 정규화가 포함된 GLM(교차 검증된 Lambda) 글름넷 41179
surv.glmnet 정규화가 포함된 GLM 글름넷 41179
classif.cforest 조건부 추론 트리 기반 랜덤 포레스트 파티 36492
classif.ctree 조건부 추론 트리 파티 36492
regr.cforest 조건부 추론 트리 기반 랜덤 포레스트 파티 36492
regr.mob 각 터미널 노드와 연결된 적합 모델이 있는 트리를 생성하는 모델 기반 재귀 분할 파티,모델도구 36492
surv.cforest 조건부 추론 트리 기반 랜덤 포레스트 파티, 서바이벌 36492

목록에 하나 더 추가하는 것을 잊었습니다. 예, 고유한 소프트웨어가 있습니다. 드물다고 할 수 있습니다 :-)
 
유리 아사울렌코 :

모든 것이 예측되어야 하는 것 같습니다.) 이제 모델(MO 아님)에는 약 30개의 "지표"(예측자라고 부르는 것이 더 정확함) + 상호 처리 및 논리가 있습니다. 10개는 더 있어야 했다.

이러한 양에 수동으로 대처하고 공통 원인에 대한 각 예측 변수의 기여도를 이해하려면 더 이상 좋지 않습니다. 진짜. 따라서, 그건 그렇고, MO를 사용하는 아이디어. 모든 것이 아직 초기 단계에 있습니다.

산산이치 포멘코 :

3. 예측자. 대상 변수와 "관련"이 있음을 증명해야 합니다. 이것이 가장 어려운 부분입니다. 나는 시간의 최대 70%가 이 질문을 먹습니다. 나는 지점에서 이것에 대해 많이 썼습니다.

예, 적응해야 합니다. 그냥 잡히지 않는 것 같습니다.)

산산이치 포멘코 :

4. 정적에 만족하지 않습니다. R로 가는 것이 여기에서 들어옵니다. R에 대한 모든 작업을 기록하고 이 기성품 코드를 수정에 사용할 수 있기 때문에 rattle은 R로 가는 이러한 종류를 단순화합니다. 일반적으로 다음 단계는 캐럿입니다.

이해했다.

내 5센트를 투자하겠습니다. 사실, 출력 변수가 아니라 PRICE를 발생시키는 입력을 제공해야 합니다! 그러면 어떤 차량이든 잘 훈련될 것입니다. 목적 함수의 예:

가장 분명한 SIGNAL PROFIT, 더 나아가 어느 수준까지 후퇴할 것인지, 오늘 어느 수준에 도달할 것인지 등 내 기사를 읽고 게으르지 마십시오. 나는 이것을 언급합니다. 따라서 이러한 모든 목적 함수에 대해 동일한 입력을 제출하고 모든 모델의 작업은 매우 만족스럽습니다. 또한 같은 입구가 시장에서 어떻게 보이는지 직접 볼 수 있습니다. 여기 이익을 위해, 여기 롤백을 위해, 여기 수준을 위해. 그리고 항목이 가격의 이유이기 때문에 견딜 수 있게 작동합니다.

그 이유는 진입장벽의 변화가 가격의 변화로 이어지는 경우이고 그 반대의 경우는 그렇지 않기 때문입니다. TS 자체의 통계가 매우 나쁘기 때문에 여기서 매우 혼란스러울 수 있습니다. Zscore는 가격이 알려주는 값을 정확히 취하기 때문에 그 반대는 아닙니다. 예를 들어 델타는 가격 변동의 원인입니다. :-)

 
마이클 마르쿠카이테스 :

내 5센트를 투자하겠습니다. 사실, 출력 변수가 아니라 PRICE를 발생시키는 입력을 제공해야 합니다! 그러면 어떤 차량이든 잘 훈련될 것입니다. 목적 함수의 예:

가장 분명한 SIGNAL PROFIT, 더 나아가 어느 수준까지 후퇴할 것인지, 오늘 어느 수준에 도달할 것인지 등 내 기사를 읽고 게으르지 마십시오. 나는 이것을 언급합니다. 따라서 이러한 모든 목적 함수에 대해 동일한 입력을 제출하고 모든 모델의 작업은 매우 만족스럽습니다. 또한 같은 입구가 시장에서 어떻게 보이는지 직접 볼 수 있습니다. 여기 이익을 위해, 여기 롤백을 위해, 여기 수준을 위해. 그리고 항목이 가격의 이유이기 때문에 견딜 수 있게 작동합니다.

그 이유는 진입장벽의 변화가 가격의 변화로 이어지는 경우이고 그 반대의 경우는 그렇지 않기 때문입니다. TS 자체의 통계가 매우 나쁘기 때문에 여기서 매우 혼란스러울 수 있습니다. Zscore는 가격이 알려주는 값을 정확히 취하기 때문에 그 반대는 아닙니다. 예를 들어 델타는 가격 변동의 원인입니다. :-)

귀하의 기사, 링크가 이전 페이지가 아니라는 의미라면 읽으십시오. 아마도 뭔가를 놓쳤을 것입니다. 다시 읽겠습니다.

네, 물론 가격 움직임을 예측할 수 있는 예측 변수가 있습니다. 그러나 그들의 중첩 + 가격은 진입 신호를 제공합니다. 원래(훈련) 블랙박스의 응답을 예측합니다. 질문은 닭이 먼저냐 달걀이 먼저냐와 비슷하다. 차이점은 순전히 용어일 수 있습니다.

여기에서 이데올로기의 관점에서 볼 때 적어도 엄격한 논리가 있는 시스템에서는 가격을 예측하는 것이 더 정확하고 출력 변수는 이미 처리의 결과입니다.

 
유리 아사울렌코 :

귀하의 기사, 링크가 이전 페이지가 아니라는 의미라면 읽으십시오. 아마도 뭔가를 놓쳤을 것입니다. 다시 읽겠습니다.

네, 물론 가격 움직임을 예측할 수 있는 예측 변수가 있습니다. 그러나 그들의 중첩 + 가격은 진입 신호를 제공합니다. 원래(훈련) 블랙박스의 응답을 예측합니다. 질문은 닭이 먼저냐 달걀이 먼저냐와 비슷하다. 차이점은 순전히 용어일 수 있습니다.

여기에서 이데올로기의 관점에서 볼 때 적어도 엄격한 논리가 있는 시스템에서는 가격을 예측하는 것이 더 정확하고 출력 변수는 이미 처리의 결과입니다.


맞습니다. 하지만 가격이 변하는 데이터를 사용하여 가격을 예측해야 합니다. 매우 흥미로운 관찰이 있습니다. 입력이 가격의 이유라면 out-of-sample 작업의 결과는 훈련보다 약간 나쁠 것입니다. , 그렇지 않을 때. 그것은 모두 모델에 달려 있습니다. 그리고 가격에 의존하지 않는 입력 데이터를 제공하면 "Out of sample" 섹션의 작업이 동전 던지기인 CoinFlip으로 바뀝니다. NA가 언제 실수를 할지 모릅니다. 이 같은....
 
마이클 마르쿠카이테스 :

맞습니다. 하지만 가격이 변하는 데이터를 사용하여 가격을 예측해야 합니다. 매우 흥미로운 관찰이 있습니다. 입력이 가격의 이유라면 out-of-sample 작업의 결과는 훈련보다 약간 나쁠 것입니다. , 그렇지 않을 때. 그것은 모두 모델에 달려 있습니다. 그리고 가격에 따라 달라지는 입력 데이터를 제공하면 "Out of sample" 섹션의 작업이 동전 던지기인 CoinFlip으로 바뀝니다. NA가 언제 실수를 할지 모릅니다. 이 같은....

사실, 우리는 가격과 그 변화가 의존하는 데이터가 없습니다. 그리고 우리가 내부자가 아니라면 그럴 수 없습니다. 일반적으로 우리는 가격 행동 자체에서 미래에 대한 간접적(2차) 데이터를 찾고 있습니다. 저것들. 우리의 데이터는 가격과 과거와 현재의 행동에 정확히 의존합니다.

그리고 이 진술: 가격이 변하는 데이터를 사용하여 가격을 예측해야 합니다. 그에게 동의할 수 없습니다. 음, 입력에서 예측의 품질이 높을수록 결과가 더 좋다는 사실은 논쟁의 여지가 없습니다.

------------------------------

모스크바 지역으로의 마이그레이션 예측자를 준비하기 시작했습니다. R에서 이 모든 작업을 수행하고 싶었습니다. R은 모든 성능을 감안할 때 모델링 및 신호 처리에 완전히 부적합하다는 것이 밝혀졌습니다. 안타깝게도. 모든 것이 매우 불편합니다.

모든 준비 작업을 SciLab으로 이전해야 합니다. SciLab에서는 이 모든 작업이 훨씬 더 간단하고 편리하게 수행됩니다. SciLab - Pts의 환경과 인터페이스 및 이념. R에 가깝고 데이터 처리 및 수학적 모델링을 위해 설계되었습니다. 그러나 무선 공학에서 공기 역학에 이르기까지 모든 것이 있으며 R. Specificity에는 전혀 없는 많은 수학이 있습니다. SciLab의 Stat 방법과 데이터 마이닝은 꽤 잘 제시되어 있지만 이러한 의미에서 SciLab은 이러한 방법의 선택에서 R보다 훨씬 열등합니다. SciLab에서는 SanSanych 포리스트를 만들 수 없습니다.) 하지만 거기에 설치된 패키지도 먼지처럼 보이지만 가까운 것은 없는 것 같습니다.

일반적으로 서로 다른 문제를 해결하고 환경 간에 데이터를 전송하려면 서로 다른 개발 환경을 결합해야 합니다. 불쌍해. 나는 (R에서) 모든 것을 최선을 다하고 싶었지만 항상 그랬습니다.

사유: