트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 858

 
막심 드미트리예프스키 :

나는 다른 사람의 알고리즘을 사용하지 않습니다.

Kulibin의 정신이 확실히 좋은 것은 분명하지만 가장 흥미롭고 필요한 것은 이미 발명되었으며 전면에 있습니다. Yab은 전 세계에서 수십 년간의 연구 결과를 포기하지 않았습니다.

 
막심 드미트리예프스키 :

나는 또한 그것들을 가지고 있고, 벌어들이기는 하지만 항상 그런 것은 아니지만, 나는 항상 그것을 원합니다(또는 거의 항상). 그래야만 조언을 드릴 수 있습니다.

돼지 저금통에! 이해가 안되는 부분에 조언을 시작하실 때마다 삽입하겠습니다 :)

 
박사 상인 :

Kulibin의 정신이 확실히 좋은 것은 분명하지만 가장 흥미롭고 필요한 것은 이미 발명되었으며 전면에 있습니다. Yab은 전 세계에서 수십 년간의 연구 결과를 포기하지 않았습니다.

보고서? 당신은 당신의 공허한 진술로 나를 여기에서 끝내게 될 것입니다

 
박사 상인 :

돼지 저금통에! 이해가 안되는 부분에 조언을 하실때마다 삽입하겠습니다 :)

죽은 말에게 이해할 수 있는 것을 제시해 달라고 하는 것은 무의미하다는 것을 이미 깨달았습니다. 하차하고 반응하지 않는 것이 더 쉽습니다.

 
Vizard_ : 가자 ! wankers를위한 신선한 윤활제 ...


13x6400 매트릭스로 2분 작업 후(예제보다 10배 이상)
이것은 일어난다
오류: 3.2Gb 벡터를 배치할 수 없습니다.
그리고 그것은 12-13GB를 사용하려고 시도하지만 총 16GB가 있습니다.


 
R은 일반적으로 약간의 메모리를 차지합니다. 그는 이미 12-13을 가져갔고 3을 더 원하며 나중에 얼마나 더 필요할지는 알 수 없습니다.
 
박사 상인 :
R은 일반적으로 약간의 메모리를 차지합니다. 그는 이미 12-13을 가져갔고 3을 더 원하며 나중에 얼마나 더 필요할지는 알 수 없습니다.

행렬을 줄였습니다 - 13x500도 계산할 수 없었습니다... 분명히 패턴이 없는 시장 데이터는 그를 미치게 만듭니다)). 포도당으로 당뇨병을 결정하는 것은 당신이 할 일이 아닙니다.

시장 데이터가 있는 사람이 시도했습니까? 어떤 진전이 있습니까?

마지막으로 ... 13x100으로 관리했습니다. (물론 100줄에 대해 무언가를 걸러내는 것은 어리석은 일입니다.) 이전 패키지에 따르면 항목 번호 2가 가장 중요한 것으로 판명되었습니다. 분명히 이것은 추정치가 6400개가 아니라 100개 라인에 대한 것이라는 사실 때문입니다.

정렬된 변수( 중요도 감소):
2 5 10 12 6 4 7 8 9 1 11
점수 0.24 0.025 0.019 -0.048 -0.05 -0.055 -0.057 -0.05 -0.063 -0.067 -0.072

점수 N.A.

---

점수 매트릭스:
2 5 10 12 6 4 7 8 9 1 11
2 0.24
5 0.128 0.025
10 0.186 -0.002 0.019
12 0.015 -0.043 -0.051 -0.048
6 0.086 -0.053 -0.011 -0.068 -0.05
4 0.066 -0.029 -0.073 -0.054 -0.065 -0.055
7 0.134 -0.088 -0.101 -0.188 -0.121 -0.099 -0.057
8 0.12 -0.202 -0.069 -0.1 -0.068 -0.089 -0.061 -0.05
9 0.092 -0.004 -0.138 -0.097 -0.088 -0.069 -0.112 -0.088 -0.063
1 0.086 -0.06 -0.088 -0.107 -0.083 -0.084 -0.066 -0.081 -0.076 -0.067
11 0.095 -0.017 -0.183 -0.115 -0.083 -0.078 -0.066 -0.086 -0.066 -0.082 -0.072
3 0.059 -0.132 -0.102 -0.146 -0.114 -0.126 -0.109 -0.113 -0.131 -0.117 -0.135


 

여기요!


AI 뉴로 로봇이 준비되어 있습니까?


시도 해봐. )))



그 사이에 틱 봇을 만드는 방법을 배웠습니다 - 테스터에서와 같은 방식으로 작동합니다)))

 

그레타 소개


나는 그레타 에 놀랐다. 나는 tensorflowreticulate 패키지가 결국 R 개발자가 딥 러닝 애플리케이션을 넘어 TensorFlow 플랫폼을 활용하여 모든 방식의 프로덕션 등급 통계 애플리케이션을 만들 수 있게 해줄 것이라고 가정했습니다. 하지만 베이지안은 생각하지 않았습니다. 결국 Stan 은 베이지안 모델러가 원하는 모든 것일 것입니다. Stan은 매끄러운 R 인터페이스 , 심층 문서 및 전담 개발 팀을 갖춘 강력한 프로덕션 수준 확률 분포 모델링 엔진입니다.

그러나 greta를 사용하면 사용자가 R에서 직접 TensorFlow 기반 베이지안 모델을 작성할 수 있습니다 ! 무엇이 더 매력적일 수 있습니까? greta는 TensorFlow가 갈 수 있는 모든 곳에서 실행되는 고성능 MCMC 모델을 제공할 것을 약속하면서 중간 모델링 언어를 배우는 장벽을 제거합니다.

이 포스트에서 나는 Richard McElreath가 그의 우상파괴적 책: Statistical Rethinking: A Bayesian Course with Examples in R and Stan 의 섹션 8.3에서 사용한 간단한 모델로 greta를 소개할 것입니다. 이 모델은 해당 국가가 아프리카에 있는지 여부를 제어하면서 지형의 험준함 측정을 기반으로 한 국가의 GDP 로그를 설명하려고 합니다. greta를 사용한 MCMC 샘플링을 설명하기 위해 사용할 것입니다. 그러나 McElreath의 책에 있는 확장된 예는 상호 작용 모델링의 미묘함에 대한 명상이며 연구할 가치가 있습니다.

먼저 필요한 패키지를 로드하고 데이터를 가져옵니다. DiagrammeR은 모델의 TensorFlow 흐름도를 플로팅하는 데 사용되며, bayesplot은 Markov 체인의 궤적 다이어그램을 플로팅하는 데 사용됩니다. 234개에 대해 52개 변수를 제공하는 견고한 데이터 세트는 상당히 흥미롭지만 170개 카운티와 3개의 변수로 축소된 데이터 세트를 사용할 것입니다.


 library (rethinking)
library (greta)
library (DiagrammeR)
library (bayesplot)
library (ggplot2)

아래는 사용 코드입니다.


안녕하세요 자전거 발명가입니다!

 
마법사_ :

)))

첫 번째 검색의 경우 "peng" (빠르게) 또는 "esteves"를 사용하는 것이 좋습니다.
(더 안정적이지만 대규모 데이터 세트의 경우 훨씬 느림)
변수가 크면(>100) "정방향" 검색을 "n.var = 100"으로 제한합니다. 그만큼
진행률 표시줄은 남은 실행 시간에 대한 아이디어를 제공합니다.


라이브러리(varrank)

데이터(nassCDS, 패키지 = "DAAG")

nassCDS.varrank <- varrank(data.df = nassCDS,
방법 = "펜" ,
변수. 중요 = "죽은",
discretization.method = "sturges",
알고리즘 = "앞으로",
체계="중간",
장황하다 = 거짓)

요약(nassCDS.varrank)
플롯(nassCDS.varrank, noteex = 0.5)

이 특정 알고리즘은 예측 변수를 잘 선택합니까, 아니면 잘못 선택합니까?


일반적으로 예측 변수를 선택할 때 무엇이 좋고 무엇이 나쁜가?

예측 변수의 선택을 모든 모델의 성능과 연결하는 것은 표면에 있습니다.

저에게는 이것이 두 번째 단계입니다.

첫 번째 단계에서는 미래의 모델의 동작이 과거의 동작과 일치하지 않는 상황인 모델의 과적합 문제를 항상 해결해야 합니다. 이 주제에 대한 고려 사항이 없다면 이것은 모두 숫자 게임입니다.


우리가 당신의 게시물로 돌아간다면.

예측자의 PREDICTIVE POWER가 창의 이동 중에 거의 변경되지 않는다면 미래에 모델의 동작이 과거 데이터의 동작과 크게 다르지 않을 것이라고 믿습니다.

패키지가 계산하는 순위는 다음과 같습니다. 일부 예측 변수 집합에서 변경되나요? 다른 예측 변수 집합에 대해 결과가 다를 수 있다는 것은 분명하지만 (위에서 한 것처럼) 유사한 게시물이 여기에 게시된 경우 ...

사유: