트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 640

 
마이클 마르쿠카이테스 :


진심으로, 소란 부리지 마세요, 마이클. 책임감 있는 순간. 이 아이디어가 어떤 이유로든(비뚤어진 것이든, 열린 기회가 있기 전에 완전히 멍한 것이든) 효과가 없다면, 다음 아이디어는 곧 트레이더 커뮤니티에 내려올 것입니다. 절대적으로 확신합니다.

 
마이클 마르쿠카이테스 :

세븐을 잡아라!!!! 그리고 오늘은 R을 다운받아서 천천히 돌릴꺼니까 빨간연필로 달력에 이 날을 표시해두세요..

선생님, 소년의 피팅))) h2o.automl.

딸랑이는 평범하지만 모든 것이 기계에 있습니다 ...

 
마법사_ :
노파는 과수원에 서 있었다. 그의 앞에는 오렌지 나무가 있었다. 사방에서 무작위로 새가 날아갔습니다.
새들은 오렌지 나무에 착륙하지 않았고 그는 그 과일에 독이 있다고 생각했습니다. 그는 옆으로 물러나서 봐야 한다
오렌지 나무 뒤에 서 있는 사과 나무, 과일과 한 쌍, 또는 더 많은 새들이 혼란스럽게 날아다니는 곳
그는 반드시 앉을 것입니다 ... 그러나 그는 계속 한 곳에 서있었습니다 ... 배고프고 지치고 우울한 ...
 6년이 끝날 무렵, Hu Zhou는 사냥 기술의 본질을 꿰뚫어본 것처럼 보였습니다. 먹이가 아니라 개념 자체가 그에게 중요한 것이되었습니다 ... (c)
	          
 

http://playground.tensorflow.org

NN 교육의 시각화, 엔터테인먼트 또는 교육 예제처럼 보입니다.

그녀는 나선형 분류에 명백한 문제가 있습니다. :)


Tensorflow — Neural Network Playground
Tensorflow — Neural Network Playground
  • Daniel Smilkov and Shan Carter
  • playground.tensorflow.org
It’s a technique for building a computer program that learns from data. It is based very loosely on how we think the human brain works. First, a collection of software “neurons” are created and connected together, allowing them to send messages to each other. Next, the network is asked to solve a problem, which it attempts to do over and over...
 

그리고 그러한 아키텍처는 이미

이것은 Poincaré에서 직접 가져온 것입니다. 기능 공간이 연결되지 않은 경우 최소 2개의 레이어가 필요합니다. 이미 elibrarius에서 이에 대한 질문이 있었습니다.


 
막심 드미트리예프스키 :

그리고 그러한 아키텍처는 이미


Maxim, 하지만 기능 선택은 어떻습니까? 오 안돼 안돼 안돼
또한 네트워크가 진동하기 시작할 때 학습 속도를 느리게 합니다.

작년 여름에 이것으로 놀았습니다. 매우 시각적입니다.)
 
알렉세이 테렌테프 :
Maxim, 하지만 기능 선택은 어떻습니까? 오 안돼 안돼 안돼
또한 네트워크가 진동하기 시작할 때 학습 속도를 느리게 합니다.

작년 여름에 이것으로 놀았습니다. 매우 시각적입니다.)

음, 예, 사인을 넣으면 1 레이어로 할 수 있습니다.

 

EMVC를 사용하면 내가 원했던 것이 작동하지 않았고 패키지는 설명을 대충 읽었을 때 보이는 대로 작동하지 않았습니다.

EMVC는 예측자와 대상(클래스만. 회귀는 불가능)이 있는 테이블을 사용하여 각 교육 예제가 실제로 지정된 클래스에 속하는지 여부의 확률을 계산합니다. 따라서 훈련 테이블에서 대부분의 다른 훈련 예제(이상치, 오류)와 모순되는 행을 찾아 훈련 중에 모델을 혼동하지 않도록 제거할 수 있습니다.

가장 높은 확률 추정치를 제공하는 예측 변수 집합을 찾는 것이 가능하다고 가정했지만 발견된 예측 변수 집합이 만족스럽지 못했습니다. 더 이상 실험하지 않겠습니다. 예측 변수를 선택 하는 더 좋은 방법이 있습니다. 패키지가 내부적으로 어떻게든 사용하더라도 교차 엔트로피 추정치를 볼 수는 없지만 사용자에게 이러한 응답을 반환하지 않습니다.

그러나 그것은 예측 변수가 아니라 훈련 예제를 선별하는 흥미로운 도구로 밝혀졌습니다.


 library (EMVC)
data(iris)


trainTable <- iris #таблица на которой в дальнейшем будет обучаться какая-то модель
PREDICTOR_COLUMNS_SEQ <- 1 : 4 #номера колонок с предикторами
TARGET_COLUMN_ID <- 5 #номер колонки с таргетом

EMVC_MIN_TRUST <- 0.9 #минимально допустимая вероятность принадлежности к классу посчитанная через emcv. От 0 до 1 .

emvcData <- t( as .matrix(trainTable[,PREDICTOR_COLUMNS_SEQ]))
emvcAnnotations <- as .numeric(trainTable[,TARGET_COLUMN_ID])
emvcAnnotationsUnique <- unique(emvcAnnotations)
emvcAnnotationsMatrix <- matrix( 0 , ncol=ncol(emvcData), nrow = length(emvcAnnotationsUnique))
for (i in 1 :length(emvcAnnotationsUnique)){
  emvcAnnotationsMatrix[i, emvcAnnotations == emvcAnnotationsUnique[i]] <- 1
}

set.seed( 0 )
emvcResult <- EMVC(data = emvcData,
                   annotations = emvcAnnotationsMatrix,
                   # bootstrap.iter = 20 ,
                   k.range = 2
                   # clust.method = "kmeans" ,
                   # kmeans.nstart = 1 ,
                   # kmeans.iter.max = 10 ,
                   # hclust.method = "average" ,
                   # hclust.cor.method = "spearman"
)

badSamples <- c()
for (i in 1 :ncol(emvcResult)){
   if (max(emvcResult[,i])<EMVC_MIN_TRUST){
    badSamples <- c(badSamples, i)
  }
}
cat( "Indexes of bad train samples:" , badSamples, "\n" ) #Это номера строк в обучающей табличке которые повышают кросс-энтропию данных. Они противоречат большинству других обучающих примеров, и возможно следует их удалить из обучающей таблички
trainTable <- trainTable[-badSamples,]

 
박사 상인 :

EMVC를 사용하면 내가 원했던 것이 작동하지 않았고 패키지는 설명을 대충 읽었을 때 보이는 대로 작동하지 않았습니다.

EMVC는 예측자와 대상(클래스만. 회귀는 불가능)이 있는 테이블을 사용하여 각 교육 예제가 실제로 지정된 클래스에 속하는지 여부의 확률을 계산합니다. 따라서 훈련 테이블에서 대부분의 다른 훈련 예제(이상치, 오류)와 모순되는 행을 찾아 훈련 중에 모델을 혼동하지 않도록 제거할 수 있습니다.

가장 높은 확률 추정치를 제공하는 예측 변수 집합을 찾는 것이 가능하다고 가정했지만 발견된 예측 변수 집합이 만족스럽지 못했습니다. 나는 이것을 더 이상 실험하지 않을 것입니다. 예측 변수를 선택하는 더 좋은 방법이 있습니다. 패키지가 내부적으로 어떻게든 사용하더라도 교차 엔트로피 추정치를 볼 수는 없지만 사용자에게 이러한 응답을 반환하지 않습니다.

그러나 그것은 예측 변수가 아니라 훈련 예제를 선별하는 흥미로운 도구로 밝혀졌습니다.


불쌍해.

기적은 일어나지 않는다는 것을 다시 한 번 확인하셨고, 모든 것은 차근차근 모아야 합니다.

 
박사 상인 :
따라서 훈련 테이블에서 대부분의 다른 훈련 예(이상치, 오류)와 모순되는 행을 찾고 훈련 중에 모델을 혼동하지 않도록 제거할 수 있습니다.

패턴을 찾기 어려운 외환 데이터에 필요합니까? 그러한 프로그램으로 예제의 절반을 제거할 수 있는 것 같습니다. 그리고 배출량은 더 간단한 방법으로 검색할 수 있습니다. 제거되지는 않지만 예를 들어 허용 가능한 최대값과 동일합니다.

사유: