트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 640

 
마이클 마르쿠카이테스 :


진심으로, 소란 부리지 마세요, 마이클. 책임감 있는 순간. 이 아이디어가 어떤 이유로든(비뚤어진 것이든, 열린 기회가 있기 전에 완전히 멍한 것이든) 효과가 없다면, 다음 아이디어는 곧 트레이더 커뮤니티에 내려올 것입니다. 절대적으로 확신합니다.

 
마이클 마르쿠카이테스 :

세븐을 잡아라!!!! 그리고 오늘은 R을 다운받아서 천천히 돌릴꺼니까 빨간연필로 달력에 이 날을 표시해두세요..

선생님, 소년의 피팅))) h2o.automl.

딸랑이는 평범하지만 모든 것이 기계에 있습니다 ...

 
마법사_ :
노파는 과수원에 서 있었다. 그의 앞에는 오렌지 나무가 있었다. 사방에서 무작위로 새가 날아갔습니다.
새들은 오렌지 나무에 착륙하지 않았고 그는 그 과일에 독이 있다고 생각했습니다. 그는 옆으로 물러나서 봐야 한다
오렌지 나무 뒤에 서 있는 사과 나무, 과일과 한 쌍, 또는 더 많은 새들이 혼란스럽게 날아다니는 곳
그는 반드시 앉을 것입니다 ... 그러나 그는 계속 한 곳에 서있었습니다 ... 배고프고 지치고 우울한 ...
 6년이 끝날 무렵, Hu Zhou는 사냥 기술의 본질을 꿰뚫어본 것처럼 보였습니다. 먹이가 아니라 개념 자체가 그에게 중요한 것이되었습니다 ... (c)
	          
[삭제]  

http://playground.tensorflow.org

NN 교육의 시각화, 엔터테인먼트 또는 교육 예제처럼 보입니다.

그녀는 나선형 분류에 명백한 문제가 있습니다. :)


Tensorflow — Neural Network Playground
Tensorflow — Neural Network Playground
  • Daniel Smilkov and Shan Carter
  • playground.tensorflow.org
It’s a technique for building a computer program that learns from data. It is based very loosely on how we think the human brain works. First, a collection of software “neurons” are created and connected together, allowing them to send messages to each other. Next, the network is asked to solve a problem, which it attempts to do over and over...
[삭제]  

그리고 그러한 아키텍처는 이미

이것은 Poincaré에서 직접 가져온 것입니다. 기능 공간이 연결되지 않은 경우 최소 2개의 레이어가 필요합니다. 이미 elibrarius에서 이에 대한 질문이 있었습니다.


 
막심 드미트리예프스키 :

그리고 그러한 아키텍처는 이미


Maxim, 하지만 기능 선택은 어떻습니까? 오 안돼 안돼 안돼
또한 네트워크가 진동하기 시작할 때 학습 속도를 느리게 합니다.

작년 여름에 이것으로 놀았습니다. 매우 시각적입니다.)
[삭제]  
알렉세이 테렌테프 :
Maxim, 하지만 기능 선택은 어떻습니까? 오 안돼 안돼 안돼
또한 네트워크가 진동하기 시작할 때 학습 속도를 느리게 합니다.

작년 여름에 이것으로 놀았습니다. 매우 시각적입니다.)

음, 예, 사인을 넣으면 1 레이어로 할 수 있습니다.

 

EMVC를 사용하면 내가 원했던 것이 작동하지 않았고 패키지는 설명을 대충 읽었을 때 보이는 대로 작동하지 않았습니다.

EMVC는 예측자와 대상(클래스만. 회귀는 불가능)이 있는 테이블을 사용하여 각 교육 예제가 실제로 지정된 클래스에 속하는지 여부의 확률을 계산합니다. 따라서 훈련 테이블에서 대부분의 다른 훈련 예제(이상치, 오류)와 모순되는 행을 찾아 훈련 중에 모델을 혼동하지 않도록 제거할 수 있습니다.

가장 높은 확률 추정치를 제공하는 예측 변수 집합을 찾는 것이 가능하다고 가정했지만 발견된 예측 변수 집합이 만족스럽지 못했습니다. 더 이상 실험하지 않겠습니다. 예측 변수를 선택 하는 더 좋은 방법이 있습니다. 패키지가 내부적으로 어떻게든 사용하더라도 교차 엔트로피 추정치를 볼 수는 없지만 사용자에게 이러한 응답을 반환하지 않습니다.

그러나 그것은 예측 변수가 아니라 훈련 예제를 선별하는 흥미로운 도구로 밝혀졌습니다.


 library (EMVC)
data(iris)


trainTable <- iris #таблица на которой в дальнейшем будет обучаться какая-то модель
PREDICTOR_COLUMNS_SEQ <- 1 : 4 #номера колонок с предикторами
TARGET_COLUMN_ID <- 5 #номер колонки с таргетом

EMVC_MIN_TRUST <- 0.9 #минимально допустимая вероятность принадлежности к классу посчитанная через emcv. От 0 до 1 .

emvcData <- t( as .matrix(trainTable[,PREDICTOR_COLUMNS_SEQ]))
emvcAnnotations <- as .numeric(trainTable[,TARGET_COLUMN_ID])
emvcAnnotationsUnique <- unique(emvcAnnotations)
emvcAnnotationsMatrix <- matrix( 0 , ncol=ncol(emvcData), nrow = length(emvcAnnotationsUnique))
for (i in 1 :length(emvcAnnotationsUnique)){
  emvcAnnotationsMatrix[i, emvcAnnotations == emvcAnnotationsUnique[i]] <- 1
}

set.seed( 0 )
emvcResult <- EMVC(data = emvcData,
                   annotations = emvcAnnotationsMatrix,
                   # bootstrap.iter = 20 ,
                   k.range = 2
                   # clust.method = "kmeans" ,
                   # kmeans.nstart = 1 ,
                   # kmeans.iter.max = 10 ,
                   # hclust.method = "average" ,
                   # hclust.cor.method = "spearman"
)

badSamples <- c()
for (i in 1 :ncol(emvcResult)){
   if (max(emvcResult[,i])<EMVC_MIN_TRUST){
    badSamples <- c(badSamples, i)
  }
}
cat( "Indexes of bad train samples:" , badSamples, "\n" ) #Это номера строк в обучающей табличке которые повышают кросс-энтропию данных. Они противоречат большинству других обучающих примеров, и возможно следует их удалить из обучающей таблички
trainTable <- trainTable[-badSamples,]

 
박사 상인 :

EMVC를 사용하면 내가 원했던 것이 작동하지 않았고 패키지는 설명을 대충 읽었을 때 보이는 대로 작동하지 않았습니다.

EMVC는 예측자와 대상(클래스만. 회귀는 불가능)이 있는 테이블을 사용하여 각 교육 예제가 실제로 지정된 클래스에 속하는지 여부의 확률을 계산합니다. 따라서 훈련 테이블에서 대부분의 다른 훈련 예제(이상치, 오류)와 모순되는 행을 찾아 훈련 중에 모델을 혼동하지 않도록 제거할 수 있습니다.

가장 높은 확률 추정치를 제공하는 예측 변수 집합을 찾는 것이 가능하다고 가정했지만 발견된 예측 변수 집합이 만족스럽지 못했습니다. 나는 이것을 더 이상 실험하지 않을 것입니다. 예측 변수를 선택하는 더 좋은 방법이 있습니다. 패키지가 내부적으로 어떻게든 사용하더라도 교차 엔트로피 추정치를 볼 수는 없지만 사용자에게 이러한 응답을 반환하지 않습니다.

그러나 그것은 예측 변수가 아니라 훈련 예제를 선별하는 흥미로운 도구로 밝혀졌습니다.


불쌍해.

기적은 일어나지 않는다는 것을 다시 한 번 확인하셨고, 모든 것은 차근차근 모아야 합니다.

 
박사 상인 :
따라서 훈련 테이블에서 대부분의 다른 훈련 예(이상치, 오류)와 모순되는 행을 찾고 훈련 중에 모델을 혼동하지 않도록 제거할 수 있습니다.

패턴을 찾기 어려운 외환 데이터에 필요합니까? 그러한 프로그램으로 예제의 절반을 제거할 수 있는 것 같습니다. 그리고 배출량은 더 간단한 방법으로 검색할 수 있습니다. 제거되지는 않지만 예를 들어 허용 가능한 최대값과 동일합니다.