Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 3167

 
mytarmailS #:

Você já viu esses números por conta própria?

0,99 treinamentos/teste, com o modelo truncado em algumas iterações. Restam apenas algumas regras que preveem bem as classes.

 
Maxim Dmitrievsky #:

0,99 de treinamento/teste, com o modelo truncado em algumas iterações. Restam apenas algumas regras que preveem bem as classes.

TP=10 e SL=1000 ?)

 
Forester #:

TP=10 e SL=1000 ?)

Não, é divertido se você quiser fazer muitas negociações.

abrir novas negociações em cada barra
 
Vladimir Perervenko #:

O que você quer dizer com caseiro? Há uma justificativa teórica, um bom artigo. Há um pacote chamado RLTv3.2.6. Ele funciona muito bem. Preste atenção à versão.


Boa sorte, obrigado

Na minha opinião, não é caseiro, se as seguintes condições, com um exemplo específico, forem atendidas.

Inicialmente, e agora muito menos, o site estava cheio de "gênios" que, sentados na cozinha, inventaram algo, usaram terminologia fora de suas cabeças e começaram a "pesquisar", e não apenas "pesquisar", mas refutar coisas existentes e geralmente reconhecidas.

Todas essas pessoas não percebem que seu código caseiro não vale um centavo, pois NÃO tem fundamentação teórica, que é publicada em periódicos sérios e depois discutida, muitas vezes por anos, por pessoas com o treinamento correspondente. Em seguida, o código é escrito e testado por um grande número de usuários e só depois disso ele se torna adequado para uso industrial.

Não faz sentido discutir os "gênios" locais.

Mas o Katbust.

Vamos comparar a documentação sobre o katbust e o XGBoost para entender a desonestidade de uma organização não essencial e o desenvolvimento profissional muito semelhante.

 
Maxim Dmitrievsky #:
E o principal homem autodidata e autodidata é Breiman, porque ele não escreveu em R. Ele é um kolkhoznik. Ele é um kolkhoznik.

Aprenda R para que você não pareça completamente ignorante: praticamente todos os pacotes em R NÃO são escritos em R. Normalmente é C++ ou Fortran, e R é apenas acesso. Geralmente são em C++ ou Fortran, e o R é apenas um acesso. É por isso que os algoritmos computacionalmente intensivos em R não funcionam pior do que em C++.

 
СанСаныч Фоменко #:

Aprenda R para que você não pareça completamente ignorante: quase todos os pacotes do R NÃO são escritos em R. Normalmente, é C++ ou Fortran e o R é apenas acesso. Geralmente são em C++ ou Fortran, e o R é apenas um acesso. É por isso que os algoritmos computacionalmente intensivos em R não funcionam pior do que em C++.

De jeito nenhum, é a primeira vez que ouço isso.

Haverá mais alguma informação esclarecedora? )

Eu já cheguei ao catbuster... )))

 
mytarmailS redução de dimensionalidade, o modelo se tornou mais repetível.

e o último toque, talvez decorativo


Gostaria de saber como o MO será treinado com esses dados?

Esta é uma amostra de teste.

Você já viu números como esse por conta própria?




É muito provável que ele seja retraído, pois está vinculado a valores absolutos de preço.

 

Escreveu uma função que rotula novamente os rótulos e os torna mais previsíveis para suas características, o modelo se torna mais estável.

Se você tiver um conjunto de dados pequeno, poderá abandoná-lo para verificação e certificar-se de seus dados (ou ficar frustrado).

Para o pessoal do python:

    c = coreset[coreset.columns[1:-4]] // ваш датасет без меток. Нужно брать только трейн/тест данные, на остальных не делать кластеризацию, иначе подгонка
    kmeans = KMeans(init='k-means++', n_clusters=clusters).fit(c) // кол-во кластеров - гиперпараметр
    coreset['clusters'] = kmeans.predict(c)
    mean_labels = coreset.groupby('clusters')['labels'].apply(lambda x: x.mean()) // считаем среднее по меткам каждого кластера
    coreset['labels'] = coreset.apply(lambda row: 0 if mean_labels[row['clusters']] < 0.5 else 1, axis=1) // если среднее больше 0.5, то для всех элементов кластера ставим метку 1 и наоборот
o modelo é mais estável se os agrupamentos forem representativos. Portanto, pelo método de força bruta, o número de clusters e por quais chips fazer o cluster.
 
Aleksey Nikolayev #:

Pelo que entendi, os comandos para trabalhar com o R em uma sessão interativa são comentados. Primeiro você carrega todo o script para definir as funções e, em seguida, os comandos linha por linha, pressionando enter após cada um. Isso provavelmente é algo parecido com um padrão em publicações científicas - confiar apenas na linha de comando e evitar ambientes como o Rstudio.

Por uma questão de brevidade, chamei o CTree de coleta de dados e modelos de classe, que também parecem ser inevitáveis.

A detecção de anomalias está incluída nos objetivos - ela está procurando onde os incêndios são anomalamente frequentes.


PS. Há algum tempo, escrevi para você sobre o uso da distribuição de Poisson, e aqui ela é desenvolvida para o código de trabalho.

Ainda não testei tudo - estou preso em uma de minhas tarefas.

Com certeza tentarei executá-lo em meus próprios dados. Estou acumulando diferentes soluções sobre esse tópico.

Com relação à distribuição de Pausson, ela é interessante na teoria, mas quando analiso os dados, a sequência, digamos que haja 20 zeros em uma linha e, em seguida, uma mistura de zeros e uns, e esses saltos são significativos, eles parecem ser inconsistentes com a distribuição.

 
Aleksey Vyazmikin #:

Com relação à distribuição de Pausson, ela é interessante na teoria, mas quando analiso os dados, a sequência, digamos, pode ter 20 zeros em uma linha e, em seguida, uma mistura de zeros e uns, e essas omissões são significativas, elas parecem ser inconsistentes com a distribuição.

A ideia é dividir os exemplos em grupos que sejam diferentes uns dos outros e dentro dos quais haja homogeneidade. Não é de todo certo que características específicas permitam fazer isso. Tampouco é fato que algum deles permita, por causa da não estacionariedade, por exemplo.

Não pretendo estudar esse artigo em detalhes, pois ele apenas aborda o tópico em que estou interessado. O CHAID está um pouco mais próximo, mas não é exatamente o mesmo.

Razão: