Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 2742

 
Aleksey Nikolayev #:

Acho que vi algumas dicas de um aplicativo de análise de sobrevivência.

Eu mesmo não fiz isso, mas uma vez fiz uma pergunta semelhante. Essa abordagem parece promissora para mim, mas é de uma esfera completamente diferente.

 
СанСаныч Фоменко #:

Ele diz classDist {caret}, ou seja, especifica uma função específica que faz parte do PACKAGE do caret

Pelo que entendi, você não conhece o R. Então, por que está perdendo seu tempo neste tópico e no MO em geral?

Sem o domínio do R, a discussão sobre MO não tem sentido.

Mantive silêncio sobre a entropia somente porque a entropia cruzada é uma função de perda padrão para modelos de classificação.... O MO é implementado não apenas no R! (conhecer uma biblioteca e não conhecer a natureza das entidades em que ela opera - você vai sem entender a direção do seu movimento).

Para você, uma pergunta ainda mais difícil - por que você se desassocia categoricamente da estatística quando fala em"teoria da informação"?... enquanto ela foi criada exatamente como uma

O campo está na interseção de matemática , estatística , ciência da computação , física , neurobiologia , engenharia da informação e engenharia elétrica.

De fato, a discussão não tem assunto, se você opera com trechos e seu ego (e até mesmo sobre alguém, não apenas sobre si mesmo), e não o assunto do diálogo... o tópico não muda, infelizmente (a especificidade e o assunto das respostas não são adicionados)
 
Maxim Dmitrievsky #:
Mais uma vez, esse porta-voz obtuso está chamando todos para a verdade, mas ainda não decidiu qual

Você já aborreceu tanto o moderador que ele está destruindo tudo.

Não leia a postagem provocativa do usuário JeeyCi (sua postagem é uma provocação e uma exigência para "continuar o banquete").
Ontem excluí várias postagens com palavrões e grosserias com ataques pessoais, guiado por isso - excluí as postagens
de JeeyCi .

Fiz duas advertências no tópico, elas foram ignoradas e, em seguida, excluí várias postagens com palavrões.
A única postagem literária (que estava legível) foi a sua postagem - esta (que deu início a tudo ontem):

Fórum sobre negociação, sistemas de negociação automatizados e teste de estratégias de negociação

...

Maxim Dmitrievsky, 2022.09.10 12:15

Há seleção de recursos baseada em modelo, agnóstica de modelo e mista. Se você considerar agnóstico, é a correlação e a informação mútua (baseada em entropia). A última difere da primeira em sua capacidade de capturar dependências não lineares; caso contrário, é a mesma coisa. Nesse caso, é difícil falar sobre qualquer relação do recurso com o alvo, até mesmo impossível. É apenas uma correlação. Mas é útil se livrar de recursos não informativos.

Você pode fazer isso em uma janela deslizante, ou em uma janela elusiva, ou em uma janela deslizante, ou em uma janela de fricção

Se você quiser determinar a causalidade especificamente, isso é inferência causal, incluindo o uso de MO, que não sei como aplicar a uma série temporal, pois não estudei o assunto.

E todos os métodos anteriores não funcionam para encontrar a causalidade, mas apenas para o treinamento ideal de algoritmos.

Portanto, mais uma vez os cidadãos não conseguem se concentrar e tirar as moscas de suas costeletas.

Já ouvimos muitas vezes sobre o grande e onipotente R. Obviamente, se você colocar um macaco atrás dele, ele também poderá se considerar um estatístico e analista, de tão bom que é.

Sim, ocasionalmente excluo palavrões, especialmente se eles durarem meio dia e duas páginas de texto, por exemplo (como ontem).

----------------

Esse tópico é muito popular (ele é lido até mesmo no fórum de língua inglesa e é considerado o principal tópico sobre esse assunto).
Portanto, por favor, menos palavrões.

 
mytarmailS #:

Se você analisar o TS de traders mais ou menos bem-sucedidos, verá que todos eles negociam níveis.

Não vi um único operador bem-sucedido que opere com a ajuda de indicadores.

Um nível é um ponto de entrada claro e compreensível com uma parada clara....

Se você puder negociar com baixo risco, não precisará de mais nada: baixo risco por negociação/entrada precisa é o mais importante!

Com a ajuda do MO, você pode procurar níveis de PD/SP, essas entradas exatas, não é trivial, não é simples, você não pode ler sobre isso em blogs sobre MO, aqui você precisa usar sua própria cabeça....

Você também pode desenhar níveis no gráfico sb e ele também é uma série temporal. Todos já estão fartos de você, não vamos mais responder a você. Você está falando besteira dia após dia.
 
mytarmailS #:

Aqui está um exemplo de uma amostra gerada aleatoriamente de 5 características e 1 alvo binário

seletor forrest e fiche

A fila de tarefas foi descarregada um pouco - tornou-se possível executar o script. Eu o executo e recebo um erro.

> install.packages("randomForest")
Warning in install.packages :
  unable to access index for repository https://cran.rstudio.com/src/contrib:
  cannot open URL 'https://cran.rstudio.com/src/contrib/PACKAGES'
Installing package into ‘C:/Users/S_V_A/Documents/R/win-library/4.0’
(as ‘lib’ is unspecified)
Warning in install.packages :
  unable to access index for repository https://cran.rstudio.com/src/contrib:
  cannot open URL 'https://cran.rstudio.com/src/contrib/PACKAGES'
Warning in install.packages :
  package ‘randomForest’ is not available (for R version 4.0.5)
Warning in install.packages :
  unable to access index for repository https://cran.rstudio.com/bin/windows/contrib/4.0:
  cannot open URL 'https://cran.rstudio.com/bin/windows/contrib/4.0/PACKAGES'

> library(randomForest)
Error in library(randomForest) : нет пакета под названием ‘randomForest’

Entendo corretamente que o programa deseja uma versão antiga do R 4.0?

Bem, procurei por uma versão antiga e não a encontrei. A terrível incompatibilidade é repulsiva, é claro.

 
Aleksey Vyazmikin #:

A fila de tarefas foi descarregada um pouco - tornou-se possível executar o script. Eu o executo e recebo um erro.

Estou entendendo corretamente que o programa quer a versão antiga R 4.0?

Eu tenho o R-3.6.3.

Estou escrevendo isso no antigo R-3.6.3 por motivos próprios, portanto, o problema é meu...

Não imaginei que o pacote seria removido do tap....

Aleksey Vyazmikin #:

Entendo corretamente que o programa quer a versão antiga do R 4.0?

corretamente

Aleksey Vyazmikin #:

Bem, em geral, procurei a versão antiga e não aencontrei. A terrível incompatibilidade é repulsiva, é claro.

Ouça, talvez você não possa entrar em uma negociação com um smikalka desses ???? ))

Com a compatibilidade, tudo fica bem; o python, por exemplo, só tem inveja dessa compatibilidade....


Veja também

https://stackoverflow.com/questions/62541885/package-randomforest-is-not-available-for-r-version-4-0-2

Experimente na versão atual

urlPackage <- "https://cran.r-project.org/src/contrib/Archive/randomForest/randomForest_4.6-12.tar.gz"
install.packages(urlPackage, repos=NULL, type="source") 

 
Para resumir a teoria de Sanych (já que ele mesmo não conseguiu formalizá-la adequadamente e dar exemplos):

*sua forma de seleção de recursos baseia-se na correlação, já que "relação" e "conexão" são definições de correlação.

*Dessa forma, fazemos um ajuste implícito ao histórico, semelhante em significado à LDA (análise discriminante linear) ou PCA, simplificamos o processo de aprendizado e reduzimos o erro.

*Não há sequer uma teoria de que o modelo treinado deva ter um desempenho melhor em novos dados (não envolvidos na estimativa das ligações entre recursos e alvos), porque os recursos foram ajustados à característica ou (pior) ao histórico disponível.

*A situação melhora um pouco com a média do QC em uma janela deslizante, pois é possível estimar a propagação e selecionar os mais estáveis. Pelo menos temos algumas estatísticas nas quais podemos nos basear.

*Eu estava pensando em causalidade ou em uma relação estatisticamente significativa, mas esse não é o caso em sua abordagem.
 
Maxim Dmitrievsky #:
Para resumir a teoria de Sanych (já que ele mesmo não conseguiu formalizá-la adequadamente e dar exemplos):

*sua forma de seleção de recursos baseia-se na correlação, já que "relação" e "relacionamento" são definições de correlação.

*Dessa forma, fazemos um ajuste implícito ao histórico, semelhante em significado à LDA (análise discriminante linear) ou PCA, simplificamos o processo de aprendizado e reduzimos o erro.

*Não há sequer uma teoria de que o modelo treinado deva ter um desempenho melhor em novos dados (não envolvidos na estimativa das relações entre característica e alvo) porque as características foram previamente ajustadas à característica ou (pior) a todo o histórico disponível.

*Por relação, eu quis dizer causalidade ou uma relação estatisticamente significativa, mas esse não é o caso em sua abordagem.

Com todo o respeito, mas isso não é um resumo (não é um resumo ou uma síntese). Está repleto de atitudes pessoais e ataques infundados.

você pensaria que alguém teria uma teoria válida em que "um modelo treinado deveria funcionar com novos dados" :-) e validado... sim.

 
Maxim Kuznetsov #:

com todo o respeito, mas isso não é um resumo (não é um resumo ou uma síntese). Trata-se de uma atitude pessoal e de ataques infundados.

Seria de se esperar que alguém tivesse uma teoria válida em que "um modelo treinado deveria funcionar com novos dados" :-) e validado... sim.

E se você ler com atenção, poderá ver a emboscada no ponto 2, ou seja, o ajuste inicial à história. É por isso que há uma queda no erro de aprendizado.

O ponto 4 é um pouco mais otimista se não for feito em todo o histórico disponível. Ele só deve ser feito para amostragem de linha de base, para garantir a qualidade do ajuste. Para obter uma estimativa adequada do modelo em novos dados.

Não sou conhecido por gostar de psicologia, então isso nunca aparece em lugar algum. E eu não conheço ninguém pessoalmente.
 
СанСаныч Фоменко #:

Não há potência suficiente para chegar ao nível de EA. Mas o resultado do erro de ajuste do modelo: de 8% a 22% é um erro de ajuste que difere pouco na seção de ajuste e fora da amostra.

Isso indica que o ajuste a todo o histórico foi feito antes do treinamento. Se esse não for o caso, corrija-me. Em que intervalo os recursos foram estimados/selecionados e em que intervalo foi feito o treinamento?

Tenho um método semelhante e posso compartilhar os resultados neste fim de semana. Somente se houver uma comunicação substantiva em vez de um jogo de palavras.
Razão: