Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 3339

 
СанСаныч Фоменко #:

Abandone o hábito de ler apenas as manchetes: um livro não é uma postagem no Twitter.

Eu li mais da metade do livro, portanto, posso julgar o conteúdo por mim mesmo; há seções que são 80% código.

Aqui está uma lista dos pacotes usados ao escrever o código no livro.

Em termos de conteúdo, o livro é uma apresentação sistemática dos problemas e soluções para o que é chamado de "aprendizado de máquina", o que é muito útil neste site, pois o "aprendizado de máquina" geralmente é entendido apenas como um modelo.

Sim, é um bom livro.

Já que você leu metade dele.

Você provavelmente poderia escrever uma linha de código.

O mais memorável para você?

P.Z.

Aconselho todos a estudarem o livro.

 
Maxim Dmitrievsky #:
aprendizado estatístico

kozul é autopromoção, um novo adesivo em uma calça velha.

Maxim Dmitrievsky #:
Onde está o resultado estatístico após a reamostragem e o cv? E a construção do classificador final. Pegue esse tópico e desenvolva-o. Essa é a base do kozul.

Tuls para a criação de modelos eficientes, comparando vários modelos com a reamostragem. O próximo tópico deve ser algo como inferência estatística e construção de modelos imparciais.

Precisamos de inferência estatística. Ela fornece alguns resultados em comparação com a mesma RL e outros métodos.

Pesquise no R: aprendizado estatístico, aprendizado supervisionado fraco, aprendizado de aumento funcional.

Kozul é uma propaganda injusta, um novo adesivo em uma calça velha.

Tuls para criar modelos eficazes, comparando vários modelos em relação à reamostragem. O próximo passo deve ser algo como inferência estatística e construção de modelos imparciais.

Esse é o padrão do aprendizado de máquina, e grande parte do livro trata exatamente dessas questões, que têm muitos anos e para as quais muitas ferramentas foram inventadas. A Parte 3 do livro chama-se: Tools for Creating Effective Models (Ferramentas para criação de modelos eficazes), com o seguinte conteúdo:

- 10 Reamostragem para avaliação de desempenho

- 11 Comparação de modelos com reamostragem

- 12 Ajuste de modelos e os perigos do overfitting

- 13 Pesquisa em grade

- 14 Pesquisa iterativa

- 15 Visualização de vários modelos

Além disso, há o capítulo 20"Ensembles of Models" (Conjuntos de modelos), que explica como criar o modelo final.

Precisamos de aprendizado estatístico.

Precisa? Por favor: CRAN Task View: Machine Learning & Statistical Learning

10 Resampling for Evaluating Performance | Tidy Modeling with R
10 Resampling for Evaluating Performance | Tidy Modeling with R
  • Max Kuhn and Julia Silge
  • www.tmwr.org
The tidymodels framework is a collection of R packages for modeling and machine learning using tidyverse principles. This book provides a thorough introduction to how to use tidymodels, and an outline of good methodology and statistical practice for phases of the modeling process.
 
Os conjuntos já estão mais próximos do kozul, pelo menos você pode igualar a tendência, com maior variação.

Mas você ainda terá muito ruído nas previsões (porque a variação é maior), o que você fará com ele? Ou seja, o TS, mesmo na linha de base, terá, digamos, apenas 60% de negociações lucrativas. E o mesmo ou menos no teste.

Sim, você começará a fazer staking para corrigir esse ruído... bem, experimente.
 
Maxim Dmitrievsky #:
Esta é uma dica para iniciantes, você precisa de um kozul e da capacidade de pensar

Aqui, vá para o escritório de estatística, não fique lotando a recepção.

Posso obter uma tese sobre como construir o modelo final, de acordo com este livro? Estou no meu celular, não posso olhar agora.

Um conjunto de modelos, em que as previsões de vários alunos individuais são agregadas para formar uma previsão, pode produzir um modelo final de alto desempenho. Os métodos mais populares para criar modelos de conjunto são bagging(Breiman 1996a), random forest(Ho 1995;Breiman 2001a) e boosting(Freund e Schapire 1997). Cada um desses métodos combina as previsões de várias versões do mesmo tipo de modelo (por exemplo, árvores de classificação). No entanto, um dos primeiros métodos de criação de conjuntos é oempilhamento demodelos(Wolpert 1992;Breiman 1996b).

O empilhamento de modelos combina as previsões de vários modelos de qualquer tipo. Por exemplo, uma regressão logística, uma árvore de classificação e uma máquina de vetor de suporte podem ser incluídas em um conjunto de empilhamento.

Este capítulo mostra como empilhar modelos preditivos usando o pacote stacks. Reutilizaremos os resultados do Capítulo15, em que vários modelos foram avaliados para prever a resistência à compressão de misturas de concreto.

O processo de criação de um conjunto empilhado é o seguinte

  1. Reunir o conjunto de treinamento das previsões de retenção (produzidas por meio de reamostragem).
  2. Criar um modelo para combinar essas previsões.
  3. Para cada membro do conjunto, ajuste o modelo no conjunto de treinamento original.


20.5 RESUMO DO CAPÍTULO

Este capítulo demonstrou como combinar diferentes modelos em um conjunto para obter melhor desempenho preditivo. O processo de criação do conjunto pode eliminar automaticamente os modelos candidatos para encontrar um pequeno subconjunto que melhore o desempenho. O pacote stacks tem uma interface fluente para combinar resultados de reamostragem e ajuste em um metamodelo.



Essa é a visão do autor sobre o problema, mas não é a única maneira de combinar vários modelos - há pacotes de pilhas no R para combinar modelos. Por exemplo, caretEnsemble: Ensembles of Caret Models

20 Ensembles of Models | Tidy Modeling with R
20 Ensembles of Models | Tidy Modeling with R
  • Max Kuhn and Julia Silge
  • www.tmwr.org
The tidymodels framework is a collection of R packages for modeling and machine learning using tidyverse principles. This book provides a thorough introduction to how to use tidymodels, and an outline of good methodology and statistical practice for phases of the modeling process.
 
Precisamos de um conjunto e de um empilhamento, ou seja, de um bousting sobre os classificadores. O conjunto remove a tendência e o empilhamento remove a variação. Em teoria, isso pode funcionar, mas na prática ainda não o fiz. E serão muitos modelos, o que é desagradável na produção.

Porque quando você chega à produção, fica preso a muitos modelos. E você quer um ou dois.

Além disso, isso não resolve o problema de que você nem sempre precisa estar no mercado. O modelo estará sempre sendo martelado. Devido a essas, digamos, nuances, todo o ciclo, do desenvolvimento à implementação, é interrompido.
O testador será lento para testar, tudo será lento, como um algodão.
 
Também parece haver uma confusão entre conjunto e empilhamento no livro. Em resumo, é uma abordagem normal, mas pode ser maluca na produção. E não requer uma montanha de pacotes.

Ah, ela também não resolve o problema de marcação mais importante.
 
Como o link recente para o artigo de Vladimir. Esse é um exemplo da criação mais maluca de TC. Quando você já trabalhou muito, fez muitas transformações e o resultado é um modelo que pode ser obtido por força bruta aleatória sem fazer nada. É interessante, mas improdutivo.
 
Maxim Dmitrievsky #:
tudo será lento, algodão.
Maxim Dmitrievsky #:
Também parece que o livro confunde conjunto e empilhamento. Em suma, essa é uma abordagem normal, mas pode ser um algodão na produção.
Maxim Dmitrievsky #:
Como você recentemente forneceu um link para o artigo de Vladimir. Um exemplo da criação mais maluca do TC.

Que tipo de algodão?

 
Forester #:

O que está acontecendo com o algodão?

Um sinônimo para lento
 

Sugiro que voltemos ao kozul, ao aprendizado estatístico e à IA confiável.

P.Z.

Descubra os detalhes mais sutis.

Razão: